mobile wallpaper 1mobile wallpaper 2mobile wallpaper 3mobile wallpaper 4
2300 字
6 分钟
从零开始学习 AI Agent:Hello Agents前六章学习与实践
2026-06-20

Hello Agents前六章学习与实践#

本文基于 Datawhale 社区的《Hello-Agents》教程,记录了从智能体基础概念到框架开发实践的完整学习路径。

📖 学习重点导览#

💡 阅读指南:标记 ⭐ 的为重点理论章节,建议精读;标记 🔥 的为实战必练章节,务必动手实现。

章节重要程度学习建议
第一章:初识智能体⭐⭐理解即可,掌握 Agent 循环和 TAO 范式
第二章:发展史了解即可,知道技术演进脉络
第三章:LLM 基础⭐⭐⭐核心重点,Transformer 和提示工程必须掌握
第四章:经典范式🔥🔥🔥实战重点,三种范式都要手写实现
第五章:低代码平台⭐⭐选修,了解 Coze/Dify 即可
第六章:框架开发🔥🔥进阶重点,至少用一个框架完成完整项目

前言#

2025年被称为”Agent元年”,AI Agent 正在从理论走向实践。作为一名开发者,我跟随 Datawhale 的《Hello-Agents》教程完成了前六章的学习,从最基础的智能体概念,到手写代码实现经典范式,再到使用框架开发复杂应用。本文将梳理这条学习路径的核心知识点,分享实践中的踩坑经验。


第一章:初识智能体——什么是 Agent?#

核心定义#

智能体(Agent)是通过传感器感知环境,自主决策,通过执行器行动的实体。

它由四个要素构成:环境、传感器、执行器、自主性。其中自主性是核心——Agent 不是被动执行指令的程序,而是能独立做出决策的实体。

智能体循环(Agent Loop)#

Agent 的工作方式是一个持续的循环:

感知 → 思考(规划 + 工具选择)→ 行动 → 观察 → 循环

Thought-Action-Observation 范式#

现代 LLM Agent 的核心交互模式:

Thought: 我需要查询北京的天气
Action: get_weather("北京")
Observation: 北京当前天气:晴,气温26摄氏度

这种模式让 Agent 能够”边想边做”,根据观察结果动态调整下一步行动。

实践:智能旅行助手#

我用 Python 实现了一个简单的旅行助手,它能:

  1. 接收用户请求
  2. 调用天气 API 查询天气
  3. 调用 Tavily 搜索推荐景点
  4. 整合信息输出答案

这个实践让我直观理解了 Agent 的”思考-行动-观察”循环。


第二章:智能体发展史——从符号主义到神经网络#

发展脉络#

符号主义 → 专家系统 → 心智社会 → 联结主义 → 强化学习 → LLM智能体
(1950s) (1970s) (1986) (1980s) (2010s) (2020s)

关键转折点#

符号主义时代(1950s-1980s):智能 = 符号操作 + 逻辑推理。代表作是专家系统 MYCIN,用 IF-THEN 规则诊断疾病。

心智社会理论(明斯基,1986):智能源于大量简单智能体的协作,复杂行为从简单交互中涌现。这个理论启发了后来的多智能体系统。

联结主义与强化学习:神经网络让机器能从数据中学习,强化学习让机器能从交互中学习。AlphaGo 是这一时期的里程碑。

预训练范式:GPT 等大模型通过海量数据预训练获得通用知识,再通过微调适配特定任务。

实践:ELIZA 聊天机器人#

我实现了一个基于规则的 ELIZA 聊天机器人,体验了符号主义方法的本质:

  • 通过正则表达式匹配关键词
  • 根据规则生成回复
  • 代词转换维持对话连贯

局限性:无语义理解、无上下文记忆、规则有限。这让我深刻理解了为什么需要神经网络。


第三章:大语言模型基础——Transformer 是灵魂#

语言模型演进#

N-gram → 神经网络LM → RNN/LSTM → Transformer → Decoder-Only (GPT)

Transformer 核心机制#

自注意力(Self-Attention):让模型在处理每个词时,能关注句子中所有其他词。

Attention(Q,K,V) = softmax(QK^T / √dk) × V

Q(查询)、K(键)、V(值)是三个可学习的角色,通过点积计算相关性。

Decoder-Only 架构:GPT 完全抛弃编码器,只保留解码器,通过”预测下一个词”的自回归方式工作。

提示工程#

技巧说明
零样本直接给指令
少样本给几个示例引导
思维链(CoT)“一步一步思考”提升推理能力
角色扮演赋予模型特定身份

分词(Tokenization)#

BPE 算法:高频词保留完整,罕见词拆分成子词。对开发者的意义:上下文窗口按 Token 计算,API 按 Token 计费。


第四章:智能体经典范式构建——三种核心范式#

这一章是实践的核心,我从零实现了三种经典范式。

1. ReAct(边想边做)#

核心循环:Thought → Action → Observation → 循环

# ReAct 提示词模板
REACT_PROMPT = """
Thought: 分析问题,规划下一步
Action: 工具名[输入] 或 Finish[最终答案]
"""

工具定义三要素:名称、描述、执行逻辑。其中描述最关键,LLM 靠它判断何时使用哪个工具。

实践:我用 Tavily 搜索实现了 ReAct Agent,能回答”华为最新手机是什么”这类实时问题。

2. Plan-and-Solve(先谋后动)#

两阶段:先生成完整计划,再逐步执行。

# 规划阶段:生成 Python 列表
["步骤1", "步骤2", "步骤3"]
# 执行阶段:逐步完成
for step in plan:
result = execute(step)

实践:用数学应用题验证,Agent 先分解计算步骤,再逐一求解,最终得出正确答案。

3. Reflection(自我迭代)#

核心循环:执行 → 反思 → 优化 → 循环

这种范式让 Agent 能审视自己的工作,发现不足并迭代优化。

三种范式对比#

范式特点适用场景
ReAct边想边做,动态调整需要外部信息
Plan-and-Solve先规划后执行结构化推理
Reflection自我反思优化需要高质量输出

第五章:低代码平台——让非技术人员也能搭建 Agent#

四大平台对比#

平台定位核心优势
Coze零代码 Agent 构建插件丰富、一键发布
Dify开源 LLM 应用平台企业级、RAG Pipeline
FastGPT知识库问答专精RAG 优化、可视化 Flow
n8n通用工作流自动化连接各类 SaaS 服务

实践:Coze 搭建”每日AI简报”助手#

在 Coze 平台上,我通过拖拽插件、配置 RSS 源、编写提示词,搭建了一个能自动抓取 AI 新闻的智能体。整个过程不需要写一行代码,体现了低代码平台的价值。


第六章:框架开发实践——站在巨人的肩膀上#

为什么要用框架?#

痛点框架解决方案
代码复用差通用基类和组件
模块耦合紧模型层/工具层/记忆层解耦
状态管理复杂内置状态管理机制
调试困难事件回调、可观测性

四大框架对比#

框架核心思想适用场景
AutoGen对话驱动协作流程化任务、软件开发
AgentScope消息驱动平台大规模、高可靠性系统
CAMEL角色扮演协作双智能体深度协作
LangGraph图结构工作流复杂循环、反思迭代

实践:AutoGen 软件开发团队#

我用 AutoGen 构建了一个模拟的软件开发团队:

  • ProductManager:需求分析
  • Engineer:代码实现
  • CodeReviewer:代码审查
  • UserProxy:测试验收

团队通过自动化的对话协作,完成了从需求到代码的全流程开发。

实践:LangGraph 三步问答助手#

用 LangGraph 实现了一个图结构的工作流:

  1. 理解:分析用户意图
  2. 搜索:搜索相关信息
  3. 回答:生成最终答案

通过条件边实现动态路由,展现了图结构的灵活性。


学习路径总结#

第一章:概念入门 → 第二章:历史脉络 → 第三章:理论基础
第四章:手写范式 → 第五章:低代码平台 → 第六章:框架开发
从"理解原理"到"动手实践"到"高效开发"

关键收获#

  1. Agent 的本质:感知-思考-行动-观察的循环
  2. LLM 是大脑:Transformer + 提示工程 + 工具调用
  3. 范式选择:ReAct 灵活、Plan-and-Solve 结构化、Reflection 自我优化
  4. 工具是手脚:让 Agent 能与外部世界交互
  5. 框架是杠杆:站在巨人肩膀上,专注业务逻辑

踩坑经验#

  1. 编码问题:Windows 终端的 GBK 编码与 emoji 冲突,需设置 PYTHONIOENCODING=utf-8
  2. 非 OpenAI 模型:AutoGen 需要传入 model_info 字典
  3. API Key 管理:用 .env 文件统一管理,不要硬编码在代码里
  4. 框架版本:AgentScope v2.0 接口大改,需注意文档版本

下一步计划#

接下来我将继续学习:

  • 第七章:构建自己的 Agent 框架
  • 第八章:记忆与检索
  • 第九章:上下文工程
  • 第十章:智能体通信协议(MCP、A2A)

参考资料#


本文完成于 2026年6月20日,记录了 AI Agent 学习之旅的前六章。

分享

如果这篇文章对你有帮助,欢迎分享给更多人!

从零开始学习 AI Agent:Hello Agents前六章学习与实践
https://blog.tuchayouji.cn/posts/ai-agent-learning/
作者
Tucha荼茶
发布于
2026-06-20
许可协议
CC BY-NC-SA 4.0

部分信息可能已经过时

目录