Hello Agents前六章学习与实践
本文基于 Datawhale 社区的《Hello-Agents》教程,记录了从智能体基础概念到框架开发实践的完整学习路径。
📖 学习重点导览
💡 阅读指南:标记 ⭐ 的为重点理论章节,建议精读;标记 🔥 的为实战必练章节,务必动手实现。
| 章节 | 重要程度 | 学习建议 |
|---|---|---|
| 第一章:初识智能体 | ⭐⭐ | 理解即可,掌握 Agent 循环和 TAO 范式 |
| 第二章:发展史 | ⭐ | 了解即可,知道技术演进脉络 |
| 第三章:LLM 基础 | ⭐⭐⭐ | 核心重点,Transformer 和提示工程必须掌握 |
| 第四章:经典范式 | 🔥🔥🔥 | 实战重点,三种范式都要手写实现 |
| 第五章:低代码平台 | ⭐⭐ | 选修,了解 Coze/Dify 即可 |
| 第六章:框架开发 | 🔥🔥 | 进阶重点,至少用一个框架完成完整项目 |
前言
2025年被称为”Agent元年”,AI Agent 正在从理论走向实践。作为一名开发者,我跟随 Datawhale 的《Hello-Agents》教程完成了前六章的学习,从最基础的智能体概念,到手写代码实现经典范式,再到使用框架开发复杂应用。本文将梳理这条学习路径的核心知识点,分享实践中的踩坑经验。
第一章:初识智能体——什么是 Agent?
核心定义
智能体(Agent)是通过传感器感知环境,自主决策,通过执行器行动的实体。
它由四个要素构成:环境、传感器、执行器、自主性。其中自主性是核心——Agent 不是被动执行指令的程序,而是能独立做出决策的实体。
智能体循环(Agent Loop)
Agent 的工作方式是一个持续的循环:
感知 → 思考(规划 + 工具选择)→ 行动 → 观察 → 循环Thought-Action-Observation 范式
现代 LLM Agent 的核心交互模式:
Thought: 我需要查询北京的天气Action: get_weather("北京")Observation: 北京当前天气:晴,气温26摄氏度这种模式让 Agent 能够”边想边做”,根据观察结果动态调整下一步行动。
实践:智能旅行助手
我用 Python 实现了一个简单的旅行助手,它能:
- 接收用户请求
- 调用天气 API 查询天气
- 调用 Tavily 搜索推荐景点
- 整合信息输出答案
这个实践让我直观理解了 Agent 的”思考-行动-观察”循环。
第二章:智能体发展史——从符号主义到神经网络
发展脉络
符号主义 → 专家系统 → 心智社会 → 联结主义 → 强化学习 → LLM智能体(1950s) (1970s) (1986) (1980s) (2010s) (2020s)关键转折点
符号主义时代(1950s-1980s):智能 = 符号操作 + 逻辑推理。代表作是专家系统 MYCIN,用 IF-THEN 规则诊断疾病。
心智社会理论(明斯基,1986):智能源于大量简单智能体的协作,复杂行为从简单交互中涌现。这个理论启发了后来的多智能体系统。
联结主义与强化学习:神经网络让机器能从数据中学习,强化学习让机器能从交互中学习。AlphaGo 是这一时期的里程碑。
预训练范式:GPT 等大模型通过海量数据预训练获得通用知识,再通过微调适配特定任务。
实践:ELIZA 聊天机器人
我实现了一个基于规则的 ELIZA 聊天机器人,体验了符号主义方法的本质:
- 通过正则表达式匹配关键词
- 根据规则生成回复
- 代词转换维持对话连贯
局限性:无语义理解、无上下文记忆、规则有限。这让我深刻理解了为什么需要神经网络。
第三章:大语言模型基础——Transformer 是灵魂
语言模型演进
N-gram → 神经网络LM → RNN/LSTM → Transformer → Decoder-Only (GPT)Transformer 核心机制
自注意力(Self-Attention):让模型在处理每个词时,能关注句子中所有其他词。
Attention(Q,K,V) = softmax(QK^T / √dk) × VQ(查询)、K(键)、V(值)是三个可学习的角色,通过点积计算相关性。
Decoder-Only 架构:GPT 完全抛弃编码器,只保留解码器,通过”预测下一个词”的自回归方式工作。
提示工程
| 技巧 | 说明 |
|---|---|
| 零样本 | 直接给指令 |
| 少样本 | 给几个示例引导 |
| 思维链(CoT) | “一步一步思考”提升推理能力 |
| 角色扮演 | 赋予模型特定身份 |
分词(Tokenization)
BPE 算法:高频词保留完整,罕见词拆分成子词。对开发者的意义:上下文窗口按 Token 计算,API 按 Token 计费。
第四章:智能体经典范式构建——三种核心范式
这一章是实践的核心,我从零实现了三种经典范式。
1. ReAct(边想边做)
核心循环:Thought → Action → Observation → 循环
# ReAct 提示词模板REACT_PROMPT = """Thought: 分析问题,规划下一步Action: 工具名[输入] 或 Finish[最终答案]"""工具定义三要素:名称、描述、执行逻辑。其中描述最关键,LLM 靠它判断何时使用哪个工具。
实践:我用 Tavily 搜索实现了 ReAct Agent,能回答”华为最新手机是什么”这类实时问题。
2. Plan-and-Solve(先谋后动)
两阶段:先生成完整计划,再逐步执行。
# 规划阶段:生成 Python 列表["步骤1", "步骤2", "步骤3"]
# 执行阶段:逐步完成for step in plan: result = execute(step)实践:用数学应用题验证,Agent 先分解计算步骤,再逐一求解,最终得出正确答案。
3. Reflection(自我迭代)
核心循环:执行 → 反思 → 优化 → 循环
这种范式让 Agent 能审视自己的工作,发现不足并迭代优化。
三种范式对比
| 范式 | 特点 | 适用场景 |
|---|---|---|
| ReAct | 边想边做,动态调整 | 需要外部信息 |
| Plan-and-Solve | 先规划后执行 | 结构化推理 |
| Reflection | 自我反思优化 | 需要高质量输出 |
第五章:低代码平台——让非技术人员也能搭建 Agent
四大平台对比
| 平台 | 定位 | 核心优势 |
|---|---|---|
| Coze | 零代码 Agent 构建 | 插件丰富、一键发布 |
| Dify | 开源 LLM 应用平台 | 企业级、RAG Pipeline |
| FastGPT | 知识库问答专精 | RAG 优化、可视化 Flow |
| n8n | 通用工作流自动化 | 连接各类 SaaS 服务 |
实践:Coze 搭建”每日AI简报”助手
在 Coze 平台上,我通过拖拽插件、配置 RSS 源、编写提示词,搭建了一个能自动抓取 AI 新闻的智能体。整个过程不需要写一行代码,体现了低代码平台的价值。
第六章:框架开发实践——站在巨人的肩膀上
为什么要用框架?
| 痛点 | 框架解决方案 |
|---|---|
| 代码复用差 | 通用基类和组件 |
| 模块耦合紧 | 模型层/工具层/记忆层解耦 |
| 状态管理复杂 | 内置状态管理机制 |
| 调试困难 | 事件回调、可观测性 |
四大框架对比
| 框架 | 核心思想 | 适用场景 |
|---|---|---|
| AutoGen | 对话驱动协作 | 流程化任务、软件开发 |
| AgentScope | 消息驱动平台 | 大规模、高可靠性系统 |
| CAMEL | 角色扮演协作 | 双智能体深度协作 |
| LangGraph | 图结构工作流 | 复杂循环、反思迭代 |
实践:AutoGen 软件开发团队
我用 AutoGen 构建了一个模拟的软件开发团队:
- ProductManager:需求分析
- Engineer:代码实现
- CodeReviewer:代码审查
- UserProxy:测试验收
团队通过自动化的对话协作,完成了从需求到代码的全流程开发。
实践:LangGraph 三步问答助手
用 LangGraph 实现了一个图结构的工作流:
- 理解:分析用户意图
- 搜索:搜索相关信息
- 回答:生成最终答案
通过条件边实现动态路由,展现了图结构的灵活性。
学习路径总结
第一章:概念入门 → 第二章:历史脉络 → 第三章:理论基础 ↓第四章:手写范式 → 第五章:低代码平台 → 第六章:框架开发 ↓从"理解原理"到"动手实践"到"高效开发"关键收获
- Agent 的本质:感知-思考-行动-观察的循环
- LLM 是大脑:Transformer + 提示工程 + 工具调用
- 范式选择:ReAct 灵活、Plan-and-Solve 结构化、Reflection 自我优化
- 工具是手脚:让 Agent 能与外部世界交互
- 框架是杠杆:站在巨人肩膀上,专注业务逻辑
踩坑经验
- 编码问题:Windows 终端的 GBK 编码与 emoji 冲突,需设置
PYTHONIOENCODING=utf-8 - 非 OpenAI 模型:AutoGen 需要传入
model_info字典 - API Key 管理:用
.env文件统一管理,不要硬编码在代码里 - 框架版本:AgentScope v2.0 接口大改,需注意文档版本
下一步计划
接下来我将继续学习:
- 第七章:构建自己的 Agent 框架
- 第八章:记忆与检索
- 第九章:上下文工程
- 第十章:智能体通信协议(MCP、A2A)
参考资料
本文完成于 2026年6月20日,记录了 AI Agent 学习之旅的前六章。
如果这篇文章对你有帮助,欢迎分享给更多人!
部分信息可能已经过时






