Tucha荼茶

公告

欢迎来到Tucha的小屋！

了解更多

标签

Tucha荼茶

公告

欢迎来到Tucha的小屋！

了解更多

标签

Agent AI Astro Claude Code 最佳实践博客学习笔记开发工具记录

Tucha荼茶

公告

欢迎来到Tucha的小屋！

了解更多

标签

Agent AI Astro Claude Code 最佳实践博客学习笔记开发工具记录

2300 字

6 分钟

从零开始学习 AI Agent：Hello Agents前六章学习与实践

2026-06-20

技术

AI

/

Agent

/

学习笔记

Hello Agents前六章学习与实践#

本文基于 Datawhale 社区的《Hello-Agents》教程，记录了从智能体基础概念到框架开发实践的完整学习路径。

📖 学习重点导览#

💡 阅读指南：标记 ⭐ 的为重点理论章节，建议精读；标记 🔥 的为实战必练章节，务必动手实现。

章节	重要程度	学习建议
第一章：初识智能体	⭐⭐	理解即可，掌握 Agent 循环和 TAO 范式
第二章：发展史	⭐	了解即可，知道技术演进脉络
第三章：LLM 基础	⭐⭐⭐	核心重点，Transformer 和提示工程必须掌握
第四章：经典范式	🔥🔥🔥	实战重点，三种范式都要手写实现
第五章：低代码平台	⭐⭐	选修，了解 Coze/Dify 即可
第六章：框架开发	🔥🔥	进阶重点，至少用一个框架完成完整项目

前言#

2025年被称为”Agent元年”，AI Agent 正在从理论走向实践。作为一名开发者，我跟随 Datawhale 的《Hello-Agents》教程完成了前六章的学习，从最基础的智能体概念，到手写代码实现经典范式，再到使用框架开发复杂应用。本文将梳理这条学习路径的核心知识点，分享实践中的踩坑经验。

第一章：初识智能体——什么是 Agent？#

核心定义#

智能体（Agent）是通过传感器感知环境，自主决策，通过执行器行动的实体。

它由四个要素构成：环境、传感器、执行器、自主性。其中自主性是核心——Agent 不是被动执行指令的程序，而是能独立做出决策的实体。

智能体循环（Agent Loop）#

Agent 的工作方式是一个持续的循环：

1
感知 → 思考（规划 + 工具选择）→ 行动 → 观察 → 循环

Thought-Action-Observation 范式#

现代 LLM Agent 的核心交互模式：

1
Thought: 我需要查询北京的天气
2
Action: get_weather("北京")
3
Observation: 北京当前天气:晴，气温26摄氏度

这种模式让 Agent 能够”边想边做”，根据观察结果动态调整下一步行动。

实践：智能旅行助手#

我用 Python 实现了一个简单的旅行助手，它能：

接收用户请求
调用天气 API 查询天气
调用 Tavily 搜索推荐景点
整合信息输出答案

这个实践让我直观理解了 Agent 的”思考-行动-观察”循环。

第二章：智能体发展史——从符号主义到神经网络#

发展脉络#

1
符号主义 → 专家系统 → 心智社会 → 联结主义 → 强化学习 → LLM智能体
2
（1950s）  （1970s）   （1986）   （1980s）   （2010s）   （2020s）

关键转折点#

符号主义时代（1950s-1980s）：智能 = 符号操作 + 逻辑推理。代表作是专家系统 MYCIN，用 IF-THEN 规则诊断疾病。

心智社会理论（明斯基，1986）：智能源于大量简单智能体的协作，复杂行为从简单交互中涌现。这个理论启发了后来的多智能体系统。

联结主义与强化学习：神经网络让机器能从数据中学习，强化学习让机器能从交互中学习。AlphaGo 是这一时期的里程碑。

预训练范式：GPT 等大模型通过海量数据预训练获得通用知识，再通过微调适配特定任务。

实践：ELIZA 聊天机器人#

我实现了一个基于规则的 ELIZA 聊天机器人，体验了符号主义方法的本质：

通过正则表达式匹配关键词
根据规则生成回复
代词转换维持对话连贯

局限性：无语义理解、无上下文记忆、规则有限。这让我深刻理解了为什么需要神经网络。

第三章：大语言模型基础——Transformer 是灵魂#

语言模型演进#

1
N-gram → 神经网络LM → RNN/LSTM → Transformer → Decoder-Only (GPT)

Transformer 核心机制#

自注意力（Self-Attention）：让模型在处理每个词时，能关注句子中所有其他词。

1
Attention(Q,K,V) = softmax(QK^T / √dk) × V

Q（查询）、K（键）、V（值）是三个可学习的角色，通过点积计算相关性。

Decoder-Only 架构：GPT 完全抛弃编码器，只保留解码器，通过”预测下一个词”的自回归方式工作。

提示工程#

技巧	说明
零样本	直接给指令
少样本	给几个示例引导
思维链（CoT）	“一步一步思考”提升推理能力
角色扮演	赋予模型特定身份

分词（Tokenization）#

BPE 算法：高频词保留完整，罕见词拆分成子词。对开发者的意义：上下文窗口按 Token 计算，API 按 Token 计费。

第四章：智能体经典范式构建——三种核心范式#

这一章是实践的核心，我从零实现了三种经典范式。

1. ReAct（边想边做）#

核心循环：Thought → Action → Observation → 循环

1
# ReAct 提示词模板
2
REACT_PROMPT = """
3
Thought: 分析问题，规划下一步
4
Action: 工具名[输入] 或 Finish[最终答案]
5
"""

工具定义三要素：名称、描述、执行逻辑。其中描述最关键，LLM 靠它判断何时使用哪个工具。

实践：我用 Tavily 搜索实现了 ReAct Agent，能回答”华为最新手机是什么”这类实时问题。

2. Plan-and-Solve（先谋后动）#

两阶段：先生成完整计划，再逐步执行。

1
# 规划阶段：生成 Python 列表
2
["步骤1", "步骤2", "步骤3"]
3

4
# 执行阶段：逐步完成
5
for step in plan:
6
    result = execute(step)

实践：用数学应用题验证，Agent 先分解计算步骤，再逐一求解，最终得出正确答案。

3. Reflection（自我迭代）#

核心循环：执行 → 反思 → 优化 → 循环

这种范式让 Agent 能审视自己的工作，发现不足并迭代优化。

三种范式对比#

范式	特点	适用场景
ReAct	边想边做，动态调整	需要外部信息
Plan-and-Solve	先规划后执行	结构化推理
Reflection	自我反思优化	需要高质量输出

第五章：低代码平台——让非技术人员也能搭建 Agent#

四大平台对比#

平台	定位	核心优势
Coze	零代码 Agent 构建	插件丰富、一键发布
Dify	开源 LLM 应用平台	企业级、RAG Pipeline
FastGPT	知识库问答专精	RAG 优化、可视化 Flow
n8n	通用工作流自动化	连接各类 SaaS 服务

实践：Coze 搭建”每日AI简报”助手#

在 Coze 平台上，我通过拖拽插件、配置 RSS 源、编写提示词，搭建了一个能自动抓取 AI 新闻的智能体。整个过程不需要写一行代码，体现了低代码平台的价值。

第六章：框架开发实践——站在巨人的肩膀上#

为什么要用框架？#

痛点	框架解决方案
代码复用差	通用基类和组件
模块耦合紧	模型层/工具层/记忆层解耦
状态管理复杂	内置状态管理机制
调试困难	事件回调、可观测性

四大框架对比#

框架	核心思想	适用场景
AutoGen	对话驱动协作	流程化任务、软件开发
AgentScope	消息驱动平台	大规模、高可靠性系统
CAMEL	角色扮演协作	双智能体深度协作
LangGraph	图结构工作流	复杂循环、反思迭代

实践：AutoGen 软件开发团队#

我用 AutoGen 构建了一个模拟的软件开发团队：

ProductManager：需求分析
Engineer：代码实现
CodeReviewer：代码审查
UserProxy：测试验收

团队通过自动化的对话协作，完成了从需求到代码的全流程开发。

实践：LangGraph 三步问答助手#

用 LangGraph 实现了一个图结构的工作流：

理解：分析用户意图
搜索：搜索相关信息
回答：生成最终答案

通过条件边实现动态路由，展现了图结构的灵活性。

学习路径总结#

1
第一章：概念入门 → 第二章：历史脉络 → 第三章：理论基础
2
    ↓
3
第四章：手写范式 → 第五章：低代码平台 → 第六章：框架开发
4
    ↓
5
从"理解原理"到"动手实践"到"高效开发"

关键收获#

Agent 的本质：感知-思考-行动-观察的循环
LLM 是大脑：Transformer + 提示工程 + 工具调用
范式选择：ReAct 灵活、Plan-and-Solve 结构化、Reflection 自我优化
工具是手脚：让 Agent 能与外部世界交互
框架是杠杆：站在巨人肩膀上，专注业务逻辑

踩坑经验#

编码问题：Windows 终端的 GBK 编码与 emoji 冲突，需设置 PYTHONIOENCODING=utf-8
非 OpenAI 模型：AutoGen 需要传入 model_info 字典
API Key 管理：用 .env 文件统一管理，不要硬编码在代码里
框架版本：AgentScope v2.0 接口大改，需注意文档版本

下一步计划#

接下来我将继续学习：

第七章：构建自己的 Agent 框架
第八章：记忆与检索
第九章：上下文工程
第十章：智能体通信协议（MCP、A2A）

参考资料#

本文完成于 2026年6月20日，记录了 AI Agent 学习之旅的前六章。

如果这篇文章对你有帮助，欢迎分享给更多人！

从零开始学习 AI Agent：Hello Agents前六章学习与实践

https://blog.tuchayouji.cn/posts/ai-agent-learning/

作者

Tucha荼茶

发布于

2026-06-20

许可协议

CC BY-NC-SA 4.0

部分信息可能已经过时

初建博客：从零开始的二次元小屋

Claude Code 最佳实践 — 官方完整指南

Tucha的小屋

Hello Agents前六章学习与实践#

📖 学习重点导览#

前言#

第一章：初识智能体——什么是 Agent？#

核心定义#

智能体循环（Agent Loop）#

Thought-Action-Observation 范式#

实践：智能旅行助手#

第二章：智能体发展史——从符号主义到神经网络#

发展脉络#

关键转折点#

实践：ELIZA 聊天机器人#

第三章：大语言模型基础——Transformer 是灵魂#

语言模型演进#

Transformer 核心机制#

提示工程#

分词（Tokenization）#

第四章：智能体经典范式构建——三种核心范式#

1. ReAct（边想边做）#

2. Plan-and-Solve（先谋后动）#

3. Reflection（自我迭代）#

三种范式对比#

第五章：低代码平台——让非技术人员也能搭建 Agent#

四大平台对比#

实践：Coze 搭建”每日AI简报”助手#

第六章：框架开发实践——站在巨人的肩膀上#

为什么要用框架？#

四大框架对比#

实践：AutoGen 软件开发团队#

实践：LangGraph 三步问答助手#

学习路径总结#

关键收获#

踩坑经验#

下一步计划#

参考资料#

目录