Agent专题综述
Agent 不是“会聊天的模型”,而是围绕目标持续执行的系统。本专题按目标、规划、工具、状态、记忆、停止条件和评测来读。
主题流程图
主题边界
- 只回答一次的问题优先用 Prompt;需要查资料但不执行动作的问题优先用 RAG;需要连续决策、调用工具、观察结果并收敛到交付物时才进入 Agent。
- Agent 设计必须同时写清楚能做什么、不能做什么、什么时候停、什么时候请人确认。
知识树
- 目标:用户任务、完成标准、非目标。
- 规划:ReAct、Plan-and-Execute、状态机、多 Agent 分工。
- 工具:工具说明、参数 schema、权限、错误模型。
- 记忆:任务状态、短期上下文、长期偏好、过期策略。
- 治理:日志、Trace、回放、评测、人工接管。
阅读顺序
- 先读 Agent 任务闭环,确认一个 Agent 的最小组成。
- 再读工具调用和记忆相关资料,区分模型推理与外部动作。
- 最后读行业案例,把每个案例拆成用户、数据、工具、指标、风险。
常见误区
- 把 Agent 等同于“LLM + 工具列表”,没有状态和停止条件。
- 让模型决定所有流程,忽略确定性代码、规则和权限。
- 没有日志和回放,线上失败后无法复盘。
- 高风险动作没有 dry-run、审批或人工确认。
实战任务
- 设计一个客服工单 Agent:列出输入、工具、禁止动作、人工确认点。
- 为一个多步任务写 Trace 字段:每一步的输入、输出、耗时、错误、成本。
- 写 20 条评测样例,覆盖正常、边界、诱导、工具失败。
必读资料
- 0-1基于dify搭建智能体(Agent)助手
- 0-1搭建一个决策执行Agent
- 1.2 AI Agents (智能体)
- AAIF资料
- AGENTS.md资料
- AGI 的定义与概念
- Agent Data Protocol资料
- Agent Memory入门
- Agent Memory实现
- Agent Memory搭建
- Agent Sandbox资料
- Agent Skill资料
- Agent vs 微服务 vs Serverless
- AutoGen资料
- LangGraph 多工具智能体
后置阅读
- 代码密集教程可以在概念闭环清楚后再读。
- 多 Agent 框架差异放在有实际项目时再比较。