Agent专题综述

Agent 不是“会聊天的模型”，而是围绕目标持续执行的系统。本专题按目标、规划、工具、状态、记忆、停止条件和评测来读。

主题流程图

查看流程图

主题边界

只回答一次的问题优先用 Prompt；需要查资料但不执行动作的问题优先用 RAG；需要连续决策、调用工具、观察结果并收敛到交付物时才进入 Agent。
Agent 设计必须同时写清楚能做什么、不能做什么、什么时候停、什么时候请人确认。

知识树

目标：用户任务、完成标准、非目标。
规划：ReAct、Plan-and-Execute、状态机、多 Agent 分工。
工具：工具说明、参数 schema、权限、错误模型。
记忆：任务状态、短期上下文、长期偏好、过期策略。
治理：日志、Trace、回放、评测、人工接管。

阅读顺序

先读 Agent 任务闭环，确认一个 Agent 的最小组成。
再读工具调用和记忆相关资料，区分模型推理与外部动作。
最后读行业案例，把每个案例拆成用户、数据、工具、指标、风险。

常见误区

把 Agent 等同于“LLM + 工具列表”，没有状态和停止条件。
让模型决定所有流程，忽略确定性代码、规则和权限。
没有日志和回放，线上失败后无法复盘。
高风险动作没有 dry-run、审批或人工确认。

实战任务

设计一个客服工单 Agent：列出输入、工具、禁止动作、人工确认点。
为一个多步任务写 Trace 字段：每一步的输入、输出、耗时、错误、成本。
写 20 条评测样例，覆盖正常、边界、诱导、工具失败。

必读资料

后置阅读

代码密集教程可以在概念闭环清楚后再读。
多 Agent 框架差异放在有实际项目时再比较。