Agent专题综述

Agent 不是“会聊天的模型”,而是围绕目标持续执行的系统。本专题按目标、规划、工具、状态、记忆、停止条件和评测来读。

主题流程图

主题边界

  • 只回答一次的问题优先用 Prompt;需要查资料但不执行动作的问题优先用 RAG;需要连续决策、调用工具、观察结果并收敛到交付物时才进入 Agent。
  • Agent 设计必须同时写清楚能做什么、不能做什么、什么时候停、什么时候请人确认。

知识树

  • 目标:用户任务、完成标准、非目标。
  • 规划:ReAct、Plan-and-Execute、状态机、多 Agent 分工。
  • 工具:工具说明、参数 schema、权限、错误模型。
  • 记忆:任务状态、短期上下文、长期偏好、过期策略。
  • 治理:日志、Trace、回放、评测、人工接管。

阅读顺序

  1. 先读 Agent 任务闭环,确认一个 Agent 的最小组成。
  2. 再读工具调用和记忆相关资料,区分模型推理与外部动作。
  3. 最后读行业案例,把每个案例拆成用户、数据、工具、指标、风险。

常见误区

  • 把 Agent 等同于“LLM + 工具列表”,没有状态和停止条件。
  • 让模型决定所有流程,忽略确定性代码、规则和权限。
  • 没有日志和回放,线上失败后无法复盘。
  • 高风险动作没有 dry-run、审批或人工确认。

实战任务

  1. 设计一个客服工单 Agent:列出输入、工具、禁止动作、人工确认点。
  2. 为一个多步任务写 Trace 字段:每一步的输入、输出、耗时、错误、成本。
  3. 写 20 条评测样例,覆盖正常、边界、诱导、工具失败。

必读资料

后置阅读

  • 代码密集教程可以在概念闭环清楚后再读。
  • 多 Agent 框架差异放在有实际项目时再比较。