【LLM】Agentic Workflow的四种常见思路

Reflection 和 Tool Use 属于比较经典且相对已经广泛使用的方式，Planning 和Multi-agent属于比较新颖比较有前景的方式。

[图示已省略]

Reflection

基于reflection的，纯粹的对结果反思，无外部交互。

推荐阅读：

[多项附件或图示已省略]

SELF-REFINE

基本思路

对于输入，SELF-REFINE让LLM生成一个初始输出。

流程示意如下图：

[图示已省略]

SELF-REFINE算法示意如下图

[图示已省略]

反馈会包含输出的不同方面。

[图示已省略]

Reflexion

下图是Reflexion agent通过试错和自我反思(self-reflection)解决决策、编程、推理任务的示例。

[图示已省略]

基本思路

Reflexion的框架和算法示意如下图所示。

[图示已省略]

Reflection的算法流程如上图右侧所示。

Tool use

与工具交互，并对交互结果进行推理。

推荐阅读：

[多项附件或图示已省略]

CoA

先训练LLM生成带占位符(placeholders)的抽象推理链。

微调数据构建如下图所示。

[图示已省略]

MM-React

MM-REACT 提供一系列视觉处理工具让ChatGPT来选择和使用。

[图示已省略]

Planning

有规划模块，能完成任务拆解，任务规划，反思迭代。

推荐阅读：

[多项附件或图示已省略]

现有的基于LLM的agent的规划(planning)能力分为五个方向：

task decomposition multi-plan selection external module-aided planning reflection and refinement memory-augmented planning

[图示已省略]

任务分解(Task Decomposition)：

$$(g_0,g_1,\cdots,g_n)=\mathrm{plan}(E,g;\Theta,\mathcal{P})$$

$$p^i=(a_0^i,a_1^i,\cdots,a_m^i)=\mathrm{sub-plan}(E,g_i;\Theta,\mathcal{P})$$

多计划选择(Multi-plan Selection):

$$P=(p_1,p_2,\cdots,p_n)=\mathrm{plan}(E,g;\Theta,\mathcal{P})$$

$$p^*=\operatorname{select}(E,g,P;\Theta,\mathcal{F})$$

外部规划器辅助规划(External Planner-Aided Planning)：

$$h=\mathrm{formalize}(E,g;\Theta,\mathcal{P})$$

$$p=\mathrm{plan}(E,g,h;\Theta)$$

反思和改进(Reflection and Refinement)：

$$p_0=\mathrm{plan}(E,g;\Theta,\mathcal{P})$$

$$r_i=\mathrm{reflect}(E,g,p_i;\Theta,\mathcal{P})$$

$$p_{i+1}=\mathrm{refine}(E,g,p_i,r_i;\Theta,\mathcal{P})$$

记忆增强规划(Memory-augmented Planning)：

$$m=\mathrm{retrieve}(E,g;(M))$$

$$p=\mathrm{plan}(E,g,m;\Theta,\mathcal{P})$$

任务分解

任务分解的主要思路是“分而治之”，通常涉及到两个关键步骤：

分解复杂任务，即“decompose”步骤。
对子任务进行规划，即“sub-plan"步骤。

目前任务分解主要分为两类：

如下图：

[图示已省略]

Multi-agent collaboration

多Agent系统，像 crewAI或 AutoGen这样的框架。

推荐阅读：

[多项附件或图示已省略]

ChatDev

如下图所示，构建一个虚拟的基于聊天的软件开发公司ChatDev。

[图示已省略]

ChatDev遵循瀑布模型(waterfall model)，将软件开发过程划分为四个阶段：

设计(designing)，编码(coding)，测试(testing)，写文档(documenting)；

每一个阶段分为多个原子聊天(atomic chat)。

[图示已省略]

接下来是四个阶段的实现细节。

1.设计阶段

在设计阶段，ChatDev会从人类客户那收到需求。

这个阶段包括三个预定义角色：

**设计阶段分为两个原子对话任务：**目标软件的模态决策、编程语言的选择。

[图示已省略]

2.编码阶段

编码阶段涉及三个角色：CTO、程序员、设计师；

CTO用markdown格式指导程序员实现软件系统，程序员基于markdown指令来生成代码。

[图示已省略]

3.测试阶段

测试阶段涉及到三个角色

代码评审检查源码识别潜在的问题；系统测试验证软件的执行过程。

4.文档编写

文档编写阶段涉及四个角色：CEO、CPO、CTO、程序员。

AutoGen

conversable agents

在AutoGen中，一个可对话的agent（conversable agent）是有特定角色的实体。

它可以传递消息，与其他可对话agent发送和接收消息。

[图示已省略]

Agent定制和合作(Agent customization and cooperation)：

一个由 LLM 支持的助理agent和一个由工具和人类支持的用户代理agent一起部署以处理一项任务。

然后，用户代理agent征求人类输入或执行助理的代码并将结果作为反馈传回助理。

[图示已省略]