代理架构¶

许多 LLM 应用程序在 LLM 调用之前和/或之后实现特定的控制流步骤。例如，RAG 会检索与问题相关的文档，并将这些文档传递给 LLM，以便为模型的响应提供依据。

我们有时希望 LLM 系统能够选择自己的控制流来解决更复杂的问题，而不是硬编码固定的控制流！这就是代理的一个定义：代理是使用 LLM 来决定应用程序控制流的系统。 LLM 可以通过多种方式控制应用程序

LLM 可以在两个潜在路径之间进行路由
LLM 可以决定调用哪些工具
LLM 可以决定生成的答案是否足够，或者是否需要更多工作

因此，有许多不同类型的代理架构，它们赋予 LLM 不同程度的控制。

Agent Types

路由器¶

路由器允许 LLM 从指定的一组选项中选择单个步骤。这是一种控制级别相对有限的代理架构，因为 LLM 通常只管理一个决策并返回一组狭窄的输出。路由器通常采用几种不同的概念来实现这一点。

结构化输出¶

LLM 的结构化输出通过提供 LLM 应在其响应中遵循的特定格式或模式来工作。这与工具调用类似，但更通用。虽然工具调用通常涉及选择和使用预定义函数，但结构化输出可用于任何类型的格式化响应。实现结构化输出的常用方法包括

提示工程：指示 LLM 以特定格式响应。
输出解析器：使用后处理从 LLM 响应中提取结构化数据。
工具调用：利用某些 LLM 内置的工具调用功能生成结构化输出。

结构化输出对于路由至关重要，因为它们确保 LLM 的决策可以被系统可靠地解释和执行。在此操作指南中了解更多关于结构化输出的信息。

工具调用代理¶

虽然路由器允许 LLM 做出单一决策，但更复杂的代理架构通过两种关键方式扩展了 LLM 的控制

多步决策：LLM 可以控制一系列决策，而不仅仅是一个。
工具访问：LLM 可以选择和使用各种工具来完成任务。

ReAct 是一种流行的通用代理架构，它结合了这些扩展，整合了三个核心概念。

工具调用：允许 LLM 根据需要选择和使用各种工具。
记忆：使代理能够保留和使用来自先前步骤的信息。
规划：授权 LLM 创建和遵循多步计划以实现目标。

这种架构允许更复杂和灵活的代理行为，超越了简单的路由，能够跨多个步骤进行动态问题解决。您可以将其与 createReactAgent 一起使用。

工具调用¶

每当您希望代理与外部系统交互时，工具都非常有用。外部系统（例如，API）通常需要特定的输入模式或负载，而不是自然语言。例如，当我们将 API 绑定为工具时，我们让模型了解所需的输入模式。模型将根据用户的自然语言输入选择调用工具，并返回符合工具模式的输出。

许多 LLM 提供商都支持工具调用，并且 LangChain 中的工具调用接口很简单：您可以定义工具模式，并将其传递给 ChatModel.bindTools([tool])。

Tools

内存¶

记忆对于代理至关重要，使它们能够在解决问题的多个步骤中保留和利用信息。它在不同的尺度上运作

短期记忆：允许代理访问在序列早期步骤中获取的信息。
长期记忆：使代理能够回忆起以前交互中的信息，例如对话中的历史消息。

LangGraph 提供对内存实现的完全控制

状态：用户定义的模式，指定要保留的内存的确切结构。
检查点：在不同交互的每一步存储状态的机制。

这种灵活的方法允许您根据特定的代理架构需求定制内存系统。有关向图添加内存的实用指南，请参阅本教程。

有效的内存管理增强了代理保持上下文、从过去经验中学习并随着时间做出更明智决策的能力。

规划¶

在 ReAct 架构中，LLM 在一个 while 循环中被重复调用。在每一步，代理决定要调用哪些工具，以及这些工具的输入应该是什么。然后执行这些工具，并将输出作为观察结果反馈给 LLM。当代理决定不再值得调用任何工具时，while 循环终止。

ReAct 实现¶

本文与预构建的 createReactAgent 实现之间存在一些差异

首先，我们使用工具调用让 LLM 调用工具，而论文使用提示+解析原始输出。这是因为在论文撰写时工具调用还不存在，但它通常更好更可靠。
其次，我们使用消息来提示 LLM，而论文使用字符串格式。这是因为在撰写时，LLM 甚至没有公开基于消息的接口，而现在这是它们公开的唯一接口。
第三，论文要求工具的所有输入都是单个字符串。这主要是由于当时 LLM 的能力不是很强，只能生成单个输入。我们的实现允许使用需要多个输入的工具。
第四，论文当时只考虑调用单个工具，这主要受限于当时 LLM 的性能。我们的实现允许同时调用多个工具。
最后，论文要求 LLM 在决定调用哪些工具之前明确生成一个“思考（Thought）”步骤。这是“ReAct”中的“推理（Reasoning）”部分。我们的实现默认不这样做，主要是因为 LLM 已经变得更好，不再那么必要。当然，如果您希望提示它这样做，您当然可以。

自定义代理架构¶

虽然路由器和工具调用代理（如 ReAct）很常见，但自定义代理架构通常能为特定任务带来更好的性能。LangGraph 为构建定制代理系统提供了几个强大的功能

人机协作 (Human-in-the-loop)¶

人工干预可以显著提高代理的可靠性，特别是对于敏感任务。这可能涉及

批准特定操作
提供反馈以更新代理的状态
在复杂的决策过程中提供指导

当完全自动化不可行或不可取时，人机协作模式至关重要。在我们的人机协作指南中了解更多信息。

并行化¶

并行处理对于高效的多代理系统和复杂任务至关重要。LangGraph 通过其Send API 支持并行化，从而实现

多个状态的并发处理
Map-reduce 类操作的实现
独立子任务的有效处理

有关实际实现，请参阅我们的map-reduce 教程。

子图¶

子图对于管理复杂的代理架构至关重要，特别是在多代理系统中。它们允许

单个代理的独立状态管理
代理团队的分层组织
代理与主系统之间的受控通信

子图通过状态模式中的重叠键与父图通信。这使得灵活的模块化代理设计成为可能。有关实现细节，请参阅我们的子图操作指南。

反思¶

反射机制可以通过以下方式显著提高代理的可靠性

评估任务完成情况和正确性
提供反馈以进行迭代改进
实现自我纠正和学习

虽然通常基于 LLM，但反射也可以使用确定性方法。例如，在编码任务中，编译错误可以作为反馈。这种方法在这个使用 LangGraph 进行自我纠正代码生成的视频中得到了演示。

通过利用这些功能，LangGraph 能够创建复杂的、特定于任务的代理架构，这些架构可以处理复杂的工作流，有效地协作，并不断提高其性能。