跳到内容

图 API 概念

LangGraph 的核心是将代理工作流建模为图。您可以使用三个关键组件来定义代理的行为:

  1. State:一个共享数据结构,表示应用程序的当前快照。它可以是任何 Python 类型,但通常是 TypedDict 或 Pydantic BaseModel

  2. Nodes:编码代理逻辑的 Python 函数。它们接收当前的 State 作为输入,执行一些计算或副作用,并返回一个更新的 State

  3. Edges:Python 函数,根据当前的 State 决定接下来执行哪个 Node。它们可以是条件分支或固定转换。

通过组合 NodesEdges,您可以创建复杂、循环的工作流,使 State 随时间演进。然而,真正的力量来自于 LangGraph 如何管理 State。需要强调的是:NodesEdges 不过是 Python 函数——它们可以包含一个 LLM,也可以只是普通的 Python 代码。

简而言之:节点完成工作,边指示下一步该做什么

LangGraph 的底层图算法使用消息传递来定义通用程序。当一个节点完成其操作时,它会沿着一条或多条边向其他节点发送消息。这些接收节点随后执行其函数,将结果消息传递给下一组节点,然后该过程继续。受 Google 的 Pregel 系统启发,程序以离散的“超步”进行。

超步可以被认为是图节点的一次迭代。并行运行的节点属于同一个超步,而顺序运行的节点属于不同的超步。在图执行开始时,所有节点都处于 inactive 状态。当节点在其任何传入边(或“通道”)上接收到新消息(状态)时,它就会变为 active。活跃节点随后运行其函数并返回更新。在每个超步结束时,没有传入消息的节点通过将自身标记为 inactive 来投票 halt(停止)。当所有节点都处于 inactive 状态且没有消息传输时,图执行终止。

StateGraph

StateGraph 类是主要的图类。它通过用户定义的 State 对象进行参数化。

编译图

要构建图,您首先定义状态,然后添加节点,最后编译它。究竟什么是编译图,为什么需要它?

编译是一个相当简单的步骤。它对图的结构进行一些基本检查(例如,没有孤立节点)。它也是您可以指定运行时参数的地方,例如检查点和断点。您只需调用 .compile 方法即可编译图。

graph = graph_builder.compile(...)

必须先编译图才能使用它。

状态

定义图时,您要做的第一件事是定义图的 StateState 包含图的模式以及指定如何应用状态更新的reducer 函数State 的模式将是图中所有 NodesEdges 的输入模式,可以是 TypedDictPydantic 模型。所有 Nodes 都将发出对 State 的更新,然后使用指定的 reducer 函数应用这些更新。

模式

指定图模式的主要文档化方法是使用 TypedDict。然而,我们也支持使用 Pydantic BaseModel 作为图状态,以添加默认值和额外的数据验证。

默认情况下,图将具有相同的输入和输出模式。如果您想更改此设置,您还可以直接指定显式的输入和输出模式。当您有许多键,并且有些键专门用于输入而另一些用于输出时,这会很有用。有关如何使用的信息,请参阅此处指南

多个模式

通常,所有图节点都使用单个模式进行通信。这意味着它们将读写相同的状态通道。但是,在某些情况下,我们希望对此有更多控制:

  • 内部节点可以传递图中输入/输出不需要的信息。
  • 我们可能还希望为图使用不同的输入/输出模式。例如,输出可能只包含一个相关的输出键。

节点可以在图内部写入私有状态通道以进行内部节点通信。我们可以简单地定义一个私有模式 PrivateState。有关更多详细信息,请参阅本指南

还可以为图定义显式输入和输出模式。在这些情况下,我们定义一个包含与图操作相关的所有键的“内部”模式。但是,我们也定义 inputoutput 模式,它们是“内部”模式的子集,用于约束图的输入和输出。有关更多详细信息,请参阅本指南

让我们看一个例子

class InputState(TypedDict):
    user_input: str

class OutputState(TypedDict):
    graph_output: str

class OverallState(TypedDict):
    foo: str
    user_input: str
    graph_output: str

class PrivateState(TypedDict):
    bar: str

def node_1(state: InputState) -> OverallState:
    # Write to OverallState
    return {"foo": state["user_input"] + " name"}

def node_2(state: OverallState) -> PrivateState:
    # Read from OverallState, write to PrivateState
    return {"bar": state["foo"] + " is"}

def node_3(state: PrivateState) -> OutputState:
    # Read from PrivateState, write to OutputState
    return {"graph_output": state["bar"] + " Lance"}

builder = StateGraph(OverallState,input=InputState,output=OutputState)
builder.add_node("node_1", node_1)
builder.add_node("node_2", node_2)
builder.add_node("node_3", node_3)
builder.add_edge(START, "node_1")
builder.add_edge("node_1", "node_2")
builder.add_edge("node_2", "node_3")
builder.add_edge("node_3", END)

graph = builder.compile()
graph.invoke({"user_input":"My"})
{'graph_output': 'My name is Lance'}

这里有两点微妙而重要的注意事项:

  1. 我们将 state: InputState 作为输入模式传递给 node_1。但是,我们写入 OverallState 中的通道 foo。我们如何写入一个不包含在输入模式中的状态通道?这是因为节点可以写入图状态中的任何状态通道。图状态是初始化时定义的所有状态通道的并集,其中包括 OverallState 以及筛选器 InputStateOutputState

  2. 我们使用 StateGraph(OverallState,input=InputState,output=OutputState) 初始化图。那么,我们如何在 node_2 中写入 PrivateState 呢?如果未在 StateGraph 初始化中传递此模式,图如何访问它?我们可以这样做,因为节点也可以声明额外的状态通道,只要状态模式定义存在即可。在这种情况下,PrivateState 模式已定义,因此我们可以在图中添加 bar 作为新的状态通道并写入其中。

归约器

归约器是理解节点更新如何应用于 State 的关键。State 中的每个键都有自己独立的归约函数。如果没有明确指定归约函数,则假定对该键的所有更新都应覆盖它。有几种不同类型的归约器,从默认类型的归约器开始:

默认归约器

以下两个示例展示了如何使用默认归约器:

示例 A

from typing_extensions import TypedDict

class State(TypedDict):
    foo: int
    bar: list[str]

在此示例中,未为任何键指定归约函数。假设图的输入是 {"foo": 1, "bar": ["hi"]}。然后假设第一个 Node 返回 {"foo": 2}。这被视为对状态的更新。请注意,Node 不需要返回整个 State 模式——只需返回一个更新。应用此更新后,State 将变为 {"foo": 2, "bar": ["hi"]}。如果第二个节点返回 {"bar": ["bye"]},则 State 将变为 {"foo": 2, "bar": ["bye"]}

示例 B

from typing import Annotated
from typing_extensions import TypedDict
from operator import add

class State(TypedDict):
    foo: int
    bar: Annotated[list[str], add]

在此示例中,我们使用 Annotated 类型为第二个键 (bar) 指定了一个归约函数 (operator.add)。请注意,第一个键保持不变。假设图的输入是 {"foo": 1, "bar": ["hi"]}。然后假设第一个 Node 返回 {"foo": 2}。这被视为对状态的更新。请注意,Node 不需要返回整个 State 模式——只需返回一个更新。应用此更新后,State 将变为 {"foo": 2, "bar": ["hi"]}。如果第二个节点返回 {"bar": ["bye"]},则 State 将变为 {"foo": 2, "bar": ["hi", "bye"]}。请注意,这里的 bar 键是通过将两个列表相加来更新的。

在图状态中使用消息

为什么要使用消息?

大多数现代 LLM 提供商都有一个聊天模型接口,它接受消息列表作为输入。LangChain 的ChatModel 特别接受 Message 对象的列表作为输入。这些消息有多种形式,例如 HumanMessage(用户输入)或 AIMessage(LLM 响应)。要了解更多关于消息对象的信息,请参阅概念指南。

在图中使用消息

在许多情况下,将之前的对话历史记录作为消息列表存储在图状态中很有帮助。为此,我们可以向图状态添加一个键(通道),该键存储 Message 对象的列表,并使用归约函数对其进行注释(参见下面示例中的 messages 键)。归约函数对于告诉图如何通过每次状态更新(例如,当节点发送更新时)来更新状态中的 Message 对象列表至关重要。如果您不指定归约器,则每次状态更新都将使用最新提供的值覆盖消息列表。如果您只想将消息简单地附加到现有列表,则可以使用 operator.add 作为归约器。

然而,您可能还希望手动更新图状态中的消息(例如,人工参与)。如果您使用 operator.add,则您发送到图的手动状态更新将被附加到现有消息列表,而不是更新现有消息。为避免这种情况,您需要一个能够跟踪消息 ID 并在更新时覆盖现有消息的归约器。为此,您可以使用预构建的 add_messages 函数。对于全新消息,它将简单地附加到现有列表;但它也会正确处理现有消息的更新。

序列化

除了跟踪消息 ID 之外,每当在 messages 通道上收到状态更新时,add_messages 函数还会尝试将消息反序列化为 LangChain Message 对象。有关 LangChain 序列化/反序列化的更多信息,请参阅此处。这允许以以下格式发送图输入/状态更新:

# this is supported
{"messages": [HumanMessage(content="message")]}

# and this is also supported
{"messages": [{"type": "human", "content": "message"}]}

由于在使用 add_messages 时状态更新总是反序列化为 LangChain Messages,因此您应该使用点表示法来访问消息属性,例如 state["messages"][-1].content。下面是一个使用 add_messages 作为其归约函数的图示例。

API 参考:AnyMessage | add_messages

from langchain_core.messages import AnyMessage
from langgraph.graph.message import add_messages
from typing import Annotated
from typing_extensions import TypedDict

class GraphState(TypedDict):
    messages: Annotated[list[AnyMessage], add_messages]

MessagesState

由于在状态中包含消息列表非常常见,因此存在一个预构建的状态,称为 MessagesState,它使得使用消息变得容易。MessagesState 定义了一个单独的 messages 键,它是一个 AnyMessage 对象列表,并使用 add_messages 归约器。通常,除了消息之外还需要跟踪更多状态,因此我们看到人们会对此状态进行子类化并添加更多字段,例如:

from langgraph.graph import MessagesState

class State(MessagesState):
    documents: list[str]

节点

在 LangGraph 中,节点通常是 Python 函数(同步或异步),其中第一个位置参数是状态,(可选地)第二个位置参数是“配置”,包含可选的可配置参数(例如 thread_id)。

NetworkX 类似,您可以使用 add_node 方法将这些节点添加到图中:

API 参考:RunnableConfig | StateGraph

from typing_extensions import TypedDict

from langchain_core.runnables import RunnableConfig
from langgraph.graph import StateGraph

class State(TypedDict):
    input: str
    results: str

builder = StateGraph(State)


def my_node(state: State, config: RunnableConfig):
    print("In node: ", config["configurable"]["user_id"])
    return {"results": f"Hello, {state['input']}!"}


# The second argument is optional
def my_other_node(state: State):
    return state


builder.add_node("my_node", my_node)
builder.add_node("other_node", my_other_node)
...

在幕后,函数被转换为 RunnableLambda,这为您的函数添加了批处理和异步支持,以及原生跟踪和调试功能。

如果您向图中添加节点时未指定名称,它将获得与函数名称相同的默认名称。

builder.add_node(my_node)
# You can then create edges to/from this node by referencing it as `"my_node"`

START 节点

START 节点是一个特殊节点,代表将用户输入发送到图的节点。引用此节点的主要目的是确定应首先调用哪些节点。

API 参考:START

from langgraph.graph import START

graph.add_edge(START, "node_a")

END 节点

END 节点是一个特殊节点,代表终止节点。当您想表示哪些边在完成操作后没有后续动作时,会引用此节点。

from langgraph.graph import END

graph.add_edge("node_a", END)

节点缓存

LangGraph 支持根据节点的输入缓存任务/节点。要使用缓存:

  • 编译图时(或指定入口点时)指定缓存。
  • 为节点指定缓存策略。每个缓存策略支持:
    • key_func 用于根据节点输入生成缓存键,默认为使用 pickle 对输入进行 hash
    • ttl,缓存的存活时间(秒)。如果未指定,缓存将永不过期。

例如

API 参考:StateGraph

import time
from typing_extensions import TypedDict
from langgraph.graph import StateGraph
from langgraph.cache.memory import InMemoryCache
from langgraph.types import CachePolicy


class State(TypedDict):
    x: int
    result: int


builder = StateGraph(State)


def expensive_node(state: State) -> dict[str, int]:
    # expensive computation
    time.sleep(2)
    return {"result": state["x"] * 2}


builder.add_node("expensive_node", expensive_node, cache_policy=CachePolicy(ttl=3))
builder.set_entry_point("expensive_node")
builder.set_finish_point("expensive_node")

graph = builder.compile(cache=InMemoryCache())

print(graph.invoke({"x": 5}, stream_mode='updates'))  # (1)!
[{'expensive_node': {'result': 10}}]
print(graph.invoke({"x": 5}, stream_mode='updates'))  # (2)!
[{'expensive_node': {'result': 10}, '__metadata__': {'cached': True}}]
  1. 第一次运行需要整整一秒钟(由于模拟了昂贵的计算)。
  2. 第二次运行利用缓存并快速返回。

边定义了逻辑如何路由以及图如何决定停止。这是代理工作方式以及不同节点之间如何通信的重要组成部分。边有几种主要类型:

  • 普通边:直接从一个节点到下一个节点。
  • 条件边:调用函数来确定接下来要到哪个(或哪些)节点。
  • 入口点:当用户输入到达时首先调用哪个节点。
  • 条件入口点:调用函数来确定当用户输入到达时首先调用哪个(或哪些)节点。

一个节点可以有多个出边。如果一个节点有多个出边,则所有这些目标节点都将作为下一个超步的一部分并行执行。

普通边

如果您总是想从节点 A 到节点 B,您可以直接使用 add_edge 方法。

graph.add_edge("node_a", "node_b")

条件边

如果您想选择性地路由到一条或多条边(或选择性地终止),您可以使用 add_conditional_edges 方法。此方法接受节点名称和一个在该节点执行后要调用的“路由函数”。

graph.add_conditional_edges("node_a", routing_function)

与节点类似,routing_function 接受图的当前 state 并返回一个值。

默认情况下,routing_function 的返回值用作下一个接收状态的节点(或节点列表)的名称。所有这些节点都将作为下一个超步的一部分并行运行。

您可以选择提供一个字典,将 routing_function 的输出映射到下一个节点的名称。

graph.add_conditional_edges("node_a", routing_function, {True: "node_b", False: "node_c"})

提示

如果您想在单个函数中结合状态更新和路由,请使用Command 而不是条件边。

入口点

入口点是图启动时运行的第一个节点。您可以使用从虚拟 START 节点到第一个要执行的节点的 add_edge 方法来指定图的入口。

API 参考:START

from langgraph.graph import START

graph.add_edge(START, "node_a")

条件入口点

条件入口点允许您根据自定义逻辑在不同的节点开始。您可以使用虚拟 START 节点的 add_conditional_edges 来实现此目的。

API 参考:START

from langgraph.graph import START

graph.add_conditional_edges(START, routing_function)

您可以选择提供一个字典,将 routing_function 的输出映射到下一个节点的名称。

graph.add_conditional_edges(START, routing_function, {True: "node_b", False: "node_c"})

Send

默认情况下,NodesEdges 是预先定义的,并在同一个共享状态上操作。然而,在某些情况下,确切的边可能无法预先知道,或者您可能希望同时存在不同版本的 State。一个常见的例子是 map-reduce 设计模式。在此设计模式中,第一个节点可能会生成一个对象列表,您可能希望将某些其他节点应用于所有这些对象。对象的数量可能无法预先知道(这意味着边的数量可能无法知道),并且下游 Node 的输入 State 应该不同(每个生成的对象对应一个)。

为了支持这种设计模式,LangGraph 支持从条件边返回 Send 对象。Send 接受两个参数:第一个是节点名称,第二个是要传递给该节点的状态。

def continue_to_jokes(state: OverallState):
    return [Send("generate_joke", {"subject": s}) for s in state['subjects']]

graph.add_conditional_edges("node_a", continue_to_jokes)

Command

将控制流(边)和状态更新(节点)结合起来会很有用。例如,您可能希望在同一个节点中既执行状态更新又决定下一个要去的节点。LangGraph 提供了一种通过从节点函数返回 Command 对象来实现此目的的方法:

def my_node(state: State) -> Command[Literal["my_other_node"]]:
    return Command(
        # state update
        update={"foo": "bar"},
        # control flow
        goto="my_other_node"
    )

使用 Command,您还可以实现动态控制流行为(与条件边相同)。

def my_node(state: State) -> Command[Literal["my_other_node"]]:
    if state["foo"] == "bar":
        return Command(update={"foo": "baz"}, goto="my_other_node")

重要提示

在节点函数中返回 Command 时,您必须添加返回类型注解,其中包含节点路由到的节点名称列表,例如 Command[Literal["my_other_node"]]。这对于图的渲染是必需的,并告诉 LangGraph my_node 可以导航到 my_other_node

请查看此操作指南,了解如何使用 Command 的端到端示例。

什么时候应该使用 Command 而不是条件边?

当您需要同时更新图状态路由到不同节点时,请使用 Command。例如,在实现多代理交接时,路由到不同代理并向其传递某些信息非常重要。

使用条件边可在节点之间有条件地路由,而无需更新状态。

如果您正在使用子图,您可能希望从子图中的一个节点导航到不同的子图(即父图中的不同节点)。为此,您可以在 Command 中指定 graph=Command.PARENT

def my_node(state: State) -> Command[Literal["other_subgraph"]]:
    return Command(
        update={"foo": "bar"},
        goto="other_subgraph",  # where `other_subgraph` is a node in the parent graph
        graph=Command.PARENT
    )

注意

graph 设置为 Command.PARENT 将导航到最近的父图。

使用 Command.PARENT 进行状态更新

当您从子图节点向父图节点发送更新时,对于父图和子图状态模式都共享的键,您必须在父图状态中为您正在更新的键定义一个归约器。请参阅此示例

这在实现多代理交接时特别有用。

有关详细信息,请查看本指南

在工具内部使用

一个常见的使用场景是从工具内部更新图状态。例如,在客户支持应用程序中,您可能希望在对话开始时根据客户的帐号或 ID 查找客户信息。

有关详细信息,请参阅本指南

人工参与

Command 是人工参与工作流的重要组成部分:当使用 interrupt() 收集用户输入时,随后通过 Command(resume="User input") 提供输入并恢复执行。有关更多信息,请查看此概念指南

图迁移

即使使用检查点来跟踪状态,LangGraph 也能轻松处理图定义(节点、边和状态)的迁移。

  • 对于图末尾的线程(即未中断的线程),您可以更改图的整个拓扑结构(即所有节点和边,删除、添加、重命名等)。
  • 对于当前已中断的线程,我们支持除重命名/删除节点之外的所有拓扑更改(因为该线程现在可能即将进入一个不再存在的节点)——如果这是一个障碍,请联系我们,我们可以优先提供解决方案。
  • 对于修改状态,我们完全支持添加和删除键的向后和向前兼容性。
  • 已重命名的状态键会在现有线程中丢失其保存的状态。
  • 类型以不兼容方式更改的状态键目前可能会在具有更改前状态的线程中导致问题——如果这是一个障碍,请联系我们,我们可以优先提供解决方案。

配置

创建图时,您还可以将图的某些部分标记为可配置。这通常是为了方便在模型或系统提示之间切换。这允许您创建一个单一的“认知架构”(图),但拥有它的多个不同实例。

创建图时,您可以选择指定一个 config_schema

class ConfigSchema(TypedDict):
    llm: str

graph = StateGraph(State, config_schema=ConfigSchema)

然后您可以使用 configurable 配置字段将此配置传递到图中。

config = {"configurable": {"llm": "anthropic"}}

graph.invoke(inputs, config=config)

然后您可以在节点或条件边内部访问和使用此配置。

def node_a(state, config):
    llm_type = config.get("configurable", {}).get("llm", "openai")
    llm = get_llm(llm_type)
    ...

有关配置的完整细分,请参阅本指南

递归限制

递归限制设置了图在单次执行期间可以执行的超步的最大数量。一旦达到限制,LangGraph 将引发 GraphRecursionError。默认情况下,此值设置为 25 步。递归限制可以在运行时在任何图上设置,并通过配置字典传递给 .invoke/.stream。重要的是,recursion_limit 是一个独立的 config 键,不应像所有其他用户定义的配置一样传递到 configurable 键中。请参阅以下示例:

graph.invoke(inputs, config={"recursion_limit": 5, "configurable":{"llm": "anthropic"}})

阅读此操作指南以了解有关递归限制如何工作的更多信息。

可视化

能够可视化图通常是件好事,尤其是当它们变得更复杂时。LangGraph 提供了几种内置的图可视化方法。有关更多信息,请参阅此操作指南