如何强制 Agent 调用工具¶
在本示例中,我们将构建一个 ReAct Agent,它在制定任何计划之前始终首先调用某个工具。在本示例中,我们将创建一个带有搜索工具的 Agent。但是,在开始时,我们将强制 Agent 调用搜索工具(然后让它在之后做任何它想做的事情)。当您知道您想在应用程序中执行特定操作,但也希望在完成该固定序列后,让 LLM 灵活地跟进用户的查询时,这非常有用。
设置¶
首先,我们需要安装所需的软件包
接下来,我们需要为 OpenAI(我们将使用的 LLM)设置 API 密钥。 可选地,我们可以为 LangSmith 追踪设置 API 密钥,这将为我们提供一流的可观察性。
// process.env.OPENAI_API_KEY = "sk_...";
// Optional, add tracing in LangSmith
// process.env.LANGCHAIN_API_KEY = "ls__...";
// process.env.LANGCHAIN_CALLBACKS_BACKGROUND = "true";
process.env.LANGCHAIN_TRACING_V2 = "true";
process.env.LANGCHAIN_PROJECT = "Force Calling a Tool First: LangGraphJS";
设置工具¶
我们将首先定义我们要使用的工具。 对于这个简单的示例,我们将使用通过 Tavily 内置的搜索工具。 但是,创建您自己的工具真的很容易 - 请参阅此处的文档,了解如何操作。
import { DynamicStructuredTool } from "@langchain/core/tools";
import { z } from "zod";
const searchTool = new DynamicStructuredTool({
name: "search",
description:
"Use to surf the web, fetch current information, check the weather, and retrieve other information.",
schema: z.object({
query: z.string().describe("The query to use in your search."),
}),
func: async ({}: { query: string }) => {
// This is a placeholder for the actual implementation
return "Cold, with a low of 13 ℃";
},
});
await searchTool.invoke({ query: "What's the weather like?" });
const tools = [searchTool];
我们现在可以将这些工具包装在 ToolNode
中。 这是一个预构建的节点,它接受 LangChain 聊天模型生成的工具调用,并调用该工具,返回输出。
设置模型¶
现在我们需要加载我们要使用的聊天模型。重要的是,这应该满足两个标准
- 它应该与消息一起工作。我们将以消息的形式表示所有 Agent 状态,因此它需要能够很好地与它们一起工作。
- 它应该与 OpenAI 函数调用一起工作。这意味着它应该是 OpenAI 模型或公开类似接口的模型。
注意:这些模型要求不是使用 LangGraph 的要求 - 它们只是此示例的要求。
import { ChatOpenAI } from "@langchain/openai";
const model = new ChatOpenAI({
temperature: 0,
model: "gpt-4o",
});
完成此操作后,我们应确保模型知道它可以调用这些工具。 我们可以通过将 LangChain 工具转换为 OpenAI 函数调用的格式,然后将它们绑定到模型类来实现。
定义 Agent 状态¶
langgraph
中的主要图类型是 StateGraph
。 此图由一个状态对象参数化,该状态对象在每个节点之间传递。 然后,每个节点返回更新该状态的操作。
对于此示例,我们将跟踪的状态只是消息列表。 我们希望每个节点只向该列表添加消息。 因此,我们将 Agent 状态定义为一个对象,其中一个键 (messages
) 及其值指定如何更新状态。
import { Annotation } from "@langchain/langgraph";
import { BaseMessage } from "@langchain/core/messages";
const AgentState = Annotation.Root({
messages: Annotation<BaseMessage[]>({
reducer: (x, y) => x.concat(y),
}),
});
定义节点¶
我们现在需要在图中定义几个不同的节点。 在 langgraph
中,节点可以是函数或 runnable。 我们需要两个主要节点
- Agent:负责决定采取哪些(如果有)操作。
- 调用工具的函数:如果 Agent 决定采取操作,则此节点将执行该操作。
我们还需要定义一些边。 其中一些边可能是条件性的。 它们是条件性的原因是,基于节点的输出,可能会采取多个路径之一。 采取的路径在节点运行(LLM 决定)之前是未知的。
- 条件边:在调用 Agent 后,我们应该: a. 如果 Agent 说要采取操作,则应调用调用工具的函数 b. 如果 Agent 说它已完成,则应完成
- 普通边:在调用工具后,它应该始终返回到 Agent 以决定下一步做什么
让我们定义节点,以及一个函数来决定如何采取条件边。
import { AIMessage, AIMessageChunk } from "@langchain/core/messages";
import { RunnableConfig } from "@langchain/core/runnables";
import { concat } from "@langchain/core/utils/stream";
// Define logic that will be used to determine which conditional edge to go down
const shouldContinue = (state: typeof AgentState.State) => {
const { messages } = state;
const lastMessage = messages[messages.length - 1] as AIMessage;
// If there is no function call, then we finish
if (!lastMessage.tool_calls || lastMessage.tool_calls.length === 0) {
return "end";
}
// Otherwise if there is, we continue
return "continue";
};
// Define the function that calls the model
const callModel = async (
state: typeof AgentState.State,
config?: RunnableConfig,
) => {
const { messages } = state;
let response: AIMessageChunk | undefined;
for await (const message of await boundModel.stream(messages, config)) {
if (!response) {
response = message;
} else {
response = concat(response, message);
}
}
// We return an object, because this will get added to the existing list
return {
messages: response ? [response as AIMessage] : [],
};
};
修改
在这里,我们创建一个返回带有工具调用的 AIMessage 的节点 - 我们将在开始时使用它来强制它调用工具
// This is the new first - the first call of the model we want to explicitly hard-code some action
const firstModel = async (state: typeof AgentState.State) => {
const humanInput = state.messages[state.messages.length - 1].content || "";
return {
messages: [
new AIMessage({
content: "",
tool_calls: [
{
name: "search",
args: {
query: humanInput,
},
id: "tool_abcd123",
},
],
}),
],
};
};
定义图¶
我们现在可以将所有内容放在一起并定义图!
修改
我们将定义一个 firstModel
节点,我们将其设置为入口点。
import { END, START, StateGraph } from "@langchain/langgraph";
// Define a new graph
const workflow = new StateGraph(AgentState)
// Define the new entrypoint
.addNode("first_agent", firstModel)
// Define the two nodes we will cycle between
.addNode("agent", callModel)
.addNode("action", toolNode)
// Set the entrypoint as `first_agent`
// by creating an edge from the virtual __start__ node to `first_agent`
.addEdge(START, "first_agent")
// We now add a conditional edge
.addConditionalEdges(
// First, we define the start node. We use `agent`.
// This means these are the edges taken after the `agent` node is called.
"agent",
// Next, we pass in the function that will determine which node is called next.
shouldContinue,
// Finally we pass in a mapping.
// The keys are strings, and the values are other nodes.
// END is a special node marking that the graph should finish.
// What will happen is we will call `should_continue`, and then the output of that
// will be matched against the keys in this mapping.
// Based on which one it matches, that node will then be called.
{
// If `tools`, then we call the tool node.
continue: "action",
// Otherwise we finish.
end: END,
},
)
// We now add a normal edge from `tools` to `agent`.
// This means that after `tools` is called, `agent` node is called next.
.addEdge("action", "agent")
// After we call the first agent, we know we want to go to action
.addEdge("first_agent", "action");
// Finally, we compile it!
// This compiles it into a LangChain Runnable,
// meaning you can use it as you would any other runnable
const app = workflow.compile();
使用它!¶
我们现在可以使用它了! 这现在公开了与所有其他 LangChain runnable 相同的接口。
import { HumanMessage } from "@langchain/core/messages";
const inputs = {
messages: [new HumanMessage("what is the weather in sf")],
};
for await (const output of await app.stream(inputs)) {
console.log(output);
console.log("-----\n");
}
{
first_agent: {
messages: [
AIMessage {
"content": "",
"additional_kwargs": {},
"response_metadata": {},
"tool_calls": [
{
"name": "search",
"args": {
"query": "what is the weather in sf"
},
"id": "tool_abcd123"
}
],
"invalid_tool_calls": []
}
]
}
}
-----
{
action: {
messages: [
ToolMessage {
"content": "Cold, with a low of 13 ℃",
"name": "search",
"additional_kwargs": {},
"response_metadata": {},
"tool_call_id": "tool_abcd123"
}
]
}
}
-----
{
agent: {
messages: [
AIMessageChunk {
"id": "chatcmpl-9y562g16z0MUNBJcS6nKMsDuFMRsS",
"content": "The current weather in San Francisco is cold, with a low of 13°C.",
"additional_kwargs": {},
"response_metadata": {
"prompt": 0,
"completion": 0,
"finish_reason": "stop",
"system_fingerprint": "fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27fp_3aa7262c27"
},
"tool_calls": [],
"tool_call_chunks": [],
"invalid_tool_calls": [],
"usage_metadata": {
"input_tokens": 104,
"output_tokens": 18,
"total_tokens": 122
}
}
]
}
}
-----