🦜💯 LangChain 基准测试#

一个帮助基准测试各种 LLM 相关任务的包。

基准测试按端到端用例组织，并大量利用 LangSmith。

我们在开源这个项目中有一些目标

基准测试结果#

阅读我们博客中关于基准测试结果的一些文章。

查看工具使用文档以重新创建！

download

探索 LangSmith 上的代理轨迹

要安装软件包，请运行以下命令

pip install -U langchain-benchmarks

所有基准测试都附带一个相关的基准数据集，存储在 LangSmith 中。为了利用评估和调试体验，请注册，并在环境中设置您的 API 密钥

export LANGCHAIN_API_KEY=ls-...

该软件包位于 langchain_benchmarks 中。查看文档以获取有关如何开始的更多信息。

以下是需要克隆此仓库才能运行的存档基准测试。