- 日期
- 作者
- LangChain 团队
🛠 LangSmith 中的回归测试
LangSmith 中的回归测试、热键等
改进的回归测试体验: 当更改您的 LLM 应用程序时,重要的是了解行为是否与之前的测试用例相比发生了倒退。提示、检索策略或模型选择的更改可能会对您的应用程序产生的响应产生重大影响。我们更新了比较视图,以便更轻松地跨多个实验探索数据
我们发布了更多显示选项,因此您可以自定义想要查看的信息粒度。查看您认为重要的列、数据点和图表。
自动突出显示在评估指标上与基线相比增加或减少的测试运行,并筛选以仅显示偏离的测试运行。
改进的侧面板视图允许您深入了解您感兴趣的特定运行的详细信息。

我们在 LangSmith 中还有一些新的附加更新
注释队列中的热键: 我们在注释队列中引入了热键,以帮助您更快地导航
! 查找现在支持键盘快捷键的按钮旁边的热键指示器。
Mustache 支持: 您现在可以选择在 Playground 和 Prompt Hub 中切换提示模板语言,在 f-string 和 Mustache 之间切换。这使您在管理和格式化变量方面具有更大的灵活性。
评估: 我们的新视频系列向您展示了 LangSmith 实验如何帮助您增加测试覆盖率、发现回归并在延迟、成本和质量之间做出明智的权衡。我们发布了更多关于 RAG 评估的概念,向您展示如何评估响应质量:正确性 (视频, 文档), 幻觉 (视频, 文档), 和 检索到的文档相关性 (视频, 文档)。
Azure Marketplace: 我们很高兴地宣布 LangSmith 现在已在 Azure Marketplace 中提供。当您通过 Azure 信用额度在 Azure Marketplace 中购买 LangSmith 时,您将使数据完全包含在您的 Azure VPC 中,获得轻松部署,并体验更顺畅的采购流程。在我们的博客上了解更多信息,并联系销售以开始与我们的一位专家对话。