日期
作者
LangChain 团队
LangSmith

🔁 增强重复试验,获得对实验结果的信心

日期:
作者: LangChain 团队

你可以在 LangSmith 中运行实验的多次重复。这有助于平滑由你的应用程序或基于 LLM 的评测人员引入的可变性带来的噪声,以便你更自信地得出实验结果。

在这个视频中,学习如何对数据集进行重复评估。您可以查看 N 次重复中的平均分数,也可以比较重复中输出的可变性。

由 LaunchNotes 提供支持