日期
作者
LangChain 团队
LangSmith SaaS

🔁 重复以建立对您的实验结果的信心

日期:
作者: LangChain 团队

您现在可以在 LangSmith 中运行多次重复实验。这有助于消除由您的应用程序或 LLM 评判评估器引入的变异性噪音,因此您可以对实验结果建立更高的信心。

此视频中,了解如何在重复数据集上进行评估。您可以查看 N 次重复的平均分数,还可以比较多次重复输出的可变性。

由 LaunchNotes 驱动