日期
作者
LangChain 团队
LangSmith SaaS

📦 从 LangSmith 批量数据导出,用于离线分析

日期:
作者: LangChain 团队

LangSmith 现在支持 批量数据导出, 现已推出 Beta 版,适用于 LangSmith Plus 和企业版计划。如果您需要在外部工具中离线分析您的跟踪数据,这允许您导出数据为 Parquet 格式 到您自己的 S3 存储桶或任何 S3 兼容的存储。通过批量数据导出,您可以在外部工具中查询您的 LangSmith 数据,例如

  • BigQuery

  • Snowflake

  • RedShift

  • DuckDB

  • Jupyter Notebooks

  • ClickHouse

通过 将 LangSmith 跟踪与其他数据源结合,您可以获得更深入的见解,了解性能趋势、数据质量和成本。


工作原理

  • 按项目和日期范围启动导出
    您可以针对特定的 LangSmith 项目,并为您的导出定义自定义日期范围。

  • 自动化编排与弹性
    一旦导出启动,系统将管理并发、重试并处理运行时超时(设置为 24 小时)。这确保您的数据导出顺利运行,即使是大型数据集。

  • 您的数据将以 Parquet 格式导出,这是一种为分析优化的列式存储格式。这确保可以无缝导入到 BigQuery、Snowflake 和其他数据库等工具中。所有导出的数据将保持与 LangSmith 的 Run 数据格式 相同的结构。


开始使用

  • 可用性:目前为 Beta 版,适用于 LangSmith Plus 和企业版计划。

  • 如何启用: 联系 support@langchain.dev 以开始使用。

有关更多详细信息,请查看我们的文档:https://langsmith.langchain.ac.cn/how_to_guides/tracing/data_export

由 LaunchNotes 提供支持