- 日期
- 作者
- LangChain 团队
LangSmith SaaS
📦 从 LangSmith 批量数据导出,用于离线分析
日期:
作者: LangChain 团队
LangSmith 现在支持 批量数据导出, 现已推出 Beta 版,适用于 LangSmith Plus 和企业版计划。如果您需要在外部工具中离线分析您的跟踪数据,这允许您导出数据为 Parquet 格式 到您自己的 S3 存储桶或任何 S3 兼容的存储。通过批量数据导出,您可以在外部工具中查询您的 LangSmith 数据,例如
BigQuery
Snowflake
RedShift
DuckDB
Jupyter Notebooks
ClickHouse
通过 将 LangSmith 跟踪与其他数据源结合,您可以获得更深入的见解,了解性能趋势、数据质量和成本。
工作原理
按项目和日期范围启动导出
您可以针对特定的 LangSmith 项目,并为您的导出定义自定义日期范围。自动化编排与弹性
一旦导出启动,系统将管理并发、重试并处理运行时超时(设置为 24 小时)。这确保您的数据导出顺利运行,即使是大型数据集。您的数据将以 Parquet 格式导出,这是一种为分析优化的列式存储格式。这确保可以无缝导入到 BigQuery、Snowflake 和其他数据库等工具中。所有导出的数据将保持与 LangSmith 的 Run 数据格式 相同的结构。
开始使用
可用性:目前为 Beta 版,适用于 LangSmith Plus 和企业版计划。
如何启用: 联系 support@langchain.dev 以开始使用。
有关更多详细信息,请查看我们的文档:https://langsmith.langchain.ac.cn/how_to_guides/tracing/data_export