
DataFlow
DataFlow 是一个数据准备系统,旨在从噪声数据源(PDF、纯文本、低质量问答)中解析,生成,加工并评估高质量数据,以提升大语言模型(LLMs)在特定领域的表现,支持预训练、监督微调(SFT)、强化学习训练以及基于知识库的 RAG 系统。我们在医疗、金融和法律等多个垂类领域实证验证了 DataFlow 的有效性。
FlowGram 是字节跳动开源的一款基于节点编辑的流程搭建引擎,帮助开发者快速创建可视化的工作流。无论是固定布局还是自由连线布局模式,FlowGram 都提供了灵活的设计选项和交互最佳实践,非常适合需要明确输入和输出的场景。此外,FlowGram 还通过 AI 技术增强工作流程,提供自动化支持,显著提升效率。










