DeepAnalyze

1个月前更新 1,218 00

DeepAnalyze 是首个用于自主数据科学的智能体式 LLM,它能够在无需人工干预的情况下自主完成广泛的数据中心任务。其核心模型 DeepAnalyze-8B 仅用 80 亿参数,就在多项数据科学任务上超越了基于主流闭源大模型构建的预定义工作流智能体,标志着自主数据科学从“可能”走向“可行”。

所在地:
中国
收录时间:
2025-10-27
其他站点:
DeepAnalyzeDeepAnalyze

DeepAnalyze 是由中国人民大学与清华大学联合研发的 智能体式大语言模型(Agentic LLM),专为实现端到端自主数据科学而设计。它无需人工干预,即可自动完成从原始数据到分析师级深度报告的全流程任务,支持结构化、半结构化与非结构化等多种数据源。

DeepAnalyze

其核心模型 DeepAnalyze-8B 仅用 80 亿参数,就在多项数据科学任务上超越了基于主流闭源大模型构建的预定义工作流智能体,标志着自主数据科学从“可能”走向“可行”。

核心能力

完整数据科学管道自动化

  • 自动执行:数据加载、清洗、探索性分析(EDA)、特征工程、建模、可视化、报告撰写
  • 支持格式:
    • 结构化:CSV、Excel、SQL 数据库
    • 半结构化:JSON、XML、YAML
    • 非结构化:TXT、Markdown 等文本文件

开放式数据研究

  • 面对模糊或开放性问题(如“分析用户流失原因”),能自主设计分析路径
  • 通过多轮推理、工具调用与结果验证,生成逻辑严谨、可解释的深度报告
  • 输出内容包含:关键发现、可视化图表、方法说明与业务建议

完全开源

  • 模型权重、训练代码、合成数据轨迹、推理演示全部公开
  • 允许研究者与开发者本地部署、微调或集成到自有系统中
DeepAnalyze

技术创新

为突破传统“预定义工作流”智能体的局限性,DeepAnalyze 提出两项关键技术:

1. 基于课程的智能体式训练(Curriculum-based Agentic Training)

  • 模拟人类数据科学家的学习路径:从单一技能(如“读取 CSV”)逐步进阶到复杂任务(如“跨数据源归因分析”)
  • 通过渐进式难度调度,让模型在真实环境中自主组合工具、规划步骤、处理异常

2. 数据基础的轨迹合成框架(Data-grounded Trajectory Synthesis)

  • 自动生成高质量的“思考-行动-反馈”交互轨迹
  • 覆盖广阔的任务空间,为模型提供多样化的推理示范
  • 确保训练数据与真实数据科学实践高度对齐

实验结果

  • 在标准数据科学基准测试中,DeepAnalyze-8B 显著优于基于 GPT-4、Claude 等闭源模型构建的现有工作流智能体
  • 尤其在开放式研究任务(无明确指令)和多源数据整合场景中表现突出
  • 证明:智能体架构 + 高质量训练范式 比单纯依赖大模型规模更有效

数据统计

相关导航

暂无评论

none
暂无评论...