
Agentic Data Scientist 是一个开源的多智能体协作框架,旨在自动化完成端到端的数据科学任务。该框架基于 Google Agent Development Kit (ADK) 与 Claude Agent SDK 构建,通过明确的角色分工、结构化的工作流与持续验证机制,解决传统自动化分析中常见的“盲目执行”“缺乏反馈”“无法纠错”等问题。

其核心设计原则是:将“规划”与“执行”彻底分离,在执行中动态调整,在全流程中持续验证。
核心设计理念
1. 规划先行,避免无效计算
系统在执行任何代码前,首先由 Planner 智能体生成包含目标、阶段划分与成功标准的完整分析方案。该方案需经 Reviewer 审核通过后,方可进入执行阶段,从而减少因需求理解偏差导致的返工。
2. 迭代式精炼,而非线性流水线
每个分析阶段(如数据清洗、特征工程、建模)均包含“执行 → 验证 → 反思 → 调整”闭环。若结果未达预期,系统可回溯、重规划或修正后续步骤,而非强行推进。
3. 全程可追踪的成功标准
所有任务均绑定明确的、可量化的成功标准(如“缺失值 < 1%”“模型 AUC > 0.85”)。Criteria Checker 智能体持续监控进度,确保最终输出覆盖全部目标。
4. 动态响应新发现
在执行过程中,若发现数据异常、新特征或用户未明说的需求(如“其实我更关心时间趋势”),Stage Reflector 会触发重规划,调整后续分析路径。
智能体角色与分工
| 智能体角色 | 职责说明 |
|---|---|
| Plan Maker | 解析用户需求,生成结构化分析计划,包含阶段划分与成功标准 |
| Plan Reviewer | 审查计划完整性、可行性与逻辑漏洞,确保无重大遗漏 |
| Plan Parser | 将自然语言计划转换为机器可执行的结构化任务序列 |
| Stage Orchestrator | 协调各阶段执行顺序,管理状态流转,触发验证与反思 |
| Coding Agent | 调用 Claude Code SDK 及其内置的 380+ 科学计算技能,生成并运行分析代码 |
| Review Agent | 检查代码逻辑、结果合理性与潜在偏差(如数据泄露、过拟合) |
| Criteria Checker | 对照预设成功标准,量化评估当前阶段完成度 |
| Stage Reflector | 基于执行反馈,判断是否需要调整后续计划或重试当前阶段 |
| Summary Agent | 整合所有中间结果与结论,生成结构化报告(含可视化、洞见、局限性) |
所有智能体通过 **Model Context Protocol **(MCP) 与外部工具(如 Pandas、Scikit-learn、Matplotlib)交互,确保分析可落地。
技术特性
- MCP 工具集成:通过标准协议调用任意 Python 数据科学库;
- Claude 科学能力深度集成:直接复用其代码生成、统计推断、可视化等专业技能;
- 文件即数据:支持拖拽上传 CSV、Excel、JSON 等格式,自动解析 schema;
- 高度可定制:用户可自定义 Agent 提示词、角色行为、验证规则;
- 一键部署:支持
pip install或uvx快速安装,无需复杂依赖。
适用场景
- 探索性数据分析(EDA):自动识别分布、异常、相关性;
- 端到端建模:从数据清洗到模型部署的全流程自动化;
- 可复现报告生成:输出包含代码、图表、结论的完整分析文档;
- 教学与原型验证:快速验证分析思路,降低技术门槛;
- 企业级分析流水线:作为智能层嵌入现有数据平台。
与传统 AutoML 的区别
| 维度 | 传统 AutoML | Agentic Data Scientist |
|---|---|---|
| 目标 | 优化模型性能 | 完成完整分析任务(含解释、报告) |
| 流程 | 黑盒流水线 | 透明、可干预、可审计 |
| 反馈机制 | 仅最终指标 | 每阶段验证 + 动态调整 |
| 灵活性 | 固定流程 | 支持重规划、自定义规则 |
| 输出 | 模型/预测 | 可读报告 + 代码 + 洞见 |
数据统计
相关导航


百宝箱 Tbox

Continua

Midscene.js

Eigent AI

Baserow

Surveys Agent






