在 OpenAI 发布其多步骤研究工具 Deep Research 后不到一天,Hugging Face 迅速推出了名为 Open Deep Research 的开源项目。这一举动不仅展示了 Hugging Face 在 AI 领域的快速响应能力,也标志着开源社区对闭源技术的一次重要反击。
- 官方说明:https://huggingface.co/blog/open-deep-research
- GitHub:https://github.com/huggingface/smolagents/tree/main/examples/open_deep_research
- Demo:https://huggingface.co/spaces/m-ric/open_Deep-Research

Open Deep Research 的核心特点
- 开源框架与专有模型结合:Open Deep Research 是一个开源的智能体框架,旨在复现 OpenAI 的 Deep Research 功能。尽管该框架本身是开源的,但它依赖于 OpenAI 的专有模型 o1,并通过其付费 API 实现核心功能。
- 快速适配与功能实现:Hugging Face 的团队在不到 24 小时内完成了对 o1 模型的适配,使其能够使用基于文本的浏览器和“文本检查器”工具包。这使得 Open Deep Research 能够自主完成网络导航、文件操作和数据计算等任务。
- 性能表现:在 GAIA 验证集上的测试中,Open Deep Research 得分为 55.15%,而 OpenAI 的 Deep Research 则达到了 67.36%。虽然存在差距,但 Hugging Face 表示,通过优化智能体设计(例如使用编码智能体而非基于 JSON 的标准智能体),可以显著提升性能。
性能差异的原因分析
Hugging Face 推测,OpenAI 的 Deep Research 在性能上的优势可能源于其 Operator 智能体 的强大能力。Operator 智能体能够模拟类似人类的网络交互行为,从而更高效地完成复杂的多步骤任务。
相比之下,Open Deep Research 当前依赖于基于文本的浏览器和工具包,这种限制导致其在网络交互和复杂任务处理方面稍显不足。为了解决这一问题,Hugging Face 计划开发自己的网页浏览器智能体,以进一步缩小与 OpenAI 的差距。
开源的意义与未来展望
Hugging Face 推出 Open Deep Research 的意义不仅在于提供一个开源替代方案,还在于推动 AI 技术的透明化和普及化。通过开源框架,开发者可以自由探索、改进和扩展智能体的功能,从而加速 AI 技术的发展。
然而,当前 Open Deep Research 对 OpenAI 的 o1 模型的依赖性仍然是一个潜在的瓶颈。为了完全摆脱对专有模型的依赖,Hugging Face 和其他开源社区需要继续努力开发性能更强的开源模型,例如 DeepSeek 的 R1 或其他新兴模型。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...