MiroThinker

2周前发布 25 00

MiroThinker 是 MiroMind Research Agent Project 的官方实现。它是一款开源研究智能体,旨在推进工具增强推理和信息检索能力,支持跨多种复杂现实世界研究工作流的处理。

所在地:
美国
收录时间:
2025-11-22
其他站点:
MiroThinkerMiroThinker

MiroThinker 是 MiroMind Research Agent Project 的官方开源实现,定位为一款专注于工具增强推理与信息检索能力的研究智能体。其核心目标是突破现有技术瓶颈,高效支撑各类复杂现实世界研究工作流的处理,为科研与技术探索提供强有力的智能化工具支持。

MiroThinker

该项目构建了完整的技术生态,包含四大核心组件,形成从模型、框架、数据集到训练基础设施的全链路支撑:

  • MiroThinker:核心开源研究智能体模型,原生支持工具辅助推理机制。在 HLE、HLE-Text-2158、HLE-Text-500、BrowserComp、BrowserComp-ZH、GAIA、xBench-DeepSearch、FutureX 和 Frames 等多个权威基准测试中,均达到当前开源领域最优性能水平。快速上手可参考 Quick Start 文档。
  • MiroFlow:配套开源研究智能体框架,同样在多个基准测试中实现可复现的最优性能,为模型运行提供稳定、高效的底层支撑。详细技术细节见 MiroFlow 专属文档。
  • MiroVerse:高质量开源训练数据集,包含 147k 条优质样本,专门为研究智能体的模型训练量身打造,为性能提升提供坚实的数据基础。数据集已开源至 HuggingFace,可通过 MiroVerse 官方链接获取。
  • MiroTrain / MiroRL:针对研究智能体模型设计的训练基础设施,能够支持模型稳定、高效地完成训练过程,降低技术落地门槛。具体使用方法见 MiroTrain 和 MiroRL 相关文档。

核心突破:MiroThinker-v1.0 的交互式扩展创新

与传统依赖扩大模型参数规模或延长上下文长度的智能体不同,MiroThinker v1.0 在模型设计层面引入了交互式扩展(interactive scaling) 这一核心创新。

该机制将“智能体–环境交互”作为性能提升的第三维度,通过系统性训练让模型能够处理更深层次、更频繁的交互过程。其核心逻辑是利用环境反馈与外部信息获取,实时纠正推理错误、优化任务处理轨迹,从而在复杂研究场景中实现更精准、高效的推理与决策。

MiroThinker-v1.0 核心特性

  • 256K 超长上下文窗口:能够支持长时程推理任务与深度多步分析,轻松处理大篇幅文献、复杂数据集等研究场景需求。
  • 600 次极限工具调用:单任务支持高达 600 次工具调用,远超此前开源研究智能体的能力上限,可应对需要频繁依赖外部工具的复杂研究工作流。
  • 多尺度灵活发布:提供 8B、30B 和 72B 三种参数规模版本,搭配完整的工具集与工作流方案,能够灵活适配不同研究场景、算力预算与性能需求。
模型名称基础模型最大上下文长度最大工具调用次数HuggingFace 链接
MiroThinker-v1.0-8BQwen3-8B256K600地址
MiroThinker-v1.0-30BQwen3-30B-A3B-Thinking-2507256K600地址
MiroThinker-v1.0-72BQwen2.5-72B-Instruct256K600地址

在性能表现上,MiroThinker v1.0 展现出强大的通用研究能力:在 HLE-Text 基准中取得 37.7% 的成绩,BrowserComp 中达到 47.1%,BrowserComp-ZH 中斩获 55.6%,GAIA-Text-103 中更是实现 81.9% 的高分。这一系列数据不仅超越了此前所有开源智能体,更显著缩小了与 GPT-5-high 等商业模型之间的性能差距。

MiroThinker 优化框架核心优势

除了模型本身的突破,MiroThinker 的优化框架还具备以下核心优势:

  • 完全开源透明:框架与模型全部开源,无技术壁垒,支持开发者自由二次开发与定制化改造。
  • 无缝工具集成:能够与外部工具和 API 实现无缝对接,轻松扩展功能边界,适配多样化研究场景。
  • 完整轨迹采集:自动完整记录智能体交互日志,包含每一步操作耗时与预计完成时间(单位:分钟),日志数据可直接用于 SFT(有监督微调)和 DPO(直接偏好优化)训练,降低模型迭代成本。
  • 全面基准评测:已在多个权威基准数据集上完成广泛测试,性能表现可量化、可复现,为技术选型提供可靠参考。
MiroThinker

数据统计

相关导航

暂无评论

none
暂无评论...