MiroThinker

5个月前发布 107 00

MiroThinker 是 MiroMind Research Agent Project 的官方实现。它是一款开源研究智能体，旨在推进工具增强推理和信息检索能力，支持跨多种复杂现实世界研究工作流的处理。

所在地：

美国

收录时间：

2025-11-22

其他站点:

GitHub

打开网站手机查看

智能体 # MiroThinker

MiroThinker

打开网站

MiroThinker 是 MiroMind Research Agent Project 的官方开源实现，定位为一款专注于工具增强推理与信息检索能力的研究智能体。其核心目标是突破现有技术瓶颈，高效支撑各类复杂现实世界研究工作流的处理，为科研与技术探索提供强有力的智能化工具支持。

该项目构建了完整的技术生态，包含四大核心组件，形成从模型、框架、数据集到训练基础设施的全链路支撑：

MiroThinker：核心开源研究智能体模型，原生支持工具辅助推理机制。在 HLE、HLE-Text-2158、HLE-Text-500、BrowserComp、BrowserComp-ZH、GAIA、xBench-DeepSearch、FutureX 和 Frames 等多个权威基准测试中，均达到当前开源领域最优性能水平。快速上手可参考 Quick Start 文档。
MiroFlow：配套开源研究智能体框架，同样在多个基准测试中实现可复现的最优性能，为模型运行提供稳定、高效的底层支撑。详细技术细节见 MiroFlow 专属文档。
MiroVerse：高质量开源训练数据集，包含 147k 条优质样本，专门为研究智能体的模型训练量身打造，为性能提升提供坚实的数据基础。数据集已开源至 HuggingFace，可通过 MiroVerse 官方链接获取。
MiroTrain / MiroRL：针对研究智能体模型设计的训练基础设施，能够支持模型稳定、高效地完成训练过程，降低技术落地门槛。具体使用方法见 MiroTrain 和 MiroRL 相关文档。

核心突破：MiroThinker-v1.0 的交互式扩展创新

与传统依赖扩大模型参数规模或延长上下文长度的智能体不同，MiroThinker v1.0 在模型设计层面引入了交互式扩展（interactive scaling） 这一核心创新。

该机制将“智能体–环境交互”作为性能提升的第三维度，通过系统性训练让模型能够处理更深层次、更频繁的交互过程。其核心逻辑是利用环境反馈与外部信息获取，实时纠正推理错误、优化任务处理轨迹，从而在复杂研究场景中实现更精准、高效的推理与决策。

MiroThinker-v1.0 核心特性

256K 超长上下文窗口：能够支持长时程推理任务与深度多步分析，轻松处理大篇幅文献、复杂数据集等研究场景需求。
600 次极限工具调用：单任务支持高达 600 次工具调用，远超此前开源研究智能体的能力上限，可应对需要频繁依赖外部工具的复杂研究工作流。
多尺度灵活发布：提供 8B、30B 和 72B 三种参数规模版本，搭配完整的工具集与工作流方案，能够灵活适配不同研究场景、算力预算与性能需求。

模型名称	基础模型	最大上下文长度	最大工具调用次数	HuggingFace 链接
MiroThinker-v1.0-8B	Qwen3-8B	256K	600	地址
MiroThinker-v1.0-30B	Qwen3-30B-A3B-Thinking-2507	256K	600	地址
MiroThinker-v1.0-72B	Qwen2.5-72B-Instruct	256K	600	地址

在性能表现上，MiroThinker v1.0 展现出强大的通用研究能力：在 HLE-Text 基准中取得 37.7% 的成绩，BrowserComp 中达到 47.1%，BrowserComp-ZH 中斩获 55.6%，GAIA-Text-103 中更是实现 81.9% 的高分。这一系列数据不仅超越了此前所有开源智能体，更显著缩小了与 GPT-5-high 等商业模型之间的性能差距。

MiroThinker 优化框架核心优势

除了模型本身的突破，MiroThinker 的优化框架还具备以下核心优势：

完全开源透明：框架与模型全部开源，无技术壁垒，支持开发者自由二次开发与定制化改造。
无缝工具集成：能够与外部工具和 API 实现无缝对接，轻松扩展功能边界，适配多样化研究场景。
完整轨迹采集：自动完整记录智能体交互日志，包含每一步操作耗时与预计完成时间（单位：分钟），日志数据可直接用于 SFT（有监督微调）和 DPO（直接偏好优化）训练，降低模型迭代成本。
全面基准评测：已在多个权威基准数据集上完成广泛测试，性能表现可量化、可复现，为技术选型提供可靠参考。

数据统计

暂无评论

暂无评论...

MiroThinker

核心突破：MiroThinker-v1.0 的交互式扩展创新

MiroThinker-v1.0 核心特性

MiroThinker 优化框架核心优势

数据统计

相关导航

MuleRun

Ripple（涟漪）

GELab-Zero

马卡龙（Macaron AI）

Simular

xpander.ai

TradingAgents

Cracked AI

暂无评论

网址

S.H.I.T

ITELLOU

waoo

新Flova

Tripo

Joker of Academics（小丑学术期刊）

S.H.I.T

ITELLOU

waoo

新Flova

Tripo

Joker of Academics（小丑学术期刊）

MiroThinker

核心突破：MiroThinker-v1.0 的交互式扩展创新

MiroThinker-v1.0 核心特性

MiroThinker 优化框架核心优势

数据统计

相关导航

MuleRun

Ripple（涟漪）

GELab-Zero

马卡龙（Macaron AI）

Simular

xpander.ai

TradingAgents

Cracked AI

暂无评论

网址

S.H.I.T

ITELLOU

waoo

新Flova

Tripo

Joker of Academics（小丑学术期刊 ）

标签云

网址

S.H.I.T

ITELLOU

waoo

新Flova

Tripo

Joker of Academics（小丑学术期刊 ）

Joker of Academics（小丑学术期刊）

Joker of Academics（小丑学术期刊）