SuperCLUE 3月大模型榜单：豆包国内第一跻身全球第一梯队，国产开源全面领先海外

中文大模型基准测评SuperCLUE公布2026年3月最新结果，本次共有22款国内外主流模型参与测评。

本次测评覆盖数学推理、科学推理、代码生成等六大核心任务，综合衡量模型能力。海外闭源第一梯队依旧强势，Claude-Opus-4.6(max)、Gemini-3.1-Pro-Preview(high)、GPT-5.4(xhigh)包揽总分前三名。

字节跳动豆包模型 Doubao-Seed-2.0-pro-260215(high) 以71.53分位居国内第一，正式进入全球第一梯队，总分与GPT-5.4仅相差0.95分。尤其在智能体任务规划维度，豆包表现突出，反超部分海外模型，跻身全球前五。

小米集团MiMo-V2系列两款模型均登上榜单：MiMo-V2-Pro以60.67分进入闭源模型前列，数学推理单项达到84.03分；开源版MiMo-V2-Flash得分49.97分，在代码生成等场景具备一定竞争力。

整体来看，国产模型表现亮眼，开源领域优势尤为明显。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型占据开源榜前三，显著领先海外同类型开源模型。

暂无评论

暂无评论...