SuperCLUE 3月大模型榜单:豆包国内第一跻身全球第一梯队,国产开源全面领先海外

13小时前 小马良
5 0
SuperCLUE 3月大模型榜单:豆包国内第一跻身全球第一梯队,国产开源全面领先海外

中文大模型基准测评SuperCLUE公布2026年3月最新结果,本次共有22款国内外主流模型参与测评。

本次测评覆盖数学推理、科学推理、代码生成等六大核心任务,综合衡量模型能力。海外闭源第一梯队依旧强势,Claude-Opus-4.6(max)、Gemini-3.1-Pro-Preview(high)、GPT-5.4(xhigh)包揽总分前三名。

字节跳动豆包模型 Doubao-Seed-2.0-pro-260215(high) 以71.53分位居国内第一,正式进入全球第一梯队,总分与GPT-5.4仅相差0.95分。尤其在智能体任务规划维度,豆包表现突出,反超部分海外模型,跻身全球前五。

小米集团MiMo-V2系列两款模型均登上榜单:MiMo-V2-Pro以60.67分进入闭源模型前列,数学推理单项达到84.03分;开源版MiMo-V2-Flash得分49.97分,在代码生成等场景具备一定竞争力。

整体来看,国产模型表现亮眼,开源领域优势尤为明显。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型占据开源榜前三,显著领先海外同类型开源模型。

暂无评论

none
暂无评论...