中文大模型基准测评SuperCLUE发布3月结果: 豆包国内第一,跻身全球第一梯队

30 03月 2026

2026-03-30 22:11

【太平洋科技快讯】中文大模型基准测评SuperCLUE发布2026年3月最新结果，本次测评汇集22款国内外主流大模型，围绕数学推理、科学推理、代码生成等六大核心任务，全面检验模型综合能力。

从整体排名来看，海外头部闭源模型仍占据榜单前列，Anthropic Claude-Opus-4.6、Google Gemini-3.1-Pro-Preview、OpenAI GPT-5.4分列总分前三。字节跳动旗下豆包（Doubao-Seed-2.0-pro）以71.53分拿下国内模型第一，与GPT-5.4仅相差0.95分，正式进入全球第一梯队，并在智能体任务规划维度超越多款海外模型，跻身全球前五，体现出国产模型在复杂任务编排上的快速进步。

国产厂商方面，小米MiMo-V2系列两款模型均成功登榜。其中MiMo-V2-Pro以60.67分位居闭源模型中上游，数学推理单项得分84.03分，表现突出；开源版本MiMo-V2-Flash在代码生成等垂直场景展现出应用潜力。

本次测评结果显示，中文大模型已从“追赶”进入“并行”阶段，国产模型在通用能力逼近国际头部水平的同时，在中文理解、智能体、科学计算等方向逐步形成特色优势，为行业应用落地提供更扎实的技术支撑。