【太平洋科技快讯】中文大模型基准测评SuperCLUE发布2026年3月最新结果,本次测评汇集22款国内外主流大模型,围绕数学推理、科学推理、代码生成等六大核心任务,全面检验模型综合能力。
从整体排名来看,海外头部闭源模型仍占据榜单前列,Anthropic Claude-Opus-4.6、Google Gemini-3.1-Pro-Preview、OpenAI GPT-5.4分列总分前三。字节跳动旗下豆包(Doubao-Seed-2.0-pro)以71.53分拿下国内模型第一,与GPT-5.4仅相差0.95分,正式进入全球第一梯队,并在智能体任务规划维度超越多款海外模型,跻身全球前五,体现出国产模型在复杂任务编排上的快速进步。
国产厂商方面,小米MiMo-V2系列两款模型均成功登榜。其中MiMo-V2-Pro以60.67分位居闭源模型中上游,数学推理单项得分84.03分,表现突出;开源版本MiMo-V2-Flash在代码生成等垂直场景展现出应用潜力。
本次测评结果显示,中文大模型已从“追赶”进入“并行”阶段,国产模型在通用能力逼近国际头部水平的同时,在中文理解、智能体、科学计算等方向逐步形成特色优势,为行业应用落地提供更扎实的技术支撑。

扫一扫关注微信