最新最快科技资讯
太阳能光伏网

中文大模型基准测评SuperCLUE发布3月结果: 豆包国内第一,跻身全球第一梯队

【太平洋科技快讯】中文大模型基准测评SuperCLUE发布2026年3月最新结果,本次测评汇集22款国内外主流大模型,围绕数学推理、科学推理、代码生成等六大核心任务,全面检验模型综合能力。

从整体排名来看,海外头部闭源模型仍占据榜单前列,Anthropic Claude-Opus-4.6、Google Gemini-3.1-Pro-Preview、OpenAI GPT-5.4分列总分前三。字节跳动旗下豆包(Doubao-Seed-2.0-pro)以71.53分拿下国内模型第一,与GPT-5.4仅相差0.95分,正式进入全球第一梯队,并在智能体任务规划维度超越多款海外模型,跻身全球前五,体现出国产模型在复杂任务编排上的快速进步。

国产厂商方面,小米MiMo-V2系列两款模型均成功登榜。其中MiMo-V2-Pro以60.67分位居闭源模型中上游,数学推理单项得分84.03分,表现突出;开源版本MiMo-V2-Flash在代码生成等垂直场景展现出应用潜力。

本次测评结果显示,中文大模型已从“追赶”进入“并行”阶段,国产模型在通用能力逼近国际头部水平的同时,在中文理解、智能体、科学计算等方向逐步形成特色优势,为行业应用落地提供更扎实的技术支撑。

最新相关

iPhone17或迎涨价,涨幅可能在5%至15%之间

[太平洋科技快讯]据爆料,苹果将下调iPhone 17系列市场出货预期,生产计划削减15%;同时,该机型售价或将上涨。下调出货预期、缩减产能规划,代表苹果根据市场需求预判调整备货节奏。该变动会直接...

iPhone18Pro系列国行版或将支持eSIM

[太平洋科技快讯]据爆料, iPhone 18 Pro、iPhone 18 Pro Max将取消双实体SIM卡方案,国行版本会改用实体SIM搭配eSIM的双卡组合。根据泄露文件标注显示,从V64 P2版本开始的机型不再兼容双PSIM卡...