马斯克旗下xAI推出新一代大语言模型Grok 4.1,现已面向官网、社交平台及移动端用户全面开放。此次更新重点提升模型在真实场景中的实用性,在继承前代高可靠性的基础上,大幅增强了创造性、情感理解与协作互动能力。
性能方面,Grok 4.1在大型语言模型竞技场文本能力排行榜中表现突出,其深度思考版本以1483的Elo分数位列第一,即时响应版本也以1465分位居第二。同时,该模型在情感理解基准测试EQ-Bench3中包揽前两名,在创意写作测试中亦名列前茅。值得关注的是,新版本通过专项优化显著降低了事实性幻觉率,使模型在信息...

扫一扫关注微信