最新最快科技资讯
太阳能光伏网

AI巨头用《精灵宝可梦》测试模型推理能力

2026年1月,谷歌、OpenAI与Anthropic等公司正以《精灵宝可梦》系列游戏为测试平台评估大模型性能。Anthropic负责人David Hershey每日直播用Claude游玩该游戏,旨在检验其逻辑推理、风险评估与长期规划能力。受此启发,开发者陆续开展Gemini、GPT等模型的同类测试。目前Gemini与GPT已通关《宝可梦蓝》,Claude尚未通关。该方法因非线性流程与多维度决策特性,成为量化分析AI能力边界的新型评估手段。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新相关

微软发现能源公司遭AiTM攻击窃取凭证

近日,微软Defender安全团队披露一起针对多家能源公司的中间人(AiTM)攻击事件。黑客通过社会工程获取首个员工账户('零号账户'),绕过多因素认证,窃取内部邮箱权限及会话Cookie。随后发送伪装Sha...

1月26日零时起全国铁路启用新运行图

自2026年1月26日零时起,全国铁路实行新的列车运行图。此次调图新增图定旅客列车243列、货物列车177列,总分别达12130列和23748列。新图充分运用包银、西延、沪渝蓉沿江高铁等新开通线路能力,优...

北京越野BJ40燃油巨幕版1月27日上市

北京越野官方宣布,BJ40燃油巨幕版将于2026年1月27日正式上市。新车定位为现款BJ40的升级版本,主要面向追求科技感与硬派风格的用户。外观延续经典越野造型,新增活力橙车漆,并采用黑橙撞色设计...

蔚来乐道本月将增投超8000块换电电池

1月24日,蔚来旗下乐道汽车宣布,其'全国换电站电池翻倍计划'进度已达91.36%,累计增投新电池超7309块。计划于1月31日前完成超8000块电池增投目标,实现换电站单站平均电池数量翻倍。此举旨在提升...

颀中科技全资子公司苏州厂区发生火灾

1月25日,颀中科技公告其全资子公司苏州颀中厂区凸块制程段发生火灾。事故未造成人员伤亡,但导致部分无尘室及设备受损。目前原因正在调查,损失正评估中。公司已投保财产险,理赔工作有序推进。...

长久物流预计2025年净亏损5000万-7500万元

1月25日,长久物流发布业绩预告称,预计2025年归属于上市公司股东的净利润为亏损5000万元至7500万元。上年同期为盈利7956.55万元。公司表示,业绩变动主要受国内汽车物流市场需求放缓、运价承压...