最新最快科技资讯
太阳能光伏网

AI挑战《超级马力欧兄弟》: Claude表现优异

加利福尼亚大学圣地亚哥分校的Hao人工智能实验室上周五开展了一项独特研究,将AI引入经典游戏《超级马力欧兄弟》,以测试其性能。结果显示,Anthropic的Claude 3.7表现最为出色,紧随其后的是Claude 3.5,而谷歌的Gemini 1.5 Pro和OpenAI的GPT-4o则表现不佳。

实验并非使用1985年最初发布的版本,而是通过自主研发的GamingAgent框架在模拟器中进行。GamingAgent向AI提供基本指令和游戏截图,AI则生成Python代码操控马力欧。研究人员发现,推理模型如OpenAI的o1表现不如“非推理”模型,主要因为它们需要数秒时间来决定行动,而《超级马力欧兄弟》中时机至关重要。

尽管游戏一直是衡量AI性能的重要工具,但一些专家质疑将游戏表现与技术进步直接挂钩的做法。游戏环境相对简单且抽象,能够为AI训练提供无限数据。不过,观看AI玩马力欧本身也是一种有趣的体验。

最新相关

广西启动防汛四级应急响应应对强降雨

6月8日,广西壮族自治区防汛抗旱指挥部针对柳州、桂林、百色、河池市启动防汛四级应急响应。据气象预报,8日至10日,桂北和桂西将有较强降雨,累计雨量50至150毫米,局地超180毫米,并伴有短时强降...

2025粤港澳大湾区车展成交金额破百亿

6月8日,2025粤港澳大湾区车展闭幕。展会历时9天,吸引约89万人次观展,预定成交车辆42823辆,成交金额达100.7亿元。本届车展规模达26万平方米,其中8万平方米用于互动体验区,集中展示产业创新技术...

哥伦比亚发生6.4级地震

6月8日,哥伦比亚地质局报告称,该国发生6.4级地震。目前暂无人员伤亡和财产损失的具体报告,相关部门正进一步评估震情及影响。免责声明: 本文内容由开放的智能模型自动生成,仅供参考。

中际旭创确认1.6T产品二季度出货量将持续增长

6月8日,中际旭创在互动平台回应投资者提问时表示,公司1.6T产品二季度出货量将持续增长。这一消息表明中际旭创在高速光模块领域的市场表现正在稳步提升,进一步巩固其行业地位。免责声明: 本文...

国产具身大模型首次实现汽车制造全场景验证

近日,智平方与东风柳汽达成战略合作,国产具身大模型首次在汽车制造领域完成全场景验证。此举标志着我国AI技术在工业应用方面取得新突破。同时,2025全球人工智能技术大会在杭州召开,进一步探讨...