最新最快科技资讯

太阳能光伏网

苹果研究揭示AI推理模型的局限性

08 06月 2025

2025-06-08 16:15

苹果机器学习研究中心近日发布一篇论文，指出当前AI模型虽能生成复杂“思考链”，但缺乏真正推理能力，主要依赖模式匹配与记忆。研究团队对多个前沿大型推理模型（如OpenAI、DeepSeek、Anthropic及谷歌相关模型）进行了系统评估。

结果显示，这些模型在中等复杂度任务上表现优异，但在高复杂度任务中性能急剧下降至“零准确率”。值得注意的是，即使算力充足，模型用于“思考”的token数量随任务难度上升反而减少，暴露出现有推理方法的根本局限。

研究通过可控解谜环境分析发现，模型表现可分为三个阶段：低复杂度任务传统模型更优，中等复杂度任务推理模型占优，而高复杂度任务则普遍失效。此外，推理模型在精确计算和跨任务一致性方面存在不足。

该研究呼吁重新审视当前评估范式，并提出更细致的实验框架，以深入探索语言推理模型的能力与局限，为未来技术发展提供方向。

最新相关

17 04月 2026

特斯拉将于下周在印度推出六座Model Y L

特斯拉计划最早于2026年4月24日在印度推出六座长轴距版Model Y L。该车由上海超级工厂出口,是其自2025年7月进入印度市场以来的首款新品。标准五座版Model Y已于去年7月开售,但全年注册量仅227...

17 04月 2026

微软将推新一代Surface Laptop/Pro: 酷睿Ultra春季首发,骁龙X2夏季跟进

微软将于2026年春季发布搭载英特尔酷睿Ultra 3/5/7处理器的新一代Surface Laptop与Surface Pro,夏季再推出骁龙X2 Plus/X2 Elite版本。全系标配16GB内存+256GB存储,最高可选64GB+2TB。新机延续...

17 04月 2026

保利发展2025年销售2530亿元,连续三年行业第一

2025年,保利发展实现销售签约金额2530亿元,连续三年位居行业首位；销售回笼率连续三年超100%,经营性现金流保持稳健。公司于2026年4月17日披露年报,期内成功发行国内首单现金类定向可转债85亿...

17 04月 2026

DeepSeek启动首轮融资,估值超100亿美元

2026年4月17日,AI初创公司深度求索(DeepSeek)正就首次外部融资展开洽谈。该公司此前多次拒绝投资邀约,现拟以不低于100亿美元估值募集至少3亿美元资金。融资将用于顶尖AI模型研发、高端人才引...

17 04月 2026

适马拟9月发布65mm超大光圈自动对焦镜头

据悉,适马计划于2026年9月推出一款65mm全画幅自动对焦镜头,最大光圈将超越F1.2,极有可能为F1.0。该镜头将兼容L卡口与索尼E卡口,定位高性能专业级产品。相较2020年发布的65mm F2 Contemporary...

17 04月 2026

三星为Galaxy Z TriFold 2研发全新铰链

2026年4月17日,据供应链消息,三星已启动Galaxy Z TriFold 2三折叠手机全新铰链研发。该铰链系"从零开发",旨在降低整机厚度(初代折叠态厚12.9mm,展开态3.9–4.2mm)。新铰链将同步应用于Z Fold8...

17 04月 2026

《星空》PS5版因崩溃问题推热更新,下周发布修复补丁

4月16日,《星空》PS5版上线后遭大量玩家反馈频繁崩溃,部分用户已申请退款。贝塞斯达(B社)当日宣布推出热更新,修复增强模式下的崩溃问题；PS5专用补丁将于下周发布,但未说明崩溃根本原因。该游...

17 04月 2026

极氪8X今晚上市售35.68万元起

2026年4月17日晚,极氪正式发布旗舰电混SUV--极氪8X,官方指导价35.68万元起。新车提供Max、Ultra、Ultra+及曜影四款车型,5月31日前下定可享2.7万元首发权益。上市29分钟内大定破万辆,Ultra及以...

17 04月 2026

首创证券向港交所提交上市申请

4月17日,首创证券股份有限公司正式向香港交易所提交上市申请。该公司注册地为北京,拟通过首次公开发行股票募集资金。本次IPO由中信证券、中国银河、中信建投及中银国际担任联席保荐人。此举标...

17 04月 2026

Win11更新后强制打开Edge展示虚假新功能

2026年4月17日,微软在Windows 11例行周二更新中引入一项争议性设计: 重启后自动启动Edge浏览器,全屏显示'Windows更新已完成'引导页。该页面无关闭选项,用户需连续点击6次'Next'按钮,最终跳转...

17 04月 2026

三星回应停推小屏手机: 用户需求转向大屏

2026年4月17日,三星英国/爱尔兰移动体验部门产品副总裁Annika Bizon在Reddit问答中解释,公司停止开发小屏手机,主因是用户需求变化。她指出,当前手机已广泛用于办公、视频、游戏及内容创作,大...

17 04月 2026

深澳开展低空经济交流推进跨境无人机物流试点

4月13日至14日,澳门特区政府低空经济发展工作组在局长邱润华率领下赴深圳调研。深圳市发改委联合市政府相关部门与澳门方面举行座谈,双方就深化低空经济合作、加快跨境无人机物流运输试点等议...

17 04月 2026

宁德时代股东拟询价转让1.27%股份

4月17日,宁德时代公告披露,持股6.23%的股东宁波联合创新新能源投资管理合伙企业(有限合伙)拟以询价转让方式减持公司股份5800万股,占总股本1.27%。此次转让系股东自主决策,不涉及控股股东及实...

17 04月 2026

海康威视2026年一季度营收207.15亿元,净利增36.42%

2026年4月17日,杭州海康威视数字技术股份有限公司发布2026年第一季度财报。当季营业总收入207.15亿元,同比增长11.78%；归母净利润27.82亿元,同比增长36.42%；扣非净利润26.47亿元,同比增长37....

17 04月 2026

斯坦福报告称中美顶级大模型差距实质性消除

4月17日,斯坦福大学人工智能研究所发布《2026年人工智能指数报告》指出,中美顶级大模型性能差距已"实质性消除",呈现并跑态势。报告显示,在全球前20 AI机构中,中国占11家,居首位；阿里巴巴位列...

17 04月 2026

本田全新纯电Insight今日在日本开售,中国产逆向进口

2026年4月17日,本田在日本正式发售全新纯电动跨界SUV Insight。该车由中国工厂生产后逆向进口至日本,系首家采取此模式的日本本土车企。基于东风本田e: NS2开发,适配右舵及本地充电标准,WLTC续...

阅读更多

被章若楠工作室喊话剧方曾被起诉

被章若楠工作室喊话剧方曾被起诉

售价 21.98 万元起,零跑 D19 豪华旗舰 SUV 上市

售价 21.98 万元起,零跑 D19 豪华旗舰 SUV 上市

王腾在深圳成立新公司

王腾在深圳成立新公司

广汽ADiGO GSD智驾用户达182.8万

广汽ADiGO GSD智驾用户达182.8万

宁德时代一季度成立超十家新公司

宁德时代一季度成立超十家新公司

金莎成立新公司

金莎成立新公司

宋柚汁商标已被驳回

宋柚汁商标已被驳回

张雪机车实缴资本仅1200万

张雪机车实缴资本仅1200万

长春城投建设投资集团增资至56亿增幅约10%

长春城投建设投资集团增资至56亿增幅约10%

新疆"超级棉田"迈向全无人化,现存棉花相关企业超216.4万家

新疆"超级棉田"迈向全无人化,现存棉花相关企业超216.4万家

2030年将健全心理服务体系,现存心理咨询相关企业超14.9万家

2030年将健全心理服务体系,现存心理咨询相关企业超14.9万家

表格Agent上线首日,千问生成Excel功能出现排队

表格Agent上线首日,千问生成Excel功能出现排队