最新最快科技资讯

太阳能光伏网

AI办公任务准确率不足25%,难替代知识工作者

26 01月 2026

2026-01-26 10:53

1月24日，训练数据公司Mercor发布研究报告称，主流AI模型在真实办公场景多步骤任务中准确率最高仅24%。研究采用新基准APEX-Agents，模拟律师、顾问等职业工作流，要求跨邮件、PDF、表格等多源信息协同处理。Gemini 3 Flash与GPT-5.2分列前两位，但均未超25%；多数模型低于20%。Mercor CEO指出，AI因上下文整合能力薄弱，易混淆或放弃任务，目前仅堪比“不可靠实习生”。相较一年前5%-10%的水平，准确率已显著提升，但距胜任复杂知识工作仍有明显差距。

免责声明：本文内容由开放的智能模型自动生成，仅供参考。

最新相关

26 01月 2026

元宝内测社交AI玩法"元宝派",腾讯发力社交AI新赛道

1月26日,腾讯旗下AI助手"元宝"低调开启"元宝派"玩法内测。用户可以在"元宝派"中一起看电影,听音乐,连麦打游戏,而元宝AI则会作为派成员丰富用户之间的互动。此举标志着腾讯正将AI战局拉入自身...

26 01月 2026

AI日程助手Blockit获500万美元种子轮融资

2026年1月,AI日程安排工具Blockit宣布完成500万美元种子轮融资,红杉资本等机构参与投资。该公司成立于2025年,总部位于美国,专注于研发基于AI Agent的日程管理产品,可实时理解用户习惯并提供全...

26 01月 2026

SwitchBot为Keypad Vision门锁推紧急固件修复电量异常问题

1月21日,智能家居厂商SwitchBot发布Keypad Vision智能门锁Ver.24.15固件更新。该更新修复三项关键问题: 剩余电量显示不准、低电量通知失效及功耗异常升高。三者叠加曾导致门锁在无预警下突然...

26 01月 2026

喜茶2025年在海外开出100多家门店

2025年,喜茶已在海外32个城市开出100多家门店,成为全球门店分布范围最广的新茶饮品牌。

26 01月 2026

DQ在华门店数已达1,800多家

2025年,DQ全年单店销售额同比、品牌营收及品牌利润均超过双位数的增长。这一强势表现得益于DQ积极的门店升级与产品创新策略。截至2025年12月,DQ在华门店数已达1,800多家,其中250多家为宠物友...

26 01月 2026

奥乐齐在华门店数量已达95家

德国零售企业奥乐齐24日在南京连开4店。至此,奥乐齐在华门店数量已达95家。按照计划,今年一季度末,奥乐齐在华门店数将突破百家。

26 01月 2026

欧莱雅拟投3.83亿美元在印度设立技术中心

法国化妆品公司欧莱雅周三表示,将在印度南部城市海得拉巴设立一个技术中心,初始投资将超过350亿卢比(约合3.8341亿美元)。

26 01月 2026

阿尔法·罗密欧推翻纯电路线,新Giulia/Stelvio延至2028年发布

1月23日,阿尔法·罗密欧CEO圣托·菲奇利宣布,因市场与法规现实调整,新一代Giulia和Stelvio将放弃单一纯电路线,转而采用STLA Large平台,支持燃油、插混及增程等多种动力形式。此举涉及平台、电...

26 01月 2026

安徽墨甲智创机器人公司新增股东并增资

1月21日,安徽墨甲智创机器人科技有限公司完成工商变更,新增伯特利、富春染织及智元创新(上海)科技股份有限公司为股东,注册资本由1亿元增至约1.04亿元。该公司由奇瑞汽车于2025年1月设立,专注...

26 01月 2026

味好美第四季度营业收入3.11亿美元

味好美公司(McCormick & Company)公布截至2025年11月30日的第四季度及全年财务业绩。第四季度营业收入为3.11亿美元(约合人民币21.69亿元),净销售额同比增长3%。2025年全年营业收入为10.71...

26 01月 2026

唯卓仕首款L卡口镜头将于2月5日发布

2026年2月5日,国产镜头厂商唯卓仕将正式发布其首款L卡口镜头。该镜头预计为16mm F/1.8超广角大光圈定焦,面向全画幅及APS-C画幅无反相机。此举标志着唯卓仕自2025年9月加入L卡口联盟后的首次硬...

26 01月 2026

Keychron发布V Ultra 8K三模机械键盘

1月23日,Keychron正式推出V Ultra 8K系列三模机械键盘(V1/V3/V5),售价114.99–119.99美元。该键盘搭载ZMK固件,支持蓝牙/2.4GHz/有线三模连接,无线续航达660小时。采用Gasket结构、Silk POM轴...

26 01月 2026

追觅科技送10名员工赴南极旅游

1月25日,追觅科技创始人俞浩宣布,公司已组织10名优秀员工乘飞机直达南极冰面跑道开展旅行,并计划向南极极点进发。此举旨在践行'去最远的地方'理念,筹备历时超半年,非临时炒作。同期,追觅科技...

26 01月 2026

顺丰恒通支付公司增资至3亿增幅200%

天眼查工商信息显示,近日,顺丰恒通支付有限公司发生工商变更,注册资本由1亿人民币增至3亿人民币,增幅200%,同时,部分主要人员发生变更。顺丰恒通支付有限公司成立于2011年4月,法定代表人为OOI ...

26 01月 2026

超200家奢品大牌万款马年新品天猫首发

2026年1月,正值马年春节前夕,江诗丹顿、宝格丽、GUCCI、PRADA等全球200家奢侈品牌在天猫年货节集中首发逾1万款马年生肖限定及农历新年新品。新品涵盖腕表、珠宝、服饰、配饰等全品类,价格从千...

26 01月 2026

现象光伏完成A轮融资,聚焦钙钛矿产业化应用

1月26日,钙钛矿新材料企业现象光伏宣布完成A轮融资,由南山战新投、普乐创投联合投资。公司依托自研功能材料、定制化制备方案及高通量AI新材料开发平台,加速推进钙钛矿材料在光伏组件、建筑光...

阅读更多

福特又一新专利曝光!可有效提升皮卡尾箱载货能力

福特又一新专利曝光!可有效提升皮卡尾箱载货能力

最重要卖点没了!加拿大车主买到无快充口的现代IONIQ 5

最重要卖点没了!加拿大车主买到无快充口的现代IONIQ 5

AWE 2023聚焦: 创维全新壁纸电视A7D系列首发亮相

AWE 2023聚焦: 创维全新壁纸电视A7D系列首发亮相

夏普全品类产品亮相AWE2023 大秀多领域技术创新力

夏普全品类产品亮相AWE2023 大秀多领域技术创新力

现代汽车将退出俄罗斯业务?官方回应: 正审查各种方案

现代汽车将退出俄罗斯业务?官方回应: 正审查各种方案

大众第一特斯拉第十 2022年联网汽车市场销量排名公布

大众第一特斯拉第十 2022年联网汽车市场销量排名公布

蔚来用户累计行驶里程超100亿公里省下约70亿元油费

蔚来用户累计行驶里程超100亿公里省下约70亿元油费

新款林肯冒险家或5月18日上市预售24.58万-34.58万元

新款林肯冒险家或5月18日上市预售24.58万-34.58万元

奇瑞瑞虎9 4月30日正式开启预售车长4.82米轴距超2.8米

奇瑞瑞虎9 4月30日正式开启预售车长4.82米轴距超2.8米

杭州: 五一假期西湖景区实施机动车单双号限行临时管控措施

杭州: 五一假期西湖景区实施机动车单双号限行临时管控措施

充电5分钟续航200公里!长沙将建首座光储充超级充电站

充电5分钟续航200公里!长沙将建首座光储充超级充电站

1119辆新能源车准备运往欧洲比亚迪、上汽名爵等品牌

1119辆新能源车准备运往欧洲比亚迪、上汽名爵等品牌