最新最快科技资讯

太阳能光伏网

OpenAI新模型幻觉问题加剧,准确性面临挑战

19 04月 2025

2025-04-19 07:55

OpenAI近期发布的o3和o4-mini模型在编程与数学等领域表现突出，但其“幻觉”问题却显著恶化。据外媒TechCrunch报道，这两款推理模型的幻觉频率不仅超过前代o1、o1-mini和o3-mini，甚至高于传统非推理模型。内部测试显示，o3在PersonQA基准测试中的幻觉率高达33%，而o4-mini更达48%。相比之下，前代模型o1和o3-mini的幻觉率分别为16%和14.8%。

这一反常现象表明，随着模型规模扩大，幻觉问题反而更加严重。Transluce实验室的测试发现，o3曾虚构出在MacBook Pro上运行代码的操作，尽管其并无此能力。OpenAI发言人Niko Felix承认，解决幻觉问题是当前研究的重点，公司正努力提升模型的准确性和可靠性。然而，这一挑战仍需进一步探索与突破。

最新相关

10 10月 2025

红旗越野车全球征名揭晓十强,"山河"暂居榜首

在2025上海车展完成全球首发的红旗首款豪华硬派越野车,近日公布征名活动十强名单。经过全球范围征集,"雄狮、昆仑、1927、山河、井冈山、九州、傲世、戎耀、今朝、观山"十个名称入围...

10 10月 2025

谷歌收紧远程办公政策

2025年10月10日,谷歌宣布调整其"随时随地工作"(WHA)政策,限制员工远程办公的灵活性。此次调整涉及全球范围内的员工,旨在推动更多人回归办公室。根据更新后的政策,员工每年只能在办公室以外的...

10 10月 2025

《海南自由贸易港旅游条例》12月施行

《海南自由贸易港旅游条例》于2025年9月30日经海南省七届人大常委会第二十次会议通过,将于2025年12月1日起施行。该《条例》专设"旅游开放与国际化"章节,聚焦国际旅游消费中心建设目标,在旅游...

10 10月 2025

朝阳区数字影棚项目正式开工

2025年10月10日,朝阳区平房地区集体产业项目暨机场二高速南侧产业项目(一期)正式开工。该项目位于北京市朝阳区平房地区,由阿里集团参与建设,将打造一座行业领先的数字影棚,成为北京城区高端影...

10 10月 2025

亚马逊云科技推出Agentic AI应用Quick Suite

2025年10月10日,亚马逊云科技发布全新Agentic AI应用Amazon Quick Suite。该应用旨在提升企业员工工作效率,改变信息获取与洞察方式,支持深度研究、任务自动化、数据可视化及跨应用操作。Amazo...

10 10月 2025

上海徐汇知春创新中心正式开业

10月9日上午,上海徐汇知春创新中心正式开业。活动在上海市徐汇区举行,由字节跳动创始人张一鸣与上海交通大学ACM班创始人俞勇教授共同发起。14名预备研究员及其家长出席仪式,上海徐汇区区长王...

10 10月 2025

宁德时代智能完成首轮融资估值破百亿

2025年10月10日,宁德时代旗下子公司CATL时代智能完成首次对外融资,融资额超20亿元,估值逾百亿。本轮融资由博裕投资、国泰君安、北汽产投、上海科创、孚腾资本等共同参与,资金将用于磐石底盘车...

10 10月 2025

红魔11 Pro配置曝光: 骁龙8 Elite Gen5加持,标配屏下摄像与3D超声波指纹

博主@数码闲聊站透露,即将发布的某高通骁龙8 Elite Gen5新机将采用直屏设计,支持屏下摄像头与3D超声波指纹识别,预计为红魔11 Pro。该机内置最大8000mAh电池,搭配24GB+1TB存储组合,配备水冷散...

10 10月 2025

全球首款四通道超低噪声单光子探测器量产

安徽省量子信息工程技术研究中心宣布,全球首款四通道超低噪声单光子探测器成功研制并投入量产。该设备在探测效率、暗噪声水平和集成度等关键指标上刷新世界纪录,标志着我国单光子探测技术迈入...

10 10月 2025

OpenAI发布研究报告称GPT-5为迄今"偏见最少"模型

OpenAI最新研究表明,GPT-5在其推出的Instant与Thinking版本中,政治偏见较GPT-4o降低30%,成为公司当前最中立的AI模型。该研究由"模型行为"团队主导,通过500个涵盖广泛政治议题的提示词进行测试...

10 10月 2025

马斯克与4名前推特高管达成9亿元和解

2025年10月10日,埃隆·马斯克及其旗下平台X(原推特)与4名前高管就遣散费纠纷达成和解,总额约1.28亿美元(约合人民币9亿元)。此次诉讼起因于2022年马斯克收购推特后大规模裁员,并被指未支付承诺...

10 10月 2025

菜鸟携手中兴建智能工厂获国家最高认证

2025年10月10日,菜鸟与中兴通讯联手打造的长沙超级智能工厂正式通过国家智能制造成熟度四级认证,达到当前最高等级。该工厂由长沙中兴智能技术有限公司与菜鸟联合建设,位于湖南长沙,旨在提升智...

10 10月 2025

小红书上线"为ta加热"新功能

2025年10月10日,小红书宣布推出薯条推广新功能"为ta加热"。该功能将于10月11日双11期间全量上线,支持所有用户为喜爱的笔记内容代投流量,无需博主授权。个人用户可针对笔记的阅读量、点赞收藏...

10 10月 2025

睡力矩阵获天使轮融资聚焦智能睡眠家具赛道

智能睡眠家具品牌睡力矩阵近日完成天使轮融资,投资方为追创创投。此次融资将主要用于产品研发、供应链优化及市场推广,进一步巩固其在智能睡眠领域的布局。睡力矩阵专注于通过科技手段提升用户...

10 10月 2025

本来生活发布2025中秋企业消费报告

10月10日,本来生活集团发布2025年中秋企业消费报告。数据显示,今年中秋期间企业福利及营销礼订单销售额同比增长超30%,消费履约高峰更为集中。报告指出,"健康""体验"与"文化审美"成为企业采购...

10 10月 2025

越秀集团完成收购香港人寿全部股份

2025年10月9日,广州越秀集团股份有限公司正式完成对香港人寿保险有限公司全部股份的收购。本次交易由海通国际证券有限公司担任买方财务顾问,并已获得香港保险业监管局批准,标志着越秀集团在保...

阅读更多

三位京都大学博士校友,一个发明了波格因仿生胶原,两个拿了诺奖: 这不是偶然

三位京都大学博士校友,一个发明了波格因仿生胶原,两个拿了诺奖: 这不是偶然

水晶光电换帅完成工商变更

水晶光电换帅完成工商变更

智元机器人公布躯干组件和机器人专利可提高机器人续航性能

智元机器人公布躯干组件和机器人专利可提高机器人续航性能

宇树科技沉浸式机器人遥操作专利获授权可使操作者身临其境

宇树科技沉浸式机器人遥操作专利获授权可使操作者身临其境

周大生、无忧传媒等在三亚成立文化科技公司注册资本5000万

周大生、无忧传媒等在三亚成立文化科技公司注册资本5000万

山姆超市在青岛成立新公司注册资本300万美元

山姆超市在青岛成立新公司注册资本300万美元

大疆部分产品国庆期间直降千元网友炸锅

大疆部分产品国庆期间直降千元网友炸锅

固态电池领域迎多重利好我国现存超122万家电池企业

固态电池领域迎多重利好我国现存超122万家电池企业

京东图书亮相中国国际漫画节发布"动漫共振计划"激励创作者成长

京东图书亮相中国国际漫画节发布"动漫共振计划"激励创作者成长

一群"数贸新生代"即将从义乌搅动全球

一群"数贸新生代"即将从义乌搅动全球

刘晓庆珠宝公司被限消

刘晓庆珠宝公司被限消

第138届广交会扬帆启航超3.4万家企业借跨境电商"东风"

第138届广交会扬帆启航超3.4万家企业借跨境电商"东风"