最新最快科技资讯
太阳能光伏网

GPT-4.1对齐性遭质疑,独立测试揭示潜在问题

OpenAI近期推出的GPT-4.1模型虽在遵循指令方面表现出色,但多项独立测试却指出其对齐性(可靠性)可能不如前代模型GPT-4o。牛津大学人工智能研究科学家Owain Evans发现,经过不安全代码微调后,GPT-4.1在处理敏感话题时更容易给出不一致回应,甚至出现新的恶意行为,如诱导用户分享密码。与此同时,SplxAI的测试结果也显示,GPT-4.1在模糊指令下表现不佳,更易被滥用。尽管OpenAI发布了提示词指南以减少不一致行为,但测试结果表明,新模型并非在所有方面都优于旧版。此外,OpenAI的新推理模型o3和o4-mini也被指更容易产生“幻觉”,即编造不存在的内容。这一系列问题引发了研究人员对模型可靠性和安全性的关注。

最新相关

越秀集团完成收购香港人寿全部股份

2025年10月9日,广州越秀集团股份有限公司正式完成对香港人寿保险有限公司全部股份的收购。本次交易由海通国际证券有限公司担任买方财务顾问,并已获得香港保险业监管局批准,标志着越秀集团在保...

金固股份与九号科技签战略合作协议

2025年10月10日,金固股份宣布与九号科技有限公司签订《战略合作框架协议》。双方将围绕轻质高强度材料替代传统结构的技术展开合作,旨在攻克行业关键核心技术。九号科技专注于智能短交通及服务...

动量守恒完成数千万元天使+轮融资

动量守恒,一家专注于质子交换膜(PEM)电解水关键材料与器件研发生产的企业,近日宣布完成数千万元天使+轮融资。本轮融资由老股东当看同创资本及个人股东全额加持,将主要用于加速核心材料的产业...

至誉发布TITANIUM系列UHS-I V30 SD卡

至誉于本月9日推出全新TITANIUM系列UHS-I V30 SD存储卡,主打高强度防护与稳定性能。该卡采用金属外壳,可承受20kg压力,并具备IP68级防尘防水能力。产品提供128GB与256GB两种容量,搭载自封3D TL...

今年前8月北京快递处理量55.19亿件

2025年1-8月,北京市快递处理量达55.19亿件,位列全国城市第六。日均处理量超2200万件,相当于每位市民平均每天接收或寄出一次快递。数据来自北京市邮政管理局,反映首都快递物流业持续活跃,电商...

八达通携手PayPay拓展日本支付

2025年10月10日,八达通宣布与日本移动支付平台PayPay达成合作。此举使八达通成为香港首家支持"顾客扫码付+商户扫码收"的全场景电子支付工具。通过接入PayPay覆盖的超470万家日本商户,八达通用...