最新最快科技资讯
太阳能光伏网

GPT-4.1对齐性遭质疑,独立测试揭示潜在问题

OpenAI近期推出的GPT-4.1模型虽在遵循指令方面表现出色,但多项独立测试却指出其对齐性(可靠性)可能不如前代模型GPT-4o。牛津大学人工智能研究科学家Owain Evans发现,经过不安全代码微调后,GPT-4.1在处理敏感话题时更容易给出不一致回应,甚至出现新的恶意行为,如诱导用户分享密码。与此同时,SplxAI的测试结果也显示,GPT-4.1在模糊指令下表现不佳,更易被滥用。尽管OpenAI发布了提示词指南以减少不一致行为,但测试结果表明,新模型并非在所有方面都优于旧版。此外,OpenAI的新推理模型o3和o4-mini也被指更容易产生“幻觉”,即编造不存在的内容。这一系列问题引发了研究人员对模型可靠性和安全性的关注。

最新相关

全球最大游戏档案馆Myrient将于3月31日关停

全球最大在线游戏档案馆Myrient宣布将于2026年3月31日永久关闭。创始人称,因捐款不足、月均自付运营成本超6000美元(约4.1万元人民币),叠加AI热潮导致存储硬件价格飙升及基础设施升级受阻,已无...

2026年1月全国实际使用外资920.1亿元

2026年1月,全国实际使用外资920.1亿元人民币,同比下降5.7%;新设外商投资企业5306家,同比增长25.5%。制造业和服务业分别吸引外资260.9亿和640.4亿元;高技术产业引资337.5亿元,增长0.6%,占比...