最新最快科技资讯
太阳能光伏网

AI搜索引擎准确性堪忧: 研究揭示高错误率

哥伦比亚大学数字新闻研究中心近期对八款AI搜索引擎进行了深入研究,包括ChatGPT Search、Perplexity及其付费版、Gemini、DeepSeek Search、Grok-2和Grok-3 Search以及Copilot。研究人员从20家新闻机构随机挑选了200篇报道,确保这些文章在谷歌搜索中排名靠前,随后用相同的查询方式测试各AI工具的准确性和引用情况。

结果显示,除Perplexity及其付费版外,其他AI引擎的表现普遍不佳。整体来看,AI提供的答案有60%不准确,且它们往往以绝对肯定的语气陈述错误信息,加剧了问题的严重性。例如,ChatGPT Search虽然回答了所有200个查询,但其完全正确率仅为28%,完全错误率却高达57%。相比之下,X旗下的Grok-3 Search错误率更是达到了惊人的94%。

微软的Copilot也表现欠佳,在200次查询中有104次拒绝作答,而剩下的96次中,仅16次完全正确,总体错误率接近70%。尽管这些问题存在,相关公司并未公开承认,仍继续向用户收取高额订阅费用。

最新相关

鸿蒙智行 10 月交付新车 68216 台

今晚,鸿蒙智行通过官微宣布: 10 月交付情况创下双项纪录: 单月交付新车 68216 台,创单月交付量历史新高。全系累计交付已突破 100 万台,创新势力品牌最快达成百万交付纪录,当月成交均价 39 万...

全新宝马M3旅行版上市 售价94.39万元

在2025 BMW M热血嘉年华上,全新宝马M3旅行版正式亮相并宣布上市,售价为94.39万元。新车搭载被誉为"六缸机皇"的3.0T双涡轮增压直列六缸发动机,最大功率达530马力,峰值扭矩650牛·米,匹配8速M S...

英国报告脑膜炎病例上升

2024年10月31日,英国卫生安全局发布报告显示,2024/2025年度英格兰侵袭性脑膜炎球菌病确诊病例较往年有所增加。该病虽罕见,但可能导致严重健康后果甚至死亡。高风险人群主要为儿童和年轻人,尤...

AMD确认Zen 5架构存在RDSEED指令缺陷

AMD近日发布公告,确认其Zen 5架构处理器存在RDSEED指令异常问题,可能导致该指令错误返回0值并标记为成功执行,影响随机数生成的可靠性。此问题被评定为"高严重性",关乎系统安全与数据完整性。...

机构调研周报: 联影医疗最受关注

本周,机构共调研425家上市公司。联影医疗成为最受关注企业,获317家机构参与调研。兆易创新、金盘科技、蓝思科技均获超200家机构调研。欧科亿以13次被调研次数居首,杰瑞股份、金风科技、芳源股...

2025年9月全国新增新能源项目7218个

2025年9月,全国新增建档立卡新能源发电项目(不含户用光伏)共7218个。其中,风电项目32个,光伏发电项目7184个,包括集中式34个、工商业分布式7150个,生物质发电项目2个。此次新增项目主要集中于...

金隅冀东: 2026年水泥需求或下降

2025年11月1日,金隅冀东在机构调研中表示,预计2026年水泥需求总体呈下降趋势。作为"十五五"开局之年,重大基建项目有望前置,传统与新型基建、城镇化及城市更新将支撑部分需求。公司认为,随着供...