一项由Salesforce人工智能研究院参与的研究显示,当前主流生成式AI搜索引擎及深度研究智能体在回答问题时,普遍存在引用不实或缺乏支持的情况。研究团队测试了GPT-4.5、GPT-5、You.com、Perplexity和必应聊天等工具,发现约三分之一的回答主张缺乏可靠来源,其中GPT-4.5达47%,而Perplexity的深度研究功能更高达97.5%。研究人员通过“DeepTrace”评估体系分析303个查询,涵盖争议性话题与专业领域。部分专家指出,AI标注方式和统计方法存在局限,但结果仍凸显提升答案准确性与信息溯源的紧迫性。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。