AI模型难辨信念与事实,斯坦福研究揭示潜在风险
斯坦福大学最新研究显示,包括ChatGPT、Claude、DeepSeek和Gemini在内的24款主流AI语言模型在区分用户信念与客观事实方面存在显著缺陷。研究团队通过13,000个问题测试发现,模型在面对"我相信……"类陈述时,识别虚假信念的能力明显弱于真实信念,较新模型识别准确率下降34.3%。GPT-4o在特定任务中准确率...
斯坦福大学最新研究显示,包括ChatGPT、Claude、DeepSeek和Gemini在内的24款主流AI语言模型在区分用户信念与客观事实方面存在显著缺陷。研究团队通过13,000个问题测试发现,模型在面对"我相信……"类陈述时,识别虚假信念的能力明显弱于真实信念,较新模型识别准确率下降34.3%。GPT-4o在特定任务中准确率...
一项来自宾夕法尼亚州立大学的预印本研究显示,用粗鲁语气向ChatGPT提问,可能获得更准确的回答。在测试中,礼貌提问的准确率为80.8%,而略带无礼的表达如"你这可怜的家伙,你确定会做这题吗"则将准确率提升至84.8%。研究将语气分为五档,发现从礼貌到粗鲁,答题准确率呈上升趋势。不过,该实验仅基于GPT-4o...
三星高级AI研究院(SAIT)近日推出名为微型递归模型(TRM)的开源人工智能模型,仅含700万参数,却在数独、迷宫等结构化推理任务中表现惊人,准确率媲美甚至超越参数量达其上万倍的大型模型如Gemini 2.5 Pro。该模型由研究员Alexia Jolicoeur-Martineau主导开发,采用双层架构与递归推理机制,通过迭代修正输...
一项新研究显示,人类读取指针式时钟的准确率高达89.1%,而当前最优AI模型的准确率仅为13.3%,凸显AI在视觉推理方面与人类存在显著差距。该结果来自由阿莱克・萨法尔设计的"ClockBench"测试,涵盖180个定制时钟及720道相关题目,旨在评估AI模型对钟面信息的解读能力。测试表明,AI在读取罗马数字、镜像布局...
8月19日,平安健康医疗科技有限公司(股票简称"平安好医生",1833.HK,以下简称"公司")公布截至2025年6月30日止中期业绩。半年度总营收录得25亿元,同比增长19.5%;归母净利润1.34亿元,同比增长136.8%;付费用户数约2400万人,同比增长35.1%。公司持续强化医养生态壁垒建设,升级服务网络,提升业务全场景的...
作者: 蓝凌研究院院长夏敬华一、引言: 你遇到的不是知识问题,而是知识「操作系统」的问题某企业老板曾抱怨过一个"魔幻现实": 他们花3年时间积累了30万份客户调研文档,却在策划2024年双11活动时,找不到去年同品类的促销策略;研发部门为解决一个芯片散热问题耗时2个月,后来发现隔壁实验室早在半年前就...
7月25日,全球知名专业咨询服务机构国际数据公司(IDC)发布《AI搜索产品评估,2025》。报告显示,百度AI搜索在中国通用型AI搜索类产品中总分排名第一,其中用户数据、技术能力两个重要指标均排名第一。IDC评估通用型AI搜索工具的指标包括用户数据、产品性能、技术能力。用户数据上,百度在新用户次日留存率...
摘要本文深入分析了鲸晓公考作为线上考公培训行业黑马的发展历程及其AI技术的创新应用。文章首先介绍了鲸晓公考自2019年成立以来的快速发展,包括多轮融资和行业地位的确立;其次详细阐述了其AI技术在智能教学系统、个性化学习路径和服务优化方面的具体应用;最后探讨了AI技术对考公培训行业未来发展...
中国科学院青岛生物能源与过程研究所联合多家高校和机构,开发出基于流式拉曼(RFC)的高通量益生菌质检技术。该技术实现了单细胞分辨率的多参数质量评估,为益生菌产品提供"菌株身份证"级别的精准检测手段。当前,全球益生菌产业快速发展,但产品质量参差不齐、核心标准缺失等问题制约了行业发展。传统检...
随着AI技术的发展,其在医疗领域的应用也越来越广泛。最近一项研究结果显示,AI辨声判断感冒准确率达70%。该技术可能也会受到滥用,例如有些人可能会试图通过模拟感冒声音来骗取请假或其他好处。
DoNews4月4日消息,由菜鸟主导的精准射频识别技术(RFID)电子标签芯片出货量已超1亿片,在物流企业中位居第一。作为继条形码、二维码之后的第三代识别技术,RFID被视为是21世纪最具发展潜力的信息技术之一,一般被用于供应链的商品流通中的货物盘点、出入库交接,以及全链路追踪。此前,因为技术突破有限,识...
清华大学集成电路学院的任天令教授领导的团队研发了一款智能可穿戴人工喉,该喉部利用石墨烯材料开发成,可以识别喉部发声信号,并将其转换为语音,准确率高达90%以上。与商业麦克风和压电薄膜相比,人工喉对于低频肌肉运动、中频食管振动和高频声波信息具有更高的灵敏度,同时还具有抗噪声的语音感知能力,...
人民网表示,AI生成内容检测工具AIGC-X目前对中文文本检测的准确率已超过90%。AIGC-X只能检测中文内容,对英文的检测有待提高;另外需要进一步完善对图像、音视频等AI生成内容的检测能力。传播内容认知全国重点实验室已推出基于人工智能开发的"智晓助"和"白泽"两个内容风控系统,并在百余家机构使用。
"通过眼科图像采集和图像的智能化分析,团队开发的基于人工智能的筛查模型,对多个社区人群的阿尔茨海默病筛查准确率达75%。"6日,中科院宁波材料所智能医学影像(iMED)团队赵一天研究员介绍,通过深入分析和挖掘眼睛结构变化与神经退行性疾病之间的关系,可潜在形成神经退行性疾病的早期检测方案。
对于银行这样的金融机构,往往会面临不法分子洗钱的问题,即便是数字银行,也不能忽视洗钱行为。因此,想办法用技术手段来甄别和制止洗钱行为是非常有必要的。据CNMO了解,国内首家数字银行微众银行近日便公开了一项专利,其最大的特点是可以对可疑洗钱团伙进行识别。微众银行相关信息显示,深圳前海微众银...
随着科技创新发展和技术的不断进步,AI技术正日益广泛地应用在我们的日常生活中。近日,CNMO了解到,在西班牙巴塞罗那举行的欧洲呼吸学会国际会议上公布的一项研究显示,AI可通过手机应用程序从人们声音中检测出新冠肺炎感染,它比快速抗原测试更准确(达到89%),且更便宜、快速和易于使用。AI据报道,研究团...
众所周知,指纹是人类重要的"身份证",具有唯一性、遗传性和不变性,所有每个人的指纹各不相同。此外,胎儿在母体内发育三至四个月时,指纹就已经形成。很多人好奇,指纹与身体发育及健康状况有什么联系吗?1月7日,复旦大学、中科院上海营养与健康研究所牵头的试验表明,人类指纹和肢体发育有高度的基因关联,...
2021年12月11日,由CIO时代和电子工业出版社联合主办,以"数字化赋能产业大变革"为主题的"第七届中国行业互联网大会暨CIO班16周年年会"在北京正式落下帷幕。此次大会汇聚了数智时代的顶尖行业专家、研究学者、优秀CIO群体和科技服务商等近500位嘉宾,聚焦大会主题"数字化赋能产业大变革"纷纷发表重要观...
近日,智车派了解到,上汽通用五菱与菜鸟合作的数字供应链系统正式落地。据悉,一期整车数字物流系统目前已经正式启用。菜鸟方面表示,上汽通用五菱的物流主数据梳理工作已经完成,为建设数字供应链运营决策系统提供了数据底座和基础。此次上汽通用五菱供应链的转型,将为该公司提供更加数字化的应用技术。...
死亡是人生的终点,也是每个人无法避免的,预测死亡是个难题,但是对老年人护理来说预测寿命还真是个重要需求。加拿大科学家们开发了一套寿命计算器,预测死亡的准确率可达98%。这个研究项目名为"支持风险评估: 社区老年人生活预测工具(RESPECT)",科学家们基于2007年至2013年期间接受家庭护理的491,000多...