最新最快科技资讯
太阳能光伏网

中国信通院发起大模型幻觉测试,助力AI安全应用

为应对大模型幻觉带来的潜在风险,中国信息通信研究院人工智能所基于AI Safety Benchmark测评工作,正式开展大模型幻觉测试。大模型幻觉指生成内容看似合理但与事实或用户输入不符的现象,尤其在医疗、金融等领域广泛应用时,其风险不容忽视。

本次测试聚焦大语言模型,涵盖事实性幻觉和忠实性幻觉两种类型,采用7000余条中文样本,涉及人文、社会、自然、应用及形式科学五大维度。测试形式包括信息抽取、知识推理和事实判别等题型,旨在全面评估模型表现。

中国信通院诚邀相关企业参与测评,共同推动大模型的安全与深度应用。

最新相关

Anthropic CEO称AI产生"幻觉"频率或低于人类

在Anthropic近日举办的首场开发者活动"Code with Claude"上,CEO达里奥・阿莫代伊提出,当前AI模型"产生幻觉"(即虚构不实内容)的频率可能低于人类。阿莫代伊认为,尽管AI的出错方式更令人意外,但...

深圳华曦达科技提交港交所上市申请

5月23日,深圳市华曦达科技股份有限公司向香港交易所提交上市申请书,拟在港股市场上市。此次上市的独家保荐人为中信建投国际,标志着公司进一步拓展资本市场的战略步伐。免责声明: 本文内容由开...

科望医药集团提交港交所上市申请

5月23日,科望医药集团正式向港交所提交上市申请书,独家保荐人为中信证券。此举标志着该公司计划通过资本市场进一步扩大业务规模及提升竞争力。上市资金预计将用于研发创新药物及拓展国际市场...

20股特大单净流入超2亿元,赛力斯居首

5月23日,两市全天特大单净流出128.80亿元。其中,20只个股特大单净流入超2亿元,赛力斯以19.63亿元的净流入资金规模居首,雪人股份、尤夫股份等紧随其后。与此同时,东方财富净流出资金达6.78亿元...

4只个股大宗交易额超5000万元

5月23日,数据显示共有52只个股现身大宗交易平台,累计成交额7.92亿元。其中,18只个股交易额超千万元,南微医学以1.00亿元成交额居首,比亚迪次之为0.73亿元。当日大宗交易共涉及0.42亿股,显示市...