研究揭示大型语言模型在逻辑推理与解释能力上的短板
科罗拉多大学博尔德分校的研究人员在《计算语言学协会研究发现》上发表论文,指出大型语言模型(LLM)在解决数独等逻辑问题时存在显著局限性。实验显示,即使是6×6数独,多数LLM在没有外部辅助的情况下难以完成,且无法清晰解释决策过程。例如,某些模型会给出与解题无关的回答,甚至转而讨论天气预报。研究...
科罗拉多大学博尔德分校的研究人员在《计算语言学协会研究发现》上发表论文,指出大型语言模型(LLM)在解决数独等逻辑问题时存在显著局限性。实验显示,即使是6×6数独,多数LLM在没有外部辅助的情况下难以完成,且无法清晰解释决策过程。例如,某些模型会给出与解题无关的回答,甚至转而讨论天气预报。研究...
迪士尼近日揭晓了奥兰多"神奇王国"乐园的重大扩建内容,全新园区以皮克斯《赛车总动员》为主题,正式命名为"活塞峰国家公园"。这一区域将取代原有的"汤姆・索亚岛"和"美洲河",灵感来源于美国各大国家公园,山脉设计参考科罗拉多落基山脉。新园区以雪山、松林和河流为特色,规模创下乐园新高。其中包含两...
近日,美国科罗拉多、新泽西等多地学区向家长发出警示,社交媒体平台TikTok上流行的"Chromebook Challenge"正诱导学生故意损坏学校配发的Chromebook笔记本电脑。据报道,学生通过向设备接口插入回形针、图钉等异物制造短路,导致设备冒烟、起火,甚至引发校园疏散及应急响应。多所高校强调,此类行为属破坏...
位于科罗拉多州博尔德的房地产投资与开发公司Conscience Bay Company(CBC)宣布将启动一个名为Ridgeway Science & Tech的新项目。该项目将提供灵活的办公和实验室空间,解决科罗拉多州生命科学和技术行业面临的空间不足问题。该项目占地112,423平方英尺,预计于2024年开始建设,并于2026年完工。Ridg...
科罗拉多大学博尔德分校近日联手来自纽约大学的学者推出中文语料库 CLiMP。据论文显示, CLiMP可以用来研究中文语言学者学习了哪些知识。CLiMP由1000个最小对组成,涵盖9种主要的普通话语言现象。目前研究团队已经通过 CLiMP评估了11款不同的大模型,包括n-gram、LSTM 和中文 BERT。实验显示,中文 BERT...
训练人工智能算法需要消耗大量的能量,最近一篇新论文所揭示,它也会消耗大量的水。科罗拉多大学河滨分校和德克萨斯大学阿灵顿分校的研究人员分享了一篇名为"让+AI+不那么渴"的尚未经过同行评审的论文,该论文研究了+AI+训练对环境的影响,这不仅需要大量电力还有大量的水来冷却数据中心。研究人员写道: ...
亚马逊是在科罗拉多斯普林斯举行的太空研讨会上宣布的这些合同,不过没有公布与之相关的固定价值,亚马逊的一位代表拒绝提供任何形式的数字。该公司表示,它已经获得或可能预购了18枚阿丽亚娜6号火箭运载工具(该公司有史以来最大的合同),蓝色起源的12枚New Glenns火箭,以及ULA的38枚火神半人马火箭,还有...
据了解,专家们关注的焦点是一个新出现的被称为BA.2的奥密克戎变体,世界卫生组织最近提醒称这是一个值得关注的变体。然而其他一些专家--包括科罗拉多公共卫生学院院长Jonathan Samet博士和科罗拉多大学医学院免疫学和微生物学教授Ross Kedl博士预测现在时机已经成熟。"我会说,而且还有其他人会同意,这...
即使在研究人员考虑了他们所研究的每个人的基本健康状况之后,其家庭邮政编码的社会脆弱性指数(或称SVI)仍然有区别。社会脆弱性指数结合了多种因素,根据当地的平均收入、教育水平和家庭密度,以及单亲家庭的比例,或英语不是主要语言的家庭,以创建一个分数。研究结果可以帮助决策者针对贫困地区提供更多...
△在不同高度差上验证时钟变快(图片来自Nature)该研究来自于美国科罗拉多大学JILA实验室的叶军团队。他率团队开发出世界上最精确的原子钟,得出在一毫米高度差上,时间相差大约一千亿亿分之一,也就是大约3000亿年只相差1秒,与广义相对论预言一致。这种由于引力不同造成的时间差叫做引力红移,虽然已经得...
据外媒报道,旨在引领月球经济发展的日本太空初创企业ispace日前公布了它的大型着陆器的设计,该着陆器最早可能在2024年登陆月球。总部位于东京的ispace表示,这款名为Series 2的新一代着陆器将用于该公司计划的第三次登月任务。跟该公司的第一个着陆器相比,新着陆器在尺寸和有效载荷方面都变得更大,其...