DeepMind:大模型又曝重大缺陷
DeepMind的研究人员发现,大语言模型(LLM)在推理过程中无法通过自我纠正获得更好的回复。如果没有外部信息指导,这种自我纠正会引发模型性能下降。尽管如此,研究人员依然看到一些任务通过精心设计的反馈和提示,通过自我纠正产生了提升,为未来工作提供参考。
DeepMind的研究人员发现,大语言模型(LLM)在推理过程中无法通过自我纠正获得更好的回复。如果没有外部信息指导,这种自我纠正会引发模型性能下降。尽管如此,研究人员依然看到一些任务通过精心设计的反馈和提示,通过自我纠正产生了提升,为未来工作提供参考。
香蕉是我们日常生活中熟悉得不能再熟悉的水果了,但是你确定自己真的和它是"老熟人"吗?香蕉: 虽然经常吃,但我们还不熟香蕉(Musa x paradisiaca),又名甘蕉,是一种多年生大型草本开花植物,属于单子叶植物纲姜目芭蕉科芭蕉属。一般认为,香蕉原产于东南亚地区,包括印度以及中国南部。中国古代典籍常常将香...
CMU的研究人员开发了一种名为Zeno的框架,用于评估机器学习模型的行为。这种框架可以帮助研究人员和从业者发现和纠正模型的局限性和失败。Zeno为用户提供了进行这种深入研究的平台。
麻省理工和微软的研究学者发现,GPT-4 模型具有优秀的代码自我纠错能力,而 GPT-3.5 不具有该特性,目前论文已经发布于 ArXiv 中。研究人员通过研究 GPT-4 表示,当下实际上可以通过"模型的自我纠错"方式,令模型"反思自身所存在的不足之处",以提升代码片段长度、并改善输出结果的准确度。在经过自我纠错...
微软研究人员推出了名为ZeRO的新系统,用于优化训练大型AI模型,以应对高数据传输开销和有限带宽的难题。ZeRO建立在现有的ZeRO优化的基础上,并提供增强的通信策略,以提高训练效率,减少训练时间和成本。研究人员和实践者可以利用ZeRO更有效地训练像ChatGPT这样的模型,并在AI领域探索新的可能性。
微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型phi-1,并且其性能优于ChatGPT背后的大型语言模型GPT-3.5。这个基于Transformer的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。研究人员还将寻求提高数据集的多样性和非重复性,尽管该团队表示,他们必须找到方法"在数据生成过程中...
Meta正在将资源重新集中在开发聊天机器人等AI产品和功能上,但其约三分之一的研究人员离开了公司,这些研究人员曾共同撰写过与大型语言模型相关的AI研究论文。根据他们的LinkedIn简介和知情人士,LLaMA研究论文中列出的14位作者中有6位已经离开或宣布他们将离开。Meta在像Blenderbot3和Galactica这样的...
尽管大规模语言模型在各种自然语言处理任务中展现出卓越的性能,但算术类问题仍然是一个难题,即使是目前最强大的GPT-4也很难解决基本的运算问题。来自新加坡国立大学的研究人员提出了一个专门用于算术问题的模型,名为Goat。其他研究人员也可以很容易地重复这个实验,因为该模型、数据集和生成数据集的P...
来自Facebook母公司Meta的人工智能研究人员提出了一种新颖的方法MegaByte,以加快自然语言处理等用途的内容生成。来自Facebook母公司Meta的人工智能研究人员提出了一种新颖的方法MegaByte旨在改进更长的内容生成。研究人员提出,未来对MegaByte的研究应该探索将架构扩展到更大的模型和数据集。
MLCChatapp已经在苹果的AppStore上线了。MLCChat使用MLC-LLM作为基础,该模型由陈天奇和其他多名研究人员共同开发。MLCChat在将模型下载到应用程序后,一切都在本地运行,无需服务器支持,并且不需要互联网连接,不会记录任何信息。
新加坡国立大学和香港中文大学的研究人员声称已经创造了一种人工智能--称为MinD-Video,可以从大脑信号中重建"高质量"视频。正如研究人员在一篇论文中介绍称,MinD-VideoAI模型是根据来自fMRI读数的公开可用数据和AI图像生成器StableDiffusion的增强模型共同训练的。尽管这项研究令人着迷,但我们距离能...
快科技5月11日消息,加州大学戴维斯分校的一项最新研究发现,由培养细胞生产的肉类对气候的影响可能是普通牛肉的25倍。据悉,实验室培养的肉类通过在营养丰富的"肉汤"中围绕支架培养动物干细胞制成,被认为是比传统肉类更环保的替代品。因为与传统肉类相比,其使用的土地、饲料、水和抗生素更少,且不需要...
在实地实验中,研究人员使用语言模型的实时措辞辅助来提高美国枪支管制聊天中的讨论质量,最终表明即聊天机器人可以对辩论文化产生积极影响。研究人员总共招募了1,574名对美国枪支管制持不同看法的人。即使分歧持续存在,高质量的政治话语也有利于社会的社会凝聚力和民主。
Facebook+母公司+Meta+的人工智能研究人员推出了一种新的语言模型Toolformer,旨在处理自然语言处理用例中多个+API的调用。Toolformer+基于+GPT-J,后者是一种67亿参数的开源语言模型。Meta+的研究人员在他们的论文中承认,Toolformer+比其同时代的+ChatGPT+更不完整,其目前在使用上仍存在局限性"。
近日,CNMO从外媒了解到,国内一所大学的研究人员发表了一项研究,认为炸薯条可能对心理健康有负面影响,包括导致抑郁症。炸薯条据美国有线电视新闻网(CNN)和其他外国媒体报道,杭州一所大学的一名研究人员在《美国国家科学院院刊》(PNAS)上发表的论文显示,与不吃油炸食品的人相比,经常吃油炸食品的人患抑...
加拿大魁北克大学的四名研究人员近日发现,聊天机器人ChatGPT能生成C、C++、Python和Java等各种编程语言代码,但该机器人生成的代码存在严重的安全漏洞不会主动提醒用户。+++研究人员在一篇论文中介绍了他们的发现。+++魁北克大学的Raphaël+Khoury教授表示,ChatGPT在目前的形式下是有风险的,因此需要...
4月18日消息,特斯拉CEO埃隆·马斯克在接受采访时表示,他开启了一个新的人工智能项目,旨在理解宇宙本质。在某档电视节目中,马斯克透露他将推出一个名为TruthGPT的人工智能聊天机器人。他和主持人讨论了开发ChatGPT替代品的原因,并表达了对信息自由的担忧。马斯克说: "我要启动我称之为TruthGPT的东西,...
斯坦福大学和谷歌的一组研究人员让25个人工智能机器人在一个虚拟城镇里自由活动,它们的行为比大家想象的更像人类。研究人员使用OpenAI的GPT-3.5大型语言模型训练了25种不同角色的"AI机器人",以"模拟可信的人类行为",如做早餐、上班或从事绘画或写作等特定职业。一位Reddit用户思考道: "想象一下,能够...
训练人工智能算法需要消耗大量的能量,最近一篇新论文所揭示,它也会消耗大量的水。科罗拉多大学河滨分校和德克萨斯大学阿灵顿分校的研究人员分享了一篇名为"让+AI+不那么渴"的尚未经过同行评审的论文,该论文研究了+AI+训练对环境的影响,这不仅需要大量电力还有大量的水来冷却数据中心。研究人员写道: ...
南加州大学的两位研究者Mayank+Kejriwal和Zhisheng+Tang针对ChatGPT一项研究结果发现,虽然ChatGPT在生成传记、诗歌或图片等任务上表现出色,但在处理涉及赌博的任务时表现不佳。研究人员认为大型语言AI模型难以衡量潜在的收益和损失,因此无法理性地进行决策。"最终研究人员得出结论: 决策仍然是一个非...