新AI训练方法显著提升大语言模型推理能力
加州大学伯克利分校的研究团队近日提出了一种创新的AI训练方法,能够在少量数据的基础上显著增强大语言模型(LLM)的推理能力。传统上,提升LLM推理能力需要在大量数据集上进行昂贵的微调,且许多专有模型的训练方法并不公开。此次研究中,团队仅使用17000个长链式思维(CoT)示例,结合SFT和LoRA微调技术,优...
加州大学伯克利分校的研究团队近日提出了一种创新的AI训练方法,能够在少量数据的基础上显著增强大语言模型(LLM)的推理能力。传统上,提升LLM推理能力需要在大量数据集上进行昂贵的微调,且许多专有模型的训练方法并不公开。此次研究中,团队仅使用17000个长链式思维(CoT)示例,结合SFT和LoRA微调技术,优...
北鼎股份(SZ300824)近日发布了2024年三季度报告。报告显示,公司前三季度实现营业收入5.06亿元,同比增长7.19%;然而,归属于上市公司股东的净利润为3888.18万元,同比下降25.74%。经营活动产生的现金流量净额为2481.85万元,较去年同期下降68.32%。其中,第三季度表现尤为引人关注。当季实现营业收入1.84...
上周五发布的一份研究报告显示,斯坦福大学和华盛顿大学的研究人员仅花费不到50美元的云计算费用,便成功训练出一个名为s1的人工智能模型。该模型在数学和编程能力测试中表现出与OpenAI的o1和DeepSeek的r1等顶尖推理模型相似的水平。s1团队通过"蒸馏"技术创建了这一模型,即通过训练模型来学习其他人工...
北京时间12月14日,旧金山首席法医办公室称,曾在OpenAI工作近四年的前员工Suchir Balaji最近被发现死在他位于旧金山的公寓中。今年10月,这位26岁的人工智能研究员曾在接受媒体采访时表示对OpenAI违反版权法感到担忧,并认为"这项技术对社会弊大于利",因此他也被称为针对OpenAI的"吹哨人"。Balaji是一名...
近日,滴滴自动驾驶公司 COO 孟醒近日已从滴滴离职,加入五源资本任合伙人。同时,孟醒继续担任滴滴自动驾驶卡车业务卡尔动力的董事长。孟醒于 2019 年加入滴滴自动驾驶,此前有多年创业者和投资经历。他拥有加州大学伯克利分校应用数学和经济学学士学位,以及麻省理工大学斯隆商学院 MBA 学位。
OpenAI 的文生视频大模型 Sora 团队研发负责人 Tim Brooks(蒂姆・布鲁克斯)于当地时间 10 月 4 日宣布离职,加入谷歌 DeepMind。Tim Brooks 表示,将在谷歌从事视频生成和世界模拟器方面的工作。Tim Brooks 在加州大学伯克利分校人工智能研究所获得博士学位,并发明了 InstructPix2Pix。他曾在谷歌为 Pi...
海博思创是一家集研发、生产、销售为一体的高新技术企业,主要从事大规模储能系统、纯电动汽车电池系统的研发、工程设计和制造。公司核心团队由加州大学伯克利分校,斯坦福大学,弗吉尼亚理工大学等世界一流名校博士组成。今日海博思创上交所递交聆讯后资料。
2024QS世界大学可持续发展排名涵盖了95个国家和地区的1397所高等教育机构,是去年首次发表的数量的两倍多。多伦多大学在本次排名中获得榜首,紧随此后的是加州大学伯克利分校(全球第二)和曼彻斯特大学(全球第三)。中国(大陆)有90所大学进入排名,但暂时没有高校进入可持续发展排名全球Top100。在可持续...
过去几年,大模型的参数规模呈几何倍数增加。OpenAI 2018年发布 GPT-1时,参数量仅为 1.17亿,2年后的 GPT-3将参数规模扩大千倍,达到 1750亿。到 2021年 Google发布 Switch Transformer,参数量已经拉高至万亿规模。OpenAI虽未公布 GPT-4的参数量,但从业内爆料信息来看,GPT-4参数规模或达 1.8万亿,训练所...
10月31日消息,据国际测试委员会Bench Council官方公众号消息,Bench Council公布了"世界首个开源贡献榜",号称"只以贡献分高下"。从 Bench Council 披露数据得知,Bench Council 号称邀请了多位独立科学家,从 20 世纪 60 年代至今的开源或对开源产生重要影响的成果中,遴选出了 145 项代表性成果,在确定...
36氪获悉,国产美妆品牌codemint正式获得雅诗兰黛集团早期投资和孵化风险投资公司New Incubation Ventures(以下简称NIV)的少数股权投资,具体合作细节未披露。codemint创立于2021年,创始人是流量红人周扬青,核心团队来自来自哈佛大学、加州大学伯克利分校等。这是雅诗兰黛第一次投资国产美妆品牌,此前...
斯坦福大学和加州大学伯克利分校的研究人员发表了一篇论文,研究了OpenAI的ChatGPT大语言模型在2023年3月至6月之间发生的变化。在经过三个月的评估后,ChatGPT的性能在某些任务上明显恶化。要应对LLM漂移的影响,企业需要保持警惕,并进行连续的外部评估和监测。
快科技7月5日消息,最近天气越来越热,甚至全球都打破了历史记录。据当地媒体报道,根据美国国家海洋和大气管理局(NOAA)的数据,7月3日是地球上有记录以来最热的一天。报道称,根据缅因大学的分析数据,地球表面以上2米的全球平均气温在7月3日达到62.62华氏度或17.01摄氏度。加州大学伯克利分校地球学家罗...
欧盟正在迈向人工智能的新监管法规,要求+OpenAI+的+ChatGPT+和谷歌的+Bard+等公司遵守更严格的规定才能在欧盟运营。欧盟内部市场和司法委员会的议员们于周四同意,应要求创建「基础模型」的公司进行风险评估,总结用于训练模型的受版权保护的材料,并确保用户知道他们何时与人工智能进行交互或观看「dee...
一项研究指出了当今大型语言模型的另一个潜在版权问题和文化挑战: 一本书越有名和越受欢迎,语言模型就越能记住其内容。加州大学伯克利分校的研究人员测试了ChatGPT、GPT-4和+BERT+的"背诵"能力。该团队表示,研究表明流行书籍并不是大型语言模型的良好性能测试,它们可能会表现更为出色。
Instruct-NeRF2NeRF+使用生成式+AI+模型的方法,可以根据文本输入编辑3D+场景。今年早些时候,加州大学伯克利分校的研究人员展示了InstructPix2Pix,这是一种允许用户使用文本指令在+Stable+Diffusion+中编辑图像的方法。Instruct-NeRF2NeRF+项目页面上提供了更多示例、代码和模型。
最新获悉,阿里VP贾扬清将离职创业,瞄准AI Infra(AI架构)方向,据悉已经顺利得到了首轮融资意向。此番计划创业的方向,属于是AI基础设施提供商,关注包括大模型在内的AI应用。具体而言,是要打造一个统一、多云和可观察的人工智能平台。目标是提升人工智能产品化的效率,包括开发者效率和系统效率两个方面...
今年早些时候,一位业余围棋选手果断击败围棋排名最高的人工智能系统之一。他们使用了一种由程序研究人员的帮助下开发出来的策略,该程序研究人员旨在探测像KataGo这样的系统的弱点。"这是一个有趣的变化,正如加州大学伯克利分校的+Stuart+Russel+教授告所说的,"与机器对抗训练的玩家往往会做出更多机...
"收旧手机、旧电脑、旧冰箱……"这句回收旧物的口号想必大家或多或少听过。目前,电子产品的回收虽然催生出了产业链,但电子垃圾问题依然严峻。大部分电子产品厂商只负责"生产",很少去考虑"回收"的问题。据CNMO了解,国外的一只研究团队提出了一种新思路,如果电子产品的电路是可回收的,那么这些产品的回...
这项工作还可以帮助研究人员通过在原子水平上调整其化学构成来设计更强大的超导材料。由劳伦斯伯克利国家实验室(Berkeley Lab)与加州大学伯克利分校合作领导的团队在《科学》杂志上报告了他们的发现。传统的超导材料,如铅或锡,在接近开尔文尺度的零度,或零下523.4华氏度的温度下成为超导。但是一些非...