最新最快科技资讯
太阳能光伏网

Meta发布MobileLLM-R1系列轻量语言模型 专攻数学编程任务

Meta最新推出MobileLLM-R1系列小语言模型,包含1.4亿、3.6亿和9.5亿参数版本,主打轻量化特性,可原生运行于移动设备。该系列采用监督式微调技术,专注解决数学、Python/C++编程及科学问题,无需通用对话功能。

以950M参数版本为例,其预训练数据仅消耗2TB高质量token,总训练量不足5TB,却在MATH、GSM8K等基准测试中超越使用36TB数据训练的Qwen 3-0.6B。具体表现为:在MATH测试准确率达Olmo 1.24B的5倍,编程任务表现也优于SmolLM 1.7B等同类模型。

开发者现可通过vLLM推理引擎调用模型,基于Apache 2.0协议的开源代码已登陆Hugging Face平台。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新相关

AOC推240Hz Fast IPS电竞显示器24G4ZR/27G4ZR

2026年2月10日,AOC爱攻正式发布24G4ZR与27G4ZR两款电竞显示器。二者分别采用23.8英寸与27英寸Fast IPS面板,原生刷新率240Hz,可超频至260Hz;分辨率均为1920×1080,GtG/MPRT响应时间低至1ms/0....

裕同科技拟4.49亿元收购华研科技51%股权

2026年2月10日,裕同科技(002831.SZ)公告拟以4.49亿元收购华研科技51%股份。交易对手为观点投资,系公司实控人王华君、吴兰兰夫妇全资控股企业,构成关联交易。资金来源为自有或自筹。交易完成后...

临近春节炼焦煤采购低迷成交冷清

2026年2月10日,蒙古国进口炼焦煤市场震荡偏弱。受春节假期临近影响,下游焦钢企业补库基本结束,采购情绪低迷,询盘问价偏低,现货市场成交氛围冷清。口岸贸易商报价暂稳,但期货盘面下跌。值得注...

蔡司发布复古电影镜头Aatma系列,全系T1.5光圈

2026年2月10日,蔡司正式推出专为电影工业设计的复古镜头群Aatma系列。该系列涵盖18mm至135mm共九个焦段,全系最大光圈达T1.5,适配暗光及夜间拍摄。镜头可呈现柔焦'肥皂泡'焦外与丰富散景,并支...

微信2026年1月上线九大新功能

2026年2月10日,微信官方公众号"微信公开课"公布2026年1月九大功能更新。本次更新涵盖AI搜索、好友管理、视频号、小程序及小游戏等多个模块。具体包括: AI搜索支持评价公众号;删好友可自主选...

百度文心助手月活用户增长4倍

据百度文心公布,自春节红包活动启动以来,百度文心助手MAU(月活用户)同比增长4倍,生图功能同比增长50倍,生视频功能同比增长40倍,打电话功能增长近4倍。