最新最快科技资讯
太阳能光伏网

搜索

Meta发布MobileLLM-R1系列轻量语言模型 专攻数学编程任务

Meta最新推出MobileLLM-R1系列小语言模型,包含1.4亿、3.6亿和9.5亿参数版本,主打轻量化特性,可原生运行于移动设备。该系列采用监督式微调技术,专注解决数学、Python/C++编程及科学问题,无需通用对话功能。以950M参数版本为例,其预训练数据仅消耗2TB高质量token,总训练量不足5TB,却在MATH、GSM8K等基...

中国量化私募首次登上AI顶会NIPS舞台

5月20日,念空科技与上海交大计算机学院合作的大模型研究论文在国际顶会NIPS发表。这是中国量化私募首次挑战全球顶级AI学术舞台。论文提出一种全新大模型后训练方法,受人类学习经验启发,通过高频切换少量刷题与小测试总结提升推理能力。实验表明,该框架在三个公开数据集上优于传统方法,可使大模型在同...