最新最快科技资讯
太阳能光伏网

阿里发布Qwen3-Next架构并开源大模型

近日,阿里发布下一代基础模型架构Qwen3-Next,并开源基于该架构的Qwen3-Next-80B-A3B系列模型。新架构在Qwen3的MoE基础上,引入混合注意力机制、高稀疏度MoE结构及多项优化技术,显著提升训练效率与推理性能。其中,Qwen3-Next-80B-A3B-Base模型参数达800亿,激活参数仅30亿,在保持低训练成本的同时实现接近甚至超越Qwen3-32B dense模型的性能。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

最新相关

IDC: 2025年Q2全球腕戴设备出货量同比增长12.3%

2025年第二季度,全球腕戴式设备出货量达到4920万台,同比增长12.3%。市场调研机构IDC报告显示,华为、小米和苹果继续占据前三位置,但市场份额和增长表现各有差异。免责声明: 本文内容由开放的智...

工信部: 推进AI赋能医药全产业链

9月11日,工信部召开医药行业企业座谈会,提出加快医药工业高质量发展行动。会议围绕药物研发、数智化制造、人工智能赋能等议题展开交流。工信部强调,要夯实企业创新主体地位,推动人工智能深度...