最新最快科技资讯
太阳能光伏网

阿里云推出320亿参数推理模型QwQ-32B,性能媲美DeepSeek-R1

阿里云今日宣布推出全新的推理模型QwQ-32B,该模型拥有320亿参数,其性能可与具备6710亿参数的DeepSeek-R1相媲美。研究表明,强化学习能够显著提升模型的推理能力,QwQ-32B通过整合冷启动数据和多阶段训练,实现了深度思考和复杂推理。

这款新模型不仅在数学推理、编程能力和通用能力测试中表现出色,还在多个评测集中超越了其他领先模型。特别是在AIME24数学评测集和LiveCodeBench代码评估中,QwQ-32B的表现与DeepSeek-R1相当,远超o1-mini及相同尺寸的R1蒸馏模型。

此外,QwQ-32B集成了与智能体(Agent)相关的功能,使其能够在使用工具时进行批判性思考,并根据环境反馈调整推理过程。目前,QwQ-32B已在Hugging Face和ModelScope平台开源,并采用Apache 2.0开源协议。用户也可通过Qwen Chat直接体验这一先进模型。阿里云表示,这标志着他们在大规模强化学习以增强推理能力方面迈出了重要一步。

最新相关

广西启动防汛四级应急响应应对强降雨

6月8日,广西壮族自治区防汛抗旱指挥部针对柳州、桂林、百色、河池市启动防汛四级应急响应。据气象预报,8日至10日,桂北和桂西将有较强降雨,累计雨量50至150毫米,局地超180毫米,并伴有短时强降...

2025粤港澳大湾区车展成交金额破百亿

6月8日,2025粤港澳大湾区车展闭幕。展会历时9天,吸引约89万人次观展,预定成交车辆42823辆,成交金额达100.7亿元。本届车展规模达26万平方米,其中8万平方米用于互动体验区,集中展示产业创新技术...

哥伦比亚发生6.4级地震

6月8日,哥伦比亚地质局报告称,该国发生6.4级地震。目前暂无人员伤亡和财产损失的具体报告,相关部门正进一步评估震情及影响。免责声明: 本文内容由开放的智能模型自动生成,仅供参考。

中际旭创确认1.6T产品二季度出货量将持续增长

6月8日,中际旭创在互动平台回应投资者提问时表示,公司1.6T产品二季度出货量将持续增长。这一消息表明中际旭创在高速光模块领域的市场表现正在稳步提升,进一步巩固其行业地位。免责声明: 本文...

国产具身大模型首次实现汽车制造全场景验证

近日,智平方与东风柳汽达成战略合作,国产具身大模型首次在汽车制造领域完成全场景验证。此举标志着我国AI技术在工业应用方面取得新突破。同时,2025全球人工智能技术大会在杭州召开,进一步探讨...