最新最快科技资讯
太阳能光伏网

阿里发布通义千问QwenLong-L1-32B模型 长文本推理能力突破

阿里通义千问团队5月26日正式推出QwenLong-L1-32B模型,这是其首个通过强化学习训练的长文本情境推理模型(LRM)。该模型在七个长文本DocQA基准测试中表现优异,超越多个旗舰模型,性能与Claude-3.7-Sonnet-Thinking相当。

QwenLong-L1-32B最大特点是支持高达131072个tokens的上下文窗口。基于QwenLong-L1框架开发,该模型采用创新的GRPO和DAPO算法,结合混合奖励函数,显著提升了长文本推理的准确性和效率。团队在训练过程中运用了课程引导的分阶段强化学习技术和难度感知的回顾采样策略。

除模型外,阿里还发布了完整的长文本推理解决方案,包含高性能模型、优化数据集、创新训练方法和全面评估体系四大核心组件。

最新相关

2025年国内汽车降价趋势分析

乘联分会秘书长崔东树发文指出,2025年国内汽车行业降价促销力度显著降低,尤其在3至5月期间,降价车型数量明显减少。数据显示,1月份有7款车型降价,2月份增至21款,3月份仍维持较高水平的23款,而4...

英国医生用人粪制药对抗超级细菌

6月8日,英国医疗团队尝试将健康人粪便制成冻干粉,供感染超级细菌的患者服用。通过利用粪便中的有益菌消灭耐药性强的超级细菌,试验结果表明该疗法效果显著且充满希望。免责声明: 本文内容由开...

火星火山穿透云层: NASA捕捉历史性瞬间

NASA的2001火星奥德赛号轨道飞行器近日拍摄到一张罕见照片,记录了火星巨型火山阿尔西亚山在黎明前从云层中显现的壮观景象。这张摄于5月2日的照片,展示了这座高达20公里的火山(约为地球最高火...

康达新材氧化铝靶材完成小批次验证

6月6日,康达新材在分析师会议上透露,其控股子公司惟新科技的氧化铝靶材已完成小批次验证,并按客户订单需求供货。此外,公司氧化铈CMP抛光液正进行内部测试。此举标志着康达新材在半导体材料领...

国家海洋综合试验场(深海)正式运行

6月8日,世界海洋日主场活动在海南海口举行。活动中宣布,国家海洋综合试验场(深海)正式运行。该试验场位于甘泉海台西北部,距三亚约200公里,面积400平方公里,水深1300~1500米。经过3个月试运行...