最新最快科技资讯
太阳能光伏网

英伟达联合推出Nemotron-Research-Tool-N1模型,革新AI工具推理能力

科技媒体marktechpost报道,英伟达联合宾夕法尼亚州立大学、华盛顿大学推出Nemotron-Research-Tool-N1系列模型,该模型受DeepSeek-R1启发,采用新型强化学习(RL)范式,显著提升大型语言模型(LLMs)的工具推理能力。

传统方法依赖合成数据,难以捕捉明确的推理步骤,导致模型仅模仿表面模式。Nemotron-Research-Tool-N1通过轻量级监督机制和二元奖励策略,使模型自主优化工具调用的功能正确性。其采用结构化提示模板(如``和``标签),有效避免过拟合。

测试显示,基于Qwen2.5和LLaMA变体的Nemotron-Research-Tool-N1在BFCL和API-Bank基准上表现优异,准确率超越GPT-4o及专用微调模型。这一成果标志着LLMs从监督微调向强化学习范式的重要转变。

最新相关

全球首台三圆组合管幕机"鹿城号"在长沙下线

7月4日,全球首台三圆组合管幕机"鹿城号"在铁建重工长沙第三产业园正式下线。该设备由铁建重工、铁四院、中铁二十局和北京深林开物联合研发,专为应对复杂地质条件下的超大断面施工而设计。"鹿...

罗马仕突发停工停产,员工工资按最低标准发放

据界面新闻报道,罗马仕近日凌晨发布通知称,受市场环境变化及业务调整影响,公司决定自2025年7月7日起停工停产6个月。部分员工已被召回,其余人员进入停工状态。通知显示,停工首月公司将按原标准...

英伟达携RTX5080/5070显卡亮相Bilibili World 2025

英伟达昨日宣布,将于7月11日至13日登陆Bilibili World 2025,并开放RTX5080/5070公版显卡的现场售卖。自7月5日起,用户可通过B站App预约购买资格。活动期间,英伟达还将举办多场游戏试玩会,包括...