最新最快科技资讯
太阳能光伏网

英伟达联合推出Nemotron-Research-Tool-N1模型,革新AI工具推理能力

科技媒体marktechpost报道,英伟达联合宾夕法尼亚州立大学、华盛顿大学推出Nemotron-Research-Tool-N1系列模型,该模型受DeepSeek-R1启发,采用新型强化学习(RL)范式,显著提升大型语言模型(LLMs)的工具推理能力。

传统方法依赖合成数据,难以捕捉明确的推理步骤,导致模型仅模仿表面模式。Nemotron-Research-Tool-N1通过轻量级监督机制和二元奖励策略,使模型自主优化工具调用的功能正确性。其采用结构化提示模板(如``和``标签),有效避免过拟合。

测试显示,基于Qwen2.5和LLaMA变体的Nemotron-Research-Tool-N1在BFCL和API-Bank基准上表现优异,准确率超越GPT-4o及专用微调模型。这一成果标志着LLMs从监督微调向强化学习范式的重要转变。

最新相关

《消逝的光芒: 困兽》1.4版更新上线

2025年11月30日,《消逝的光芒: 困兽》推出1.4版本更新,新增"新游戏+"模式、传奇等级系统及光线追踪支持。该模式允许玩家继承装备与进度,逐次提升难度并解锁稀有武器。传奇等级为15级后提供额...

初代《寂静岭》重制版将亮相TGA 2025

据科技媒体消息称,科乐美初代《寂静岭》重制版将于TGA 2025亮相。该作由Bloober Team领衔开发,延续1999年原作剧情,讲述哈里·梅森寻找女儿雪莉的故事,预计2027年发售。另一款新作《寂静岭: To...

绍兴世茂广场5.8亿元拍卖成交

2025年11月30日,浙江省绍兴市越城区胜利东路的绍兴世茂广场成功拍卖。该不动产建筑面积约18.39万平方米,为商业用途,所有人系绍兴世茂投资发展有限公司。经57轮竞价,竞买号O5613以近5.8亿元竞...

西藏AI迈向藏语大模型研发新阶段

2025年11月30日,西藏大学发布千亿级参数藏语基座大模型"阳光清言"V1.0。中国工程院院士、西藏大学教授尼玛扎西表示,该成果标志西藏人工智能从场景应用进入系统性研发阶段。模型依托约288亿Tok...

重庆至布达佩斯中欧班列正式开行

2025年11月30日,重庆-匈牙利布达佩斯全程时刻表中欧班列正式开行。该班列从重庆团结村中心站出发,满载汽摩配件、日用百货等货物,驶向匈牙利首都布达佩斯,全程运行约11天。此次班列开行为两地...

全国海水淡化产业联盟在天津成立

2025年11月30日,全国海水淡化产业联盟在天津港保税区正式成立。该联盟由多方产业力量共同发起,旨在推动我国海水淡化产业链协同发展。成立大会在天津举行,标志着我国海水淡化产业进入合作共赢...

东方材料两董事辞职 前三季度净利降74.86%

11月27日,东方材料(SH603110)公告宣布董事许广彬、杨波辞职。许广彬因身体原因辞去董事及战略委员会委员等职,杨波因个人原因辞去董事职务,二人均不再担任公司任何职务。此次变动未影响董事会...

德风科技赴港IPO: 三年半亏损7.3亿

2025年11月,北京德风新征程科技股份有限公司向港交所递交招股书,拟募资用于AI能力提升、工业机器人研发及海外扩张。公司由王清杰于2015年创立,2022年至2025年上半年累计亏损7.3亿元,期间费用...

天禄科技实控人股份被轮候冻结

11月27日晚,天禄科技(SZ301045)公告披露,公司控股股东、实控人之一陈凌所持全部股份23,032,193股(占总股本20.88%)被苏州工业园区人民法院轮候冻结,期限36个月。此次冻结系因陈凌个人债务纠纷...

中凌新能源动力电池项目开工

2025年11月28日,武义中凌新能源动力电池智能制造基地举行开工活动。该项目位于浙江武义县新质智造产业园,由中创新航与零跑汽车合资建设,预计2026年6月投产,达产后年产值超100亿元。目前项目现...

《幻日夜羽》Steam黑五促销开启

2025年11月30日,卡牌Roguelike游戏《幻日夜羽 - 蜃景努玛梓 -》在Steam平台开启黑五促销,国区售价36.72元,为原价108元的3.4折。游戏于2024年2月22日发售,登陆PC、Switch、PS4及移动平台,支持...

我国成全球最大绿色债券市场

2025年11月30日,据最新数据显示,中国绿色债券发行总额达1018亿美元,同比增长92%,占全球总量20%。截至10月下旬,全球绿色债券发行总额同比下降11%至5060亿美元,中国成为全球最大绿色债券市场。...