最新最快科技资讯

太阳能光伏网

微软联合清华北大推出奖励推理模型RRMs,提升复杂任务评估效果

27 05月 2025

2025-05-27 14:32

近日，微软研究院与清华大学、北京大学合作开发的奖励推理模型（Reward Reasoning Models，RRMs）正式发布。该模型通过显式推理过程动态分配计算资源，显著改善复杂任务的评估效果。RRMs基于Qwen2模型，采用Transformer-decoder架构，将奖励建模转化为文本补全任务，实现对复杂查询的精细分析。

传统奖励模型在测试时统一分配计算资源，难以满足多样化需求。RRMs引入“思维链”推理机制，根据任务复杂性自适应调整计算资源投入。研究团队利用RewardBench库进行系统评估，结果显示RRM-32B在推理类别中达到98.6%的准确率，远超同类模型。此外，RRMs支持多响应评估，并通过ELO评分和淘汰赛机制优化资源利用率，在后训练反馈和最佳N推理中表现优异。

随着模型规模扩大，RRMs展现出更强的推理能力和更高的准确性，为复杂任务提供了高效解决方案。

最新相关

06 07月 2025

T1终结BLG与Bin MSI不败纪录,LPL仅存一队冲击决赛

在《英雄联盟》2025季中冠军赛淘汰赛第五日的较量中,LPL赛区BLG战队以0-3不敌LCK赛区T1战队,落入败者组。这也意味着,LPL赛区最多仅有一支队伍能从败者组杀回决赛。值得一提的是,这是T1首次在M...

06 07月 2025

锐翔智能北交所IPO获受理实控人陈良华持股54.57%

6月30日,珠海锐翔智能科技股份有限公司(以下简称"锐翔智能")北交所IPO正式获得受理,保荐机构为国泰海通证券。招股书显示,公司注册资本5219.19万元,主营业务为智能制造装备的研发、生产和销售...

06 07月 2025

鸿基创能冲刺港交所主板中国最大独立膜电极供应商面临盈利挑战

6月27日,鸿基创能科技(广州)股份有限公司正式向港交所主板递交上市申请,联席保荐人为海通国际和中信证券。作为中国最大的独立膜电极供应商,鸿基创能专注于催化剂涂层质子膜(CCM)及膜电极(MEA)...

06 07月 2025

华中科技大学协和医院实现体内CAR-T疗法临床突破

华中科技大学同济医学院附属协和医院近日宣布,通过比利时EsoBiotec公司研发的体内CAR-T疗法ESO-T01,成功完成全球首例复发/难治多发性骨髓瘤患者的临床治疗。该疗法采用体内直接编辑T细胞的方...

06 07月 2025

雷鸟V3拍摄眼镜迎夏季更新: AI备忘录上线、拍摄优化、接入苹果生态

雷鸟创新近日宣布,旗下V3拍摄眼镜迎来夏季重大升级,新增多项实用功能。AI备忘录正式上线,用户可通过语音或App手动添加备忘事项,眼镜将按时提醒。拍摄能力方面,优化了多场景下的色彩表现,改善...

06 07月 2025

罗马仕突发停工停产,员工工资按最低标准发放

据界面新闻报道,罗马仕近日凌晨发布通知称,受市场环境变化及业务调整影响,公司决定自2025年7月7日起停工停产6个月。部分员工已被召回,其余人员进入停工状态。通知显示,停工首月公司将按原标准...

06 07月 2025

微星Afterburner推出Beta 6版本非官方支持AMD RDNA4显卡

微星显卡调节工具MSI Afterburner(俗称"小飞机")近日发布最新的Beta 6版本(编译号16591)。此次更新由开发者Unwinder自发推动,为AMD Radeon RX 9000系列RDNA4显卡提供了非官方支持,Unwinder特...

06 07月 2025

英伟达携RTX5080/5070显卡亮相Bilibili World 2025

英伟达昨日宣布,将于7月11日至13日登陆Bilibili World 2025,并开放RTX5080/5070公版显卡的现场售卖。自7月5日起,用户可通过B站App预约购买资格。活动期间,英伟达还将举办多场游戏试玩会,包括...

05 07月 2025

EA豪赌《战地6》: 目标1亿玩家,挑战空前

据外媒Arc Technica报道,EA对即将推出的《战地6》寄予厚望,设定1亿玩家的目标,并称其将超越系列前作。尽管开发人员认为该目标"有些理想化",但游戏计划包含免费大逃杀模式、完整单人剧情及多个...

05 07月 2025

美团即时零售日订单突破 1 亿

美团面向核心本地商业内部员工推送的一则战报显示,截至 5 日 20 时 45 分,美团即时零售日订单量已经突破 1 亿单。在不少社交平台,也有不少美团员工在转发相关海报。2024 年 8 月 7 日,美团在"...

05 07月 2025

奔驰反思EQS发布策略: 或早于市场十年,营销定位待优化

梅赛德斯-奔驰设计总监戈登・瓦格纳近日坦言,EQS的推出"可能早了十年",且营销策略未达预期。该车并非传统意义上的电动S级,其设计初衷也非服务于高端接送场景,而是面向未来出行的一种探索。瓦...

05 07月 2025

OPPO Find X9系列产品路线图曝光明年上半年推X9s/X9 Ultra

OPPO Find系列产品负责人周意保今日透露,Find X9与X9 Pro将于今年下半年发布,而Find X9s和X9 Ultra则计划于明年上半年亮相,未来产品迭代将延续这一节奏。据数码博主爆料,Find X9s或采用6.3英...

05 07月 2025

谷歌调整搜索策略应对欧盟新规

为遵守欧盟《数字市场法》并避免高额罚款,谷歌计划在搜索页面顶部优先展示来自第三方比价平台的购物和旅游内容。据彭博社报道,知情人士透露,谷歌将在搜索结果上方设置专门展示框,列出如Expedi...

05 07月 2025

元太科技携手Oricom推出节能环保彩色电子纸广告牌

E Ink元太科技与日本广告企业Oricom合作,基于Spectra 6彩色电子纸技术,开发出新型"可持续性广告牌"。该产品以Oricom旗下品牌Mirapale名义推出,主打低能耗与环保理念,仅在更换画面时耗电,兼具...

05 07月 2025

久保田推出生成式AI农业咨询服务助力新手农户

日本农机厂商久保田公司7月3日正式推出面向农户的生成式AI聊天服务,旨在通过聊天界面为农户提供农作物种植方法、补贴制度及实用网站等信息,降低农业咨询门槛,吸引更多新手进入农业领域。该服...

05 07月 2025

佳能推出新型SPAD传感器光子计数算法实现高清晰低功耗

佳能6月12日发布了一款突破性的SPAD图像传感器,采用创新的加权光子计数算法,显著提升了成像清晰度与能效表现。传统SPAD传感器虽能对单个光子计数,但在强光环境下易出现白斑且功耗较高。新型传...

阅读更多

安诺优达冲刺港股: 年营收5.2亿亏1.3亿夏佐全控制54%投票权

安诺优达冲刺港股: 年营收5.2亿亏1.3亿夏佐全控制54%投票权

松灵机器人推出具身智能移动协作机器人Cobot S Kit

松灵机器人推出具身智能移动协作机器人Cobot S Kit

视界拓新知·AI有所为|2023首届无锡国际人工智能算法大赛举办

视界拓新知·AI有所为|2023首届无锡国际人工智能算法大赛举办

亚信科技荣获"金紫竹"多项大奖,欧阳晔详解6G OSS演进

亚信科技荣获"金紫竹"多项大奖,欧阳晔详解6G OSS演进

ETSI发布F5G Advanced代际标准,引领固定网络进入新时代

ETSI发布F5G Advanced代际标准,引领固定网络进入新时代

ADVANCE.AI 携手亚马逊云科技发布《2023年菲律宾金融科技报告》

ADVANCE.AI 携手亚马逊云科技发布《2023年菲律宾金融科技报告》

视界拓新知·AI有所为|2023首届无锡国际人工智能算法大赛举办

视界拓新知·AI有所为|2023首届无锡国际人工智能算法大赛举办

核心技术突破!国产200kV透射电子显微镜进入小批量试产

核心技术突破!国产200kV透射电子显微镜进入小批量试产

松灵机器人推出具身智能移动协作机器人Cobot S Kit

松灵机器人推出具身智能移动协作机器人Cobot S Kit

亚信科技荣获"金紫竹"多项大奖,欧阳晔详解6G OSS演进

亚信科技荣获"金紫竹"多项大奖,欧阳晔详解6G OSS演进

核心技术突破!国产200kV透射电子显微镜进入小批量试产

核心技术突破!国产200kV透射电子显微镜进入小批量试产

松灵机器人推出具身智能移动协作机器人Cobot S Kit

松灵机器人推出具身智能移动协作机器人Cobot S Kit