最新最快科技资讯
太阳能光伏网

Kimi-Researcher启动小范围灰度测试,深耕深度研究任务

近日,首个基于端到端自主强化学习技术的智能体Kimi-Researcher正式开启小范围灰度测试。这款专为深度研究任务设计的Agent产品,能够自主规划任务流程并交付高质量成果。其核心能力包括澄清问题、深入推理、主动搜索以及调用工具完成结果交付。通过异步执行方式,Kimi-Researcher确保输出内容的信息覆盖度与质量,最终提供两份成果:一份万字以上的深度研究报告,引用26个高质量信源且支持溯源;另一份则是可交互的动态可视化报告,便于快速把握核心结论。

在AI高难度基准测试“人类最后一次考试”中,Kimi-Researcher表现卓越,Pass@1准确率达26.9%,超越多个知名模型,成为当前最高水平之一。同时,在红杉中国的xbench测试中,其DeepSearch任务通过率高达69%,展现出强大的实际应用能力。

最新相关

理想i8: 打造高性价比大型纯电SUV新标杆

理想汽车产品经理昨日在微博分享了理想i8的设计理念与驾驶体验。作为一款大型6座纯电SUV,i8聚焦长续航与大空间,同时避免进入50万元以上的价格区间,力求为用户提供更高性价比的选择。新车融合M...

深圳第24周二手房录得量环比增长38.3%

2025年第24周(6月9日-6月15日),深圳全市二手房录得1474套,环比增长38.3%。新房成交1131套,环比增长24%。深房中协分析,端午假期后积累需求逐步释放,推动二手房市场修复性回升。免责声明: 本文...

全国18条河流发生超警以上洪水

6月20日至21日,受降雨影响,珠江流域、长江流域等18条河流发生超警以上洪水,最大超警幅度达3.60米。其中,3条河流发生超保洪水,盘阳河出现有记录以来最大洪水。水利部维持针对9省区的IV级应急响...

谷歌用YouTube视频训练AI模型引争议

谷歌正借助其庞大的YouTube视频库,为Gemini和Veo 3等AI模型提供训练数据。据美国CNBC报道,谷歌使用了平台上约200亿条视频的内容,但仅限部分数据,并声称已与创作者或合作方达成协议。然而,这一...