月之暗面最新发布的开源思考模型Kimi K2 Thinking,基于"模型即Agent"理念训练,具备自主使用工具与持续思考的双重能力。该模型在Humanity's Last Exam、BrowseComp、SEAL-0等多项基准测试中均达到SOTA水平,其中在评估网络浏览能力的BrowseComp测试中以60.2%的成绩超越人类平均水平。
据介绍,该模型无需人工干预即可实现300轮工具调用与多轮思考循环,通过"思考→搜索→浏览→编程"的动态流程,将复杂问题分解为可执行的子任务。在官方演示案例中,模型经过多轮搜索推理成功解答专业问题,并在股票回购查询中精准定位SEC公告信息。
除核心能力升级外,Kimi K2 Thinking在创意写作方面能保持风格连贯性,学术研究领域展现出严谨的逻辑架构,情感类交互中则体现出更细腻的同理心。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。

扫一扫关注微信