英伟达近日发布Cosmos-Reason1系列模型,专为物理推理任务设计,显著提升了AI在物理常识和具身推理方面的能力。这一进展为机器人、自动驾驶等领域带来了新的应用潜力。
当前,AI虽在语言处理、数学等领域表现卓越,但在物理环境中的应用仍面临挑战。Physical AI需结合现实物理法则生成反应,涉及导航、操作等任务,要求对空间、时间及物理规律有深刻理解。然而,传统AI对物理世界的连接较弱,难以直观理解重力或空间关系。
Cosmos-Reason1通过分层本体和二维本体系统,细化物理常识与推理能力,并采用仅解码器的大型语言模型架构,结合视觉编码器处理视频数据。该模型包含两个版本,分别通过监督微调和强化学习训练,使用400万条标注视频-文本对数据。测试结果显示,其在物理常识和具身推理方面均有出色表现,特别是在预测行动和评估物理可行性上取得显著进步。