1月29日,商汤科技宣布开源多模态自主推理模型SenseNova-MARS(含8B/32B双版本)。该模型为全球首个支持动态视觉推理与图文搜索深度融合的Agentic VLM,具备自主规划、多工具调用能力。其在MMSearch等多模态基准测试中以69.74分超越Gemini-3-Pro与GPT-5.2,达开源模型SOTA水平。模型已上线GitHub及Hugging Face平台,支持图像裁剪、图像搜索、文本搜索等关键能力,可端到端完成识别—检索—推理闭环任务。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。

扫一扫关注微信