2025年12月2日,商汤科技联合南洋理工大学S-Lab发布并开源全新多模态模型架构NEO。该架构号称是行业首个实现深层次融合的原生视觉语言模型,通过原生图块嵌入、三维旋转位置编码和多头注意力机制创新,实现视觉与语言在底层的统一处理。NEO采用Pre-Buffer & Post-LLM双阶段训练策略,在仅用3.9亿数据的情况下达到顶尖视觉理解能力,并在MMMU、SEED-I等多项评测中表现优异。相比传统模块化模型,NEO在数据效率、推理性能与边缘部署方面具备显著优势。目前,2B与9B版本已面向全球开发者开源。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。

扫一扫关注微信