英伟达近日正式发布由NVIDIA Metropolis平台驱动的视频搜索与总结(VSS)AI蓝图,为开发者提供构建智能视频分析工具的全套解决方案。该技术通过融合视觉语言模型与大型语言模型,可同时处理数百个实时视频流,实现比实时观看快100倍的视频总结速度——60分钟视频可在1分钟内生成文字摘要。
这套AI系统不仅能进行视觉内容分析,还支持音频转录功能,适用于球赛分析、会议记录等多种场景。其核心架构整合了NVIDIA AI Enterprise软件平台,包含NVIDIA NIM微服务和先进AI框架,为企业处理TB级视频资料提供了前所未有的效率。目前该技术已在多个行业展开应用,展现出强大的商业化潜力。