在今年的I/O开发者大会上,谷歌推出了新一代视频生成模型Veo 3,首次实现背景音效合成功能。该模型不仅能生成高质量画面,还可为鸟鸣、街头交通等场景自动匹配音效,甚至支持人物对话生成。
谷歌表示,Veo 3在物理模拟与口型同步方面表现突出。目前,该模型仅限美国地区的Gemini Ultra用户及Vertex AI企业用户使用,并已集成至谷歌AI影视制作工具Flow中。用户仍可基于Veo 2的功能,通过Flow调整镜头角度、画面比例或增删元素。
针对AI内容识别难题,谷歌同步推出了SynthID Detector工具,用户可上传文件检测是否包含AI生成水印。不过,该功能尚未覆盖所有图像生成模型。