最新最快科技资讯
太阳能光伏网

谷歌全新实时语音互译模型发布: 支持70余种语言,可还原原声语调

【太平洋科技快讯】谷歌发布全新实时语音互译模型Gemini 3.5 Live Translate。

该模型可自动识别70余种语言,翻译语音能够还原说话者的语调、语速与音高。和传统翻译系统不同,它无需等待整段话语结束再执行翻译,可边接收语音边输出译文,在兼顾上下文理解与翻译时效之间实现平衡,整体延迟仅数秒。

目前该模型已开始逐步落地谷歌旗下各类产品。开发者可通过Gemini Live API与Google AI Studio体验公开预览版本;企业用户本月起可在Google Meet中使用专属私有预览版;普通用户则能在安卓、iOS端的谷歌翻译App中体验相关功能。

Gemini 3.5 Live Translate可自动识别混合语言输入,同时具备不错的抗干扰能力,适配嘈杂环境。其应用场景覆盖多语言通话、会议、线上课程、直播广播等,能够提供实时口译服务。

最新相关