今日,面壁智能宣布推出“小钢炮”系列新品——参数量仅0.5B的语音生成基座模型VoxCPM,该模型由面壁智能与清华大学深圳国际研究生院人机语音交互实验室(THUHCSI)联合研发。官方介绍,VoxCPM在语音自然度、音色相似度及韵律表现力方面均达到SOTA水平,尤其在Zero-shot音色克隆任务中表现突出。模型在词错率测试中亦展现出优异性能,生成语音在情绪、口音、停顿等方面几近真人表达。依托对文本的深度理解,VoxCPM可自主匹配声音风格与语调,实现沉浸式听觉效果。目前,该模型已在GitHub、Hugging Face等平台开源,支持公开体验与下载使用。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。