最新最快科技资讯
太阳能光伏网

微软开源长时自然语音合成模型VibeVoice-1.5B

科技媒体marktechpost 8月25日报道,微软发布全新开源文本转语音模型VibeVoice-1.5B,支持一次生成最长90分钟、最多4位说话者的自然语音,并具备跨语言与歌声合成功能。该模型基于Qwen2.5语言模型,结合声学与语义双分词器,采用低帧率处理与扩散解码器技术,提升语音质量与上下文连贯性。训练中通过扩展上下文长度,实现多说话者轮流发言的自然对话模拟。目前模型仅支持中英文,禁止用于虚假信息等非法用途,主要面向科研与开发者社区,适用于播客制作、对话式AI等领域。微软计划推出更高参数版本以支持实时交互。

最新相关

微星Claw掌机将支持Xbox全屏体验模式

据VGC报道,微星Claw系列掌机即将升级Xbox FSE(Full Screen Experience)全屏体验功能,用户无需启动完整Windows系统即可直接进入Xbox应用。该模式最初随ROG Xbox Ally系列推出,现微软正逐步向其...

华峰化学: 氨纶价格处历史低位

2025年11月3日,华峰化学在业绩说明会上表示,当前氨纶价格仍处于历史底部区间。受供需关系影响,短期内价格反弹动力不足。公司认为,长期来看氨纶市场前景向好,一方面因消费观念升级推动氨纶应用...

英伟达中国开发者日2025将启

2025年11月14日,英伟达中国开发者日将在苏州举行。活动将聚焦大语言模型、机器人、物理AI及开发工具等领域的前沿创新与实践应用。通过主论坛、圆桌讨论和分论坛技术分享等形式,展示英伟达在AI...

Alphabet启动八部分美元债券发行

2025年11月3日,谷歌母公司Alphabet宣布启动分八部分的美元债券发行。此次发债在纽约进行,由Alphabet主导,旨在筹集资金用于一般企业用途、回购股票及潜在并购。债券分为八个不同期限和利率的档...

宝钢股份调整产能目标至8000万吨+

2025年11月3日,宝钢股份宣布调整公司产能目标为"8000万吨+",不再追求此前"8000~10000万吨"的规模扩张。此次调整旨在强化存量资产协同与价值挖掘,提升运营效率。在国内市场,受限于优质并购标的...

Rokid与BOLON将联合发布新款AI智能眼镜

Rokid乐奇官方宣布,将于11月13日携手BOLON眼镜举办"戴上新时尚"新品发布会,推出新一代AI智能眼镜。新品聚焦轻量化设计与高性能表现,集成语音控制、信息提示、实时翻译、智能导航及场景化智能...

海光芯正赴港IPO: AI光模块增速全球领先

近日,北京海光芯正科技股份有限公司向港交所递交招股书,华泰国际担任独家保荐人。作为光电互连产品供应商,其光模块及有源光缆广泛应用于AI数据中心,支撑高速高密度数据传输。据弗若斯特沙利文...