最新最快科技资讯
太阳能光伏网

亚马逊推新AI语音模型Nova Sonic 价格比GPT-4o低约80%

【太平洋科技快讯】4月9日,亚马逊正式推出其新一代生成式AI语音模型――Nova Sonic。官方表示,新模型在语音交互方面表现出色,能够自然地处理说话者的停顿和打断,并在合适的时机发言,相比亚马逊早期的Alexa等模型,交互体验更加自然流畅。

在多语言LibriSpeech基准测试中,Nova Sonic在英语、法语、意大利语、德语和西班牙语上的平均单词错误率仅为4.2%,远低于行业平均水平。此外,在多人参与的高音量互动测试中,其单词错误率比OpenAI的GPT-4o-transcribe模型低46.7%。

Nova Sonic的平均感知延迟仅为1.09秒,比OpenAI的GPT-4o模型(响应时间为1.18秒)更快。亚马逊声称Nova Sonic是市场上“最具成本效益”的AI语音模型,其价格比OpenAI的GPT-4o便宜约80%。

Nova Sonic通过亚马逊的Bedrock开发者平台提供给用户,该平台专注于构建企业级AI应用。此外,Nova Sonic可通过一个全新的双向流式API进行接入,方便开发者快速部署和使用。Nova Sonic的部分组件已经为亚马逊升级版数字语音助手Alexa+提供了动力支持,进一步提升了Alexa+的语音交互能力。

据悉,Nova Sonic是亚马逊构建人工通用智能(AGI)战略的重要组成部分。AGI被定义为“能够在计算机上完成人类所能做的一切事情的AI系统”。亚马逊计划在未来推出更多能够理解不同模态(包括图像、视频和语音)的AI模型,以拓展其在AI领域的布局。

亚马逊表示,从Nova Sonic开始,将逐步将更多内部AI模型提供给开发者使用,以助力开发者构建各种创新应用。此外,亚马逊还推出了Nova Act的预览版,这是一个使用浏览器的AI模型,为Alexa+和亚马逊的“代我购买”功能的部分元素提供了支持。

最新相关
秘塔AI x 优刻得,让搜索回归本质

秘塔AI x 优刻得,让搜索回归本质

成长在互联网刚刚兴起的年代,我们的小时候,"微机课"比体育课还要令人期待。课间早早计划好玩哪个Flash小游戏,奔向"微机房"要给好朋友占个座,按下台式机的电源键,等待Windows系统缓缓加载……...

iPadOS26发布 多任务处理向macOS看齐

[太平洋科技快讯]6月10日,在 WWDC25 开发者大会上,苹果正式发布了全新的 iPadOS 26 系统。此次更新不仅带来了全新的设计语言,更在多任务处理和文件管理方面进行了“史诗级”的革新,...

macOS 26 Tahoe发布 Spotlight聚焦升级

[太平洋科技快讯]6月10日,苹果在WWDC25全球开发者大会上正式推出了全新操作系统macOS 26 Tahoe。最引人注目的变化莫过于其全新的系统设计语言。苹果引入了名为“液体玻璃”的半透明...

iOS26正式发布 采用全新液态玻璃设计语言

[太平洋科技快讯]6月10日,苹果在 WWDC25 上宣布迄今规模最大的设计更新,命名为“Liquid Glass(液态玻璃)”,且将所有系统统一为年份命名,因为该系统将应用到明年,因此尾缀为26。iOS ...