第一科技网

12 05月 2025

支付宝上线语音通话功能确保实名真实性

5月12日,支付宝推出语音通话功能。用户更新至最新版本后,可在消息界面与好友聊天框中使用该功能。首次使用时会提示特点: 账号需实名认证,保障安全；通话无变声,确保真实性；支付宝不储存通话内容,保护隐私。免责声明: 本文内容由开放的智能模型自动生成,仅供参考。

12 05月 2025

利尔达联合上海海思推出全新星闪AI开发板,赋能智能硬件语音交互

近日,利尔达科技集团与上海海思合作推出基于FB36模组的星闪AI开发板,该产品集成Wi-Fi 6、星闪SLE 1.0及BLE 5.4三模通信协议,为AI智能对讲交互提供高效PCBA解决方案。开发板支持与DeepSeek、豆包等主流AI大模型对接,可快速实现语音交互功能,适用于AI益智玩具、智能家电及AIoT场景。FB36模组基于上海海...

09 05月 2025

特斯拉推送多版本软件更新新增后方警示音与智能语音控制功能

特斯拉近日发布2025.2.200.2、2024.45.32.13及2024.45.32.4三个软件版本,将分批推送给不同车型。其中,2025.2.200.2版本适用于部分Model 3车辆,新增多项功能: 数字版权管理系统更新确保多媒体内容正常使用；倒车时若检测到后方行人或车辆,系统将播放警示音；视觉画面显示更多物体,如交通信号灯和垃圾...

08 05月 2025

三星 Galaxy Watch 将搭载 Gemini AI 助手,支持跨应用操作与语音指令

科技媒体 Android Authority 通过逆向编译 One UI Watch 8 APK 文件,发现三星 Galaxy Watch 即将推出的 Gemini AI 助手将带来多项智能功能。该助手将取代原有的 Google Assistant,并引入 Gemini Actions,支持跨应用操作,用户无需频繁切换即可完成多项任务。代码显示,Gemini 能通过语音指令实现会议时...

07 05月 2025

英伟达开源Parakeet TDT 0.6B语音识别模型,速度提升50倍

科技媒体marktechpost报道,英伟达近日推出开源自动语音识别(ASR)模型Parakeet TDT 0.6B,在Hugging Face平台公开。该模型以速度和精度见长,仅需1秒即可处理60分钟音频,速度达主流开源ASR模型的50倍,字错率(WER)低至6.05%,位居开源ASR领域前列。Parakeet TDT 0.6B基于Transformer架构,针对英伟达硬件优...

05 05月 2025

Grok语音模式正式上线 iOS及Android订阅用户可体验

Grok今日宣布,其语音模式已在Grok应用程序中全面推出,覆盖所有iOS用户及Android平台的SuperGrok订阅者。与此同时,马斯克将X平台昵称改为"groklon rust",并更换头像,疑似配合新功能造势。此前,xAI于2月20日开放了Grok 3的免费公众服务,但X Premium+和SuperGrok订阅用户仍享有特权,包括优先使用语音模...

04 05月 2025

卢浮宫将停用任天堂3DS语音导览设备 9月启用全新替代方案

法国卢浮宫近日宣布,将于今年9月终止租借任天堂3DS语音导览设备的服务,并计划推出一款全新语音导览器,但具体细节尚未公布。自2012年起,卢浮宫与任天堂合作,使用定制版3DS作为导览设备,支持九种语言讲解,并提供高清图像放大和室内定位功能,深受游客欢迎。随着任天堂3DS于2020年停产且官方维修服务终止...

29 04月 2025

雪铁龙发布第二代C5 Aircross 标配智能语音控制与大空间设计

汽车媒体AutoCar报道,雪铁龙正式推出第二代C5 Aircross,新车基于Stellantis集团STLA Medium平台打造,车身长度增加150毫米,轴距加长600毫米,大幅提升后排腿部空间。内饰采用"C-Zen Lounge"设计理念,标配10英寸数字显示屏和"Hello Citroën"语音控制系统,并整合ChatGPT技术提升交互体验。车内可选装面...

25 04月 2025

广和通发布5G AI MiFi解决方案,融合通信与智能语音技术

4月25日,广和通推出全新5G AI MiFi解决方案,将5G通信与AI语音技术深度融合。这款便携式移动热点设备搭载高通QCM4490平台,采用4nm制程8核CPU,主频高达2.4GHz,支持3GPP R16协议和NR 2CC 120MHz技术。在Sub-6GHz频段下,设备的下行速率可达2.33Gbps。5G AI MiFi具备多语言语音唤醒与对话功能,支持20种语...

24 04月 2025

韩国Nari Labs开源16亿参数AI语音模型Dia,支持音色情绪精准调控

韩国Nari Labs工作室近日在GitHub和Hugging Face开源了文字转语音AI模型Dia,该模型拥有16亿参数,目前已获得超9300颗GitHub星标。开发者宣称,Dia在音质灵活性和自然度上超越ElevenLabs Studio、Sesame等竞品,支持对音色、情绪及语调的精细调节,还能模拟非语言交流(如笑声或咳嗽)。测试显示,Dia在声调...

24 04月 2025

Perplexity 推出 iOS AI 语音助手功能

AI 企业 Perplexity 近日宣布,其为苹果 iOS 平台应用新增 AI 语音助手功能。该功能旨在提供类似 Siri 的使用体验,同时具备更丰富的交互能力。用户可通过语音指令实现多种操作,例如地图搜索、餐厅预订、邮件草稿生成、提醒事项设置以及媒体播放控制。与传统语音助手不同,Perplexity 的 AI 助手能够跨...

22 04月 2025

Windows 11无障碍功能升级:语音访问加入快速操作面板

微软近期在Windows 11预览版中优化了无障碍功能,将语音访问(Voice Access)纳入系统托盘的快速操作面板,进一步简化了启用流程。语音访问作为一项重要功能,允许用户通过语音控制电脑,尤其为行动不便或患有慢性疾病的用户提供了便利。此前,用户需通过多级菜单手动开启,而新版本(Beta和Dev频道)直接将其...

18 04月 2025

理想汽车澄清“泼水节车门被语音解锁”传言:需手动操作

近日,网传云南泼水节期间一辆理想汽车因语音指令被解锁导致车内进水。视频称,乘客试图躲避泼水时,车外人喊"理想同学,打开车门"致使车门解锁。对此,理想汽车副总裁刘杰回应称,经核实,网传"语音解锁"不实,实为副驾乘客手动开门。理想汽车进一步测试表明,车辆无法通过外部语音唤醒解锁,车内特定指令也无...

18 04月 2025

微软为iOS版Word推出AI语音转文档功能

微软公司4月17日宣布,iOS版Word新增AI语音笔记自动结构化功能,可将录音快速转化为文档、邮件等内容。微软表示,移动设备屏幕较小,编辑文档时易遗漏关键信息,新功能旨在解决这一痛点。用户点击"加号"创建文档,选择"使用Copilot"并设定语言和模板后,即可录音。Copilot会分析语音内容并自动转录、排版。...

16 04月 2025

Anthropic即将推出Claude AI语音功能与OpenAI展开语音助手竞争

据彭博社报道,人工智能公司Anthropic计划为旗下Claude AI聊天机器人推出"语音模式",最快将于本月上线。该功能将提供三种英文语音选项,分别命名为Airy、Mellow和Buttery,旨在与OpenAI的ChatGPT语音功能展开直接竞争。Anthropic首席产品官Mike Kreiger此前透露,语音交互是公司重点开发的方向之一。应用...

14 04月 2025

LiveKit获4500万美元B轮融资,加速实时语音平台发展

实时互动技术领域再迎新里程碑。近日,开源实时平台提供商LiveKit宣布完成4500万美元的B轮融资。本轮融资由Altimeter Capital领投,红点全球基金(Redpoint Ventures)与Hanabi Capital跟投。LiveKit专注于为开发者提供构建和扩展语音、视频及数据功能的工具,助力其无缝集成至各类应用程序中。凭借其灵活...

11 04月 2025

脑机接口新突破:实时解码大脑信号恢复自然语音

加州大学伯克利分校与旧金山分校的研究团队在脑机接口领域取得重大进展。通过结合人工智能技术,他们成功开发出一种方法,能够将重度瘫痪患者的脑电信号实时转化为可听语音。该技术的核心在于"直播"解码方式,借鉴了类似语音助手的算法,显著缩短了从大脑意图到语音输出的时间,从传统约8秒降低至1秒内。...

10 04月 2025

亚马逊推出统一语音模型Nova Sonic 人机对话更趋自然

亚马逊最新发布的基础模型Amazon Nova Sonic实现了语音理解与生成的统一,显著提升了AI语音对话的自然度。该模型可精准捕捉人类对话的细微差异,流畅处理插话场景,并通过Amazon Bedrock的新API简化开发流程。此外,Nova Sonic具备语音转文字功能,开发者可利用转录文本调用工具与API,快速构建语音AI应用...

09 04月 2025

亚马逊推新AI语音模型Nova Sonic 价格比GPT-4o低约80%

[太平洋科技快讯]4 月9日,亚马逊正式推出其新一代生成式 AI 语音模型――Nova Sonic。官方表示,新模型在语音交互方面表现出色,能够自然地处理说话者的停顿和打断,并在合适的时机发言,相比亚马逊早期的 Alexa 等模型,交互体验更加自然流畅。在多语言 LibriSpeech 基准测试中,Nova Sonic 在英语、法语...

09 04月 2025

亚马逊发布新一代生成式AI模型Nova Sonic,语音处理能力媲美行业领先者

亚马逊近日推出名为Nova Sonic的新一代生成式AI模型,该模型能够高效处理和生成自然流畅的语音。据亚马逊介绍,Nova Sonic在速度、语音识别及对话质量等关键指标上表现优异,可与OpenAI和谷歌的前沿语音模型相媲美。Nova Sonic通过亚马逊Bedrock开发者平台提供服务,采用全新双向流式API接入。其成本效益...