《智能家电语音交互国标发布 2025年9月起实施》
市场监管总局(国家标准委)近日批准发布《智能家用电器的语音交互技术第1部分: 通用要求》(GB/T 45354.1-2025)国家标准,该标准将于2025年9月1日正式实施。新标准对智能家电的语音交互功能提出全面技术要求,涵盖结构设计、安全性、功能性和标注标识四大维度。在结构设计方面,标准要求传声器和扬声器位...
市场监管总局(国家标准委)近日批准发布《智能家用电器的语音交互技术第1部分: 通用要求》(GB/T 45354.1-2025)国家标准,该标准将于2025年9月1日正式实施。新标准对智能家电的语音交互功能提出全面技术要求,涵盖结构设计、安全性、功能性和标注标识四大维度。在结构设计方面,标准要求传声器和扬声器位...
近日,汽车语音识别系统研发商Hi Auto宣布完成1500万美元A轮融资,投资方包括Delek Motors、Vasuki Tech Fund等多家机构。该公司自主研发的噪音分离与语音增强技术,可精准识别驾驶员声音,有效屏蔽车内外的噪音干扰,解决了传统音频技术难以消除的复杂噪声问题。Hi Auto的创新方案提升了车载语音交互的准...
微信官方今日推出新功能,用户在聊天时使用"引用"功能,不仅可以回复文字,还能发送语音和表情包。这一升级极大丰富了用户的互动方式。此前,引用消息仅限于文字回复,而现在,长按聊天中的某条消息并选择"引用",即可针对该消息进行多样化回复。微信团队提醒,只需将应用更新至最新版本,便可体验该功能。此...
微软昨日面向Beta频道的Windows Insider成员推送了KB5053654更新,将Windows 11 23H2版本号提升至Build 22635.5160。此次更新重点优化了无障碍功能与AI交互体验。新增功能方面,讲述人(Narrator)新增语音回顾(Speech Recap)功能,视障用户可通过快捷键查看近期500条播报内容,并支持文本转录与复制,便于...
数据挖掘者Luna近日发现,Meta在Quest VR头显最新的v76系统版本中隐藏了一项3D语音通话功能,其设计灵感显然来自苹果Vision Pro的Persona功能。不过,由于Quest无法像Vision Pro那样扫描用户头型生成拟真3D头像,Meta选择直接调用用户自定义的3D虚拟形象,通过实时捕捉头部动作和语音,实现类似的"面对面"...
微软近日向Windows 11 Beta预览版用户推送了Build 26120.3653(KB5053658)更新,重点引入两项新功能。快速机器恢复(QMR)作为Windows弹性计划的一部分,现已面向Insider用户开放。该功能可自动检测并修复启动问题,通过Windows恢复环境(WinRE)联网发送诊断数据,由微软针对性推送修复方案,显著减少系统停机...
微软今日向Dev通道的Windows 11预览版用户推送KB5054687补丁,版本号升级至Build 26200.5516。此次更新延续24H2底层框架,重点优化了Copilot+ PC的本地语义搜索功能,支持用户通过自然语言查找文档、图片及设置,并兼容中英法等多语言。此外,改进的Windows搜索现可联动OneDrive云端照片,企业账户暂仅支持...
科技媒体NeoWin报道,OpenAI今日全面升级ChatGPT高级语音模式(Advanced Voice Mode),重点提升对话流畅度并新增实用功能。新版本减少意外打断问题,允许用户暂停对话以便整理思路,同时优化付费用户的语音个性化体验,提供9种风格化人声选项,包括随和的Arbor、热情的Breeze及沉稳的Cove等。OpenAI后训练团...
[太平洋科技快讯]近日,OpenAI宣布推出一系列创新的语音模型,包括gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts,这些模型在语音识别和处理方面取得了显著突破。OpenAI此次推出的gpt-4o-mini模型,以其高性价比和强大功能脱颖而出。该模型在成本上较GPT-4o降低了96%至97%,同时比GPT-3.5 ...
OpenAI于3月20日发布博文,宣布推出语音转文本和文本转语音两大模型,进一步提升语音处理能力。新推出的gpt-4o-transcribe与gpt-4o-mini-transcribe两款语音转文本模型,在单词错误率、语言识别及准确性上超越现有Whisper系列,支持超100种语言,尤其在嘈杂环境、口音及不同语速下表现更佳。与此同时,Open...
3月20日OpenAl进行了技术直播发布了三款全新语音模型,专用于开发语音 AlAgent。两个是语音转文本模型 GPT-40 Transcribe和GPT-4 Mini Transcribe;一个是文本转语音模型 GPT-40 MiniTTS。OpenAl还特意开发了一个新网站来展示新功能。
人工智能初创公司Anthropic正在为其AI驱动的聊天机器人Claude开发语音功能。该公司首席产品官迈克・克里格透露,Anthropic计划推出一系列让用户能够与AI模型进行语音交流的体验,以提升用户界面的自然性。克里格表示,语音交互可能成为操作计算机的更自然方式,并透露公司已在内部开发了一些语音功能原型...
微软今日向Dev和Beta渠道用户发布了Windows 11 24H2 Insider Preview Build 26120.3576(KB5053650)预览版更新。此次更新聚焦于语音访问功能的优化,新增对简体中文(zh-cn)和繁体中文(zh-tw)的支持,用户可通过自然语言实现系统导航、听写及交互操作。例如,"请打开Edge浏览器"等灵活句式均可被识别,同时...
3月17日,百度旗下新搜索智能助手文小言宣布已全面接入文心最新两款大模型4.5和X1,以及DeepSeek-R1满血版,并支持多种模型自动调度。用户可自行选择使用特定模型或智能模式,获得更快速的响应、更丰富精准的结果。据悉,文小言近期还将上线全新升级的端到端语音对话、拍照搜索、AI 生视频等功能,并免费向...
近日,任天堂一项关于"集成语音聊天功能的系统"专利通过美国专利局申请,显示即将推出的Switch 2可能原生支持语音连麦功能。根据专利图示和预热视频,新机型可能配备专属语音连麦按钮,但目前尚不清楚是否需要NSO会员资格。相比初代Switch,玩家需依赖任天堂Switch Online应用进行语音聊天,新功能的加入将...
《消费者报告》最新研究发现,市场上多款热门语音克隆工具缺乏有效的安全防护机制,可能导致欺诈和滥用行为。该报告对六家公司的产品进行了调查,包括Descript、ElevenLabs、Lovo、PlayHT、Resemble AI和Speechify。结果显示,仅Descript和Resemble AI采取了防止工具滥用的措施,其他公司仅依赖用户自我声...
微软公司于3月10日发布博文,邀请Windows Insider项目成员在Windows 11系统上测试新版Copilot应用。此次更新显著提升了语音交互的便捷性,为用户带来更流畅的体验。更新至1.25024.100.0版本后,用户只需按住Alt + 空格键两秒,即可启动Copilot语音对话。启动后,屏幕上将出现一个带有麦克风图标的小窗口,...
努比亚今日宣布,新一代国民小折叠手机 Flip 2 将于3月4日16: 00正式发布。这款新机被誉为"2025行业首款全尺寸内嵌 DeepSeek 小折叠",搭载了拥有6710亿参数的全尺寸模型,提供全语音AI萌宠功能,支持拟人语调聊天和智能语音交互。Flip 2 的外屏可视面积较前代提升一倍,高频App全适配,极大提升了用户体验...
2月25日,ElevenLabs 宣布推出 ElevenReader Publishing 平台,利用AI语音技术帮助作者轻松制作有声书。该平台旨在简化复杂的有声书制作流程,降低成本,让更多书籍能够以有声形式呈现给读者。过去几个月,ElevenLabs 已与多位知名人士合作,成功将他们的作品转化为有声书。现在,这项技术向所有人开放,使每...
OpenAI 于2月26日在X平台宣布,免费开放ChatGPT的高级语音模式(Advanced Voice Mode),使更多用户能够体验自然流畅的语音对话。该模式基于优化后的GPT-4o mini模型,在计算效率上进行了提升,性能接近完整版GPT-4o模型。此前,这一功能仅限付费订阅用户使用,现在所有用户只需点击屏幕右下角的语音图标即可...