豆包支持多地方言语音对话
11月28日,豆包宣布其语音对话功能新增支持多种方言。通过语音模型方言迁移技术,豆包可实现单音色说多方言,并能根据用户意图自动切换。目前默认音色支持粤语、东北话、陕西话和四川话,语音表达更自然地道。用户更新App后,可通过文字或语音指令开启方言对话。此外,豆包还能听懂上海话、南京话等18种方...
11月28日,豆包宣布其语音对话功能新增支持多种方言。通过语音模型方言迁移技术,豆包可实现单音色说多方言,并能根据用户意图自动切换。目前默认音色支持粤语、东北话、陕西话和四川话,语音表达更自然地道。用户更新App后,可通过文字或语音指令开启方言对话。此外,豆包还能听懂上海话、南京话等18种方...
2025年11月25日,OpenAI宣布将ChatGPT的"语音模式"整合至主聊天界面,实现语音、视觉与文本的多模态交互。用户现可在同一窗口进行语音对话,同时查看地图、图片等视觉信息,并浏览实时文字转录,无需切换模式。新功能支持个性化设置,用户可选择保留沉浸式音频体验。此次更新是OpenAI持续优化产品体验、拓...
2025年11月24日,微软宣布将在Windows系统中推出"语义告别词"功能。用户可通过说出"Bye, Copilot"结束与AI助手的交互,实现全程免手动操作。该功能适用于安装了Copilot应用的Windows 11及Windows 10设备,并非仅限于AI+ PC。根据微软路线图ID 529864,预览版将于本月开始推送,正式版预计12月上线。目前该...
微软本周推出Windows 11 Build 26220.7262预览版更新,为开发者和测试者带来多项功能升级。本次更新重点增强了辅助功能,旁白和放大镜现已支持基于生成式AI技术的英语高解析度语音,通过智能调整语调节奏实现更自然的朗读体验。系统新增实验性AI智能体功能开关,同时改进了Click to Do操作菜单设计,使常...
苹果今日发布 iOS 26.2 Beta 3 系统更新,带来多项实用改进。此次升级为 AirDrop 引入临时访问码功能,用户可在设置中生成有效期达 30 天的一次性代码,实现与非联系人安全共享文件,提升使用灵活性。系统代码还显示,欧盟地区或可自定义侧边按钮启动第三方语音助手,如谷歌 Gemini 或亚马逊 Alexa,此举被...
前Meta员工创立的Sandbar公司推出全新智能戒指Stream Ring,另辟蹊径切入可穿戴市场。该设备不测心率、不计步数,而是聚焦于即时捕捉语音备忘录并与AI互动。其设计灵感源于智能手机难以快速记录灵光乍现的瞬间。用户只需按住戒指上的触摸板,即可激活麦克风录音,内容通过蓝牙传输至配套应用并自动转录。...
微软近期在Windows系统中逐步上线"Hey, Copilot"语音操控功能,旨在通过自然语言指令提升操作效率。然而,一则官方宣传视频引发广泛争议。视频中,用户请求调大屏幕文字以便长辈阅读,Copilot却引导其进入"显示设置"而非更合适的"辅助功能",且建议的缩放比例已是当前默认值,最终仍需手动调整完成。此举暴...
奥斯卡得主马修・麦康纳与迈克尔・凯恩近日与人工智能语音企业ElevenLabs达成合作,授权其使用AI技术生成个人语音。麦康纳将借助该技术将其创办的《生活诗篇》转化为西班牙语有声版本,旨在拓展全球受众。凯恩则强调,合作意在"放大而非取代人类声音",助力更多人传递故事与情感。ElevenLabs同步推出"标...
专注对话式人工智能开发的Wiz AI近日宣布完成数千万美元B轮融资。本轮融资由SMBC Asia Rising Fund、Beacon Venture Capital等机构领投,现有投资方跟投。作为人工智能语音服务商,Wiz AI通过个性化呼入呼出电话解决方案,帮助企业降低人工成本并提升客户服务质量。公司业务已延伸至呼叫中心智能化转型...
Meta FAIR团队近日推出全新"全语种自动语音识别系统",突破性地支持1600余种语言的语音转写,其中500种语言首次实现AI覆盖。该系统在78%的测试语言中字符错误率低于10%,对训练数据超过10小时的语言更达到95%准确率。创新性的"自带语言"功能允许用户通过少量语音文本样本快速扩展新语种,理论支持上限可...
伦敦政治经济学院与Jabra联合研究显示,到2028年语音AI或将成为主要工作方式。研究表明,随着人工智能技术快速发展,未来员工将更多通过口述完成工作内容,键盘输入将逐渐转为辅助操作。Jabra全球品牌传播负责人保罗・塞普顿指出,Alpha世代进入职场后,语音技术将全面普及。届时人们将先用语音生成初稿,再...
宝马即将在车内引入全新升级的亚马逊语音助手Alexa+,成为首批应用该技术的汽车制造商之一。此次合作基于宝马OS 9系统及新一代X系列车型,依托亚马逊云科技Amazon Bedrock平台,整合70种大语言模型,显著提升对话理解能力。用户可通过自然语言语音指令控制导航、媒体播放、空调等车辆功能,交互更流畅、响...
微软近日在Microsoft 365 Copilot移动应用中正式上线语音对话功能,用户可通过语音与AI助手进行自然交互。该功能支持用户在Copilot回答过程中随时打断,并可要求调整语调或语速,实现更流畅的实时语音交流。目前语音功能已在iOS和Android平台逐步推送,仅限持有Copilot许可证的用户使用。微软强调,所有语...
2025年10月29日,豆包语音团队发布"AI多人有声剧"自动化方案。该方案支持多角色、高表现力的TTS语音合成,实现从文本到成品的全自动AI后期制作。通过该技术,小说可直接转化为高质量多人有声剧。首批作品已在番茄小说APP上线,提升内容生产效率。免责声明: 本文内容由开放的智能模型自动生成,仅供参考。
10月31日,《逆水寒》手游资料片更新,AI门客迎来重要升级,正式上线"陪伴功能"。此次更新中,AI门客掌握两项核心技能: 一是"同游约拍",玩家可提出具体拍摄需求,门客将作为御用司机与摄影师,自动规划路线并选取最佳角度光影完成单人写真,支持"原地推荐"智能构图。二是语音指令交互,开启语音开关后,玩家可...
网络安全公司NCC Group披露,AI技术正加速语音深度伪造向"实时"演进,攻击者可在通话中即时模仿他人声音,实现近乎100%的欺骗成功率。该技术被称为"深度伪造语音钓鱼",仅需中等算力即可运行,在搭载RTX A1000显卡的设备上延迟低于0.5秒,且语音自然流畅。结合来电号码伪造,测试中几乎每次都能成功骗过目标...
微软正式确认,Windows 11将演进为"智能体操作系统"(Agentic OS),推动人机交互进入新阶段。通过"Hey Copilot"语音唤醒,用户可让系统自主理解并执行跨应用的复杂任务。这一能力依托于新引入的"模型上下文协议"(MCP),使Copilot等AI智能体能安全调用原生应用,实现文件编辑、流程自动化等操作。Copilot Ac...
微软近日宣布,Windows 11中的Copilot正式支持语音唤醒指令"Hey Copilot",用户无需手动点击或使用快捷键,只需说出指令即可激活语音助手。该功能与早年Windows Phone上的Cortana唤醒方式相似,响应后系统将发出提示音并弹出麦克风窗口,支持连续对话,说"goodbye"或静默数秒后自动退出。目前该功能已向所...
在Win10系统正式结束支持的今天,微软于X平台预告"周四将有大事发生",引发业界对Win11新功能的猜测。科技媒体Neowin分析称,此次更新或聚焦输入方式革新,旨在推动语音交互成为核心操作手段。微软近年持续强调重塑人机交互,其操作系统安全负责人曾展望,未来键盘鼠标或如MS-DOS般淡出视野,转向多模态与环...
微软官方预告将于本周四发布有关Windows系统的重大公告,暗示将改变用户与电脑的交互方式。Windows部门负责人帕万・达武鲁里近期指出,未来用户可直接通过语音操作电脑,系统能理解语义并执行复杂任务。企业与安全事业部副总裁大卫・韦斯顿也透露,计算机将具备"看见"和"听见"能力。...