最新最快科技资讯
太阳能光伏网

搜索

Zendesk收购Local Measure,加速扩展AI语音服务与亚马逊整合

Zendesk近日宣布已签署最终协议,收购领先的CCaaS(客户联系中心即服务)和高级语音解决方案提供商Local Measure,后者是AWS的长期合作伙伴。通过此次收购,Zendesk将进一步扩大其在复杂服务环境中的业务规模,同时显著增强其人工智能语音功能。此外,这一举措也将深化Zendesk与亚马逊连接(Amazon Connect)...

马斯克推出Grok语音模式早期测试版

马斯克在社交平台X上宣布,Grok应用程序的语音模式早期测试版已正式上线。尽管该版本可能仍存在一些问题,但马斯克表示团队将迅速解决,并强调其表现依然出色。Grok 3的语音模式允许用户通过自然语言与AI对话,提供更直观高效的信息获取和交互体验。用户可以选择两种不同声音(Ara和Grok)及不同个性,并能...

Figure AI推出Helix系统,人形机器人通过语音命令实现复杂动作

机器人初创公司Figure AI近日推出了一款名为Helix的新型人工智能系统,为人形机器人带来了突破性进展。Helix系统能够通过语音命令让机器人执行复杂动作,且无需针对每个物体进行专门训练,即可轻松处理不同物体。Helix系统由两个核心模块组成: 一个是拥有70亿参数的多模态语言模型,以7至9赫兹的频率处理...

马斯克xAI发布Grok 3:性能提升显著,语音模式延迟上线

北京时间今日中午12时,马斯克旗下的人工智能公司 xAI 正式发布了最新一代大模型 Grok 3。马斯克表示,Grok 3 的能力较前代产品提升了"一个数量级",尤其在数学推理、科学逻辑推理和代码写作等方面表现优异,在多项基准测试中超越了 DeepSeek-v3、GPT-4o 和 Gemini-2 pro 等竞争对手。此前,马斯克曾通过...

OPPO Find N5将接入DeepSeek-R1,可直接语音使用

折叠旗舰OPPO Find N5将正式接入DeepSeek-R1,并可通过语音唤醒直接使用,首批购买用户即可率先体验。Find N5 将于本月正式发布。接入 DeepSeek-R1后,OPPO Find N5 用户无需下载和复杂的操作步骤,直接通过小布助手即可语音唤醒使用 DeepSeek。Find N5 也为 DeepSeek-R1带来联网搜索的能力,还支持将 Dee...

微软 Copilot Voice 拓展多语言支持,提升语音交互体验

据科技媒体 Windows Latest 报道,微软正积极拓展其语音交互功能 Copilot Voice 的多语言支持。除了英语,Copilot Voice 现已支持德语、法语、西班牙语和印地语等语言,为全球用户带来更多选择。Copilot Voice 旨在提供更加自然和人性化的语音助手体验,用户无需手动输入,只需通过语音即可与 AI 助手对话...

科大讯飞行业首发端到端语音同传大模型

1月15日,科大讯飞发布国内首个具备端到端语音同传能力的大模型--星火语音同传大模型。针对日常对话、商务交流、行业翻译等国际交流场景中的高难度同传翻译需求,星火语音同传大模型在内容完整度、信息准确度以及语言质量上都处于行业领先水平,最快实现5秒以内的同传时延,达到人类专家译员的水平。

江淮汽车新专利可在车外通过语音指令控制车辆 江淮汽车车外语音控制车辆专利公布

天眼查知识产权信息显示,近日,安徽江淮汽车集团股份有限公司申请的"通过车外语音控制车辆的方法、装置及介质"专利公布。摘要显示,该方法包括: 确定车辆附近出现行人;截取人脸图像;判断人脸图像是否在录入的信息库中;若在,检测车辆当前是否处于休眠状态;若处于休眠状态,唤醒智能语音模块,麦克风和...

讯飞星火首发语音视觉虚拟人交互“三合一” ,亮相多语言大模型

10月24日,讯飞星火4.0 Turbo全新升级,首发多模态视觉交互,让大模型从语音交互拓展到音视频流的实时多模交互,使得情境感知更全面,任务理解更精准;首发超拟人数字人,业界率先实现语义贯穿的"口唇-表情-动作"的超拟人数字人生成,一张照片就能生成数字人,实现更加立体的个性化多维表达;此外首次发布星...

大型企业通信明智之选,迅时MX120G系列语音网关再升级

信息爆炸时代,高效、稳定的通信系统是企业运营的基石,特别是对于大型呼叫中心、政府机构、金融机构及轨道交通等关键领域而言,一个能够承载海量通话、确保数据安全、同时提供丰富功能的语音接入网关,显得尤为重要。聚焦行业需求,迅时MX120G系列网关再升级,以卓越的性能与可靠性,引领企业通信的新篇章...

Salesforce收购人工智能语音代理公司Tenyx

Tenyx是美国一家客户服务AI技术服务商,专注于为客户服务应用程序构建基于语音的智能会话代理,主要利用专有的基于神经科学的人工智能技术,创建可集成的系统。近日,Salesforce收购开发人工智能语音代理的Tenyx,以推进其人工智能驱动的解决方案。

汉王科技首款智能语音应用-汉王语音王App正式发布

DoNews8月8日消息,8月8日,汉王科技首款智能语音应用--汉王语音王App正式发布。据介绍,汉王语音王是基于汉王自研多模态天地大模型,自主研发的一款集AI语音记录、智能翻译与同声传译于一体的智能语音旗舰应用,支持AI精准转写、拍录同步(自动裁边)、话稿整理、智能总结及不间断实时翻译等功能,用户可以...

OpenAI向部分用户开放GPT-4o语音模式

当地时间7月30日,OpenAI宣布,即日起开始向部分ChatGPT Plus用户推出GPT-4o的语音模式。据OpenAI介绍,高级语音模式能提供更自然的实时对话,允许用户随时打断,并能感知和响应用户的情绪。OpenAI在今年5月推出了新版本大模型GPT-4o,同时还展示出了语音模式。该公司原定于6月底开始逐步向用户开放语音模...

ColorOS 14 七月新增语音转文字实时字幕等功能

ColorOS 官方发布了 7 月升级公告,新增多种新功能,还有细节方面的优化。语音转文字新增实时字幕功能,追剧、学习、会议讨论无障碍;计算器浮窗模式新增支持调节透明度,多窗任务不干扰;新增截屏后关闭预览浮窗,截屏操作流畅升级;新增通话记录智能筛选,快速定位全部通话及未接来电;AI 文章摘要新增支...

响应速度超ChatGpt-4o!跃然创新首款AIGC玩具BubblePal语音交互对比

免责声明: 本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实...

OpenAI 的 ChatGPT Mac 版应用已向所有用户开放,支持语音对话

OpenAI 公司发布了首款适用于 Mac 的 ChatGPT 聊天机器人应用,此前该应用曾处于测试阶段,仅限 Plus 付费订阅用户使用。现在,ChatGPT 的 Mac 应用已经面向所有用户开放下载。该应用原生支持 Mac 系统,并提供 Command + 空格键的快捷键,方便用户随时启动。用户可以轻松与聊天机器人交互,并可添加文件、...

中国电信人工智能研究院发布星辰超多方言语音识别大模型

近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型--星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。中国电信人工智能研究院用最前沿的语音...

OpenAI山姆·奥特曼:GPT-4o语音模型尚未发布

科技快报网5月16日消息,OpenAI联合创始人兼首席执行官山姆·奥特曼在当地时间5月15日就GPT-4o说明称,虽然GPT-4o的文本模式已经发布,但语音模式还未发布。

讯飞星火 V3.5 上新,同时支持长文本、长图文及长语音

4 月 22 日,科大讯飞对外宣布旗下讯飞星火大模型即将于 4 月 26 日推出 V3.5 的更新版本,首个支持长文本、长图文、长语音的大模型正式上新。此外,星火图文识别大模型、多情感超拟人合成、一句话复刻也将在此次更新中首发。面向企业级应用市场,科大讯飞也将推出智能体平台,更高效、更安全地帮助企业用...