最新最快科技资讯
太阳能光伏网

搜索

联发科开源AI语音识别模型MR BreezeASR 25,优化台湾地区用语识别

联发科旗下联发创新基地近日发布基于OpenAI Whisper优化的AI语音识别模型MR BreezeASR 25,该模型针对中国台湾地区用语及口音进行了专项优化。例如,模型能够准确识别"发生什么事",避免误听为"花生什么事",同时在中英混合用语场景下的识别精准度显著提升。数据显示,MR BreezeASR 25的识别精度较原版Ope...

Switch 2首发破纪录,GameChat语音功能细节曝光

任天堂Switch 2于2025年6月5日全球首发,首日销量突破300万台,刷新PlayStation 4保持的单日销售纪录。其热门功能GameChat引发广泛关注,该功能支持12人语音聊天,其中4人可共享屏幕。玩家通过Joy-Con的C键快速开启会话,但需提前添加好友以确保安全性。值得注意的是,GameChat单次会话最长持续24小时,系统...

科大讯飞语音合成技术实现新突破

6月26日,科大讯飞宣布其语音合成技术完成升级,重点提升一句话声音复刻与超拟人合成能力。此次升级基于星火语音大模型,通过层次化语音建模框架及音色编码增强等技术,显著提高音色还原度,并精准模拟用户语言习惯;超拟人合成则赋予AI声音"上下文情商"。目前该技术已广泛应用于全国5万余所学校、600家医...

科大讯飞语音合成技术升级,声音复刻与超拟人能力实现突破

6月26日,科大讯飞语音合成技术全新升级,一句话声音复刻与超拟人合成两大核心能力实现突破。据评测数据显示,科大讯飞一句话声音复刻技术在相似度、准确度等维度行业领先。据介绍,此次一句话声音复刻技术升级在星火语音大模型底座基础上,构建了一套层次化语音建模框架,在此框架下进行音色编码增强和强...

Meta洽谈收购AI语音公司PlayAI

2025年6月27日,扎克伯格旗下的Meta Platforms正在就收购AI语音初创公司PlayAI进行洽谈。此次收购若达成,将增强Meta在人工智能语音领域的技术实力,推动其在智能助手、语音识别等方向的发展。目前交易细节尚未公开。免责声明: 本文内容由开放的智能模型自动生成,仅供参考。

Hengbot推出智能机器狗Sirius:支持语音对话与敏捷运动

Hengbot近日发布新款机器狗Sirius,主打敏捷运动与智能交互。该产品搭载14个运动轴及专有"Neurocore"关节,可流畅完成跳舞、踢足球等动作,并支持与真狗互动。不过,Hengbot强调其设计适用于平坦室内环境,室外使用受限;运动续航为40-60分钟,静止状态下可达1-2小时。Sirius还集成OpenAI大语言模型,用户可...

特斯拉Optimus V3机器人将集成Grok语音助手 人工智能交互再升级

特斯拉CEO埃隆·马斯克近日在社交平台透露,新一代Optimus V3人形机器人将整合Grok语音助手功能。这一升级意味着Optimus将利用先进的人工智能大模型技术,实现更自然的语音交互体验。马斯克表示,此次整合将使Optimus V3人形机器人的功能性得到显著提升,不过具体的技术细节和发布时间尚未完全披露。这标...

ElevenLabs推出独立移动应用 支持文本转语音

语音人工智能公司 ElevenLabs 近日正式上线其独立移动应用,iOS 与 Android 用户现已可在移动端便捷地将文本转化为语音片段。此前该功能仅限于网页端操作,如今用户可随时随地生成所需音频内容。只需输入或粘贴文本并选择语音模型,即可完成语音合成。免费用户享有约10分钟的音频生成时长,并可在不同音...

Sam Altman证实OpenAI将开发硬件语音AI Agent

北京时间2025年6月25日,OpenAI首席执行官Sam Altman通过邮件证实,公司将开发可与硬件交互的语音AI Agent,正式进军AI硬件领域。Altman解释此前删除与设计师Jony Ive相关信息的原因,是因OpenAI收购公司io遭AI耳机公司iyO起诉,两者名称易混淆。Altman还透露,OpenAI最初有意与iyO合作,但最终选择通过收购...

雷军:小米YU7支持车外小爱语音控制

6月24日,小米创始人雷军在微博透露,小米YU7车型支持车外小爱语音控制。他介绍,车辆外部配备了8个麦克风和1个扬声器,确保用户在不同角度都能流畅使用语音控车功能。同时,车外唤醒语音助手需通过声纹识别与钥匙双重验证,以保障安全性。该功能可实现如车外语音打开前备箱等操作。免责声明: 本文内容由开...

微信修改语音发送界面,网友称变丑了

22日晚间,"微信语音 丑"话题登顶微博热搜,部分网友吐槽微信最新修改的语音发送界面。最新的微信语音发送界面将左右两个圆形按钮改成了长条形,并将"转文字 发送"文案修改为"滑到这里 转文字",文字"松开 发送"也放置到了按钮中。从界面对比来看,新版微信语音发送界面增加了对滑动操作的文字引导,并提高...

微信语音界面改版引热议 新设计侧重中老年用户体验

今日晚间,"微信语音 丑"话题登上微博热搜榜首,部分网友对微信最新修改的语音发送界面提出质疑。新版界面将原有的圆形按钮调整为长条形,并将操作提示文字改为"滑到这里 转文字"和"松开 发送",进一步强化滑动操作的引导。从对比图可见,此次改版重点优化了按钮的易用性,...

汤姆猫实现AI机器人与宇树科技机器狗语音协同功能

6月20日,汤姆猫在机构调研中透露,已实现旗下AI机器人与宇树科技机器狗的语音控制功能协同。通过功能测试与系统集成,双方产品可结合语音交互、运动能力与环境感知等功能,未来有望应用于养老陪伴及居家服务等领域。这一合作旨在探索多功能陪伴机器人,提升情感支持与使用体验。免责声明: 本文内容由开放...

Windows 11预览版27881更新:新增语音过滤与旁白回顾功能

微软近日向Canary通道的预览体验成员推送了Windows 11 Insider Preview Build 27881版本更新。此次更新重点优化了语音输入功能,新增脏话过滤开关,开启后脏话将以"***"显示。此外,旁白功能引入语音回顾,支持查看最近500条旁白信息,并允许复制或朗读内容。在改进方面,任务栏图标视觉效果升级,Teams提醒...

谷歌推出Search Live语音搜索功能 支持多轮自然对话

谷歌今日在美国正式上线了基于Gemini模型的全新Search Live语音搜索功能,该功能已同步登陆iOS和Android平台。用户只需在谷歌应用的Labs中启用AI模式,即可体验这一创新服务。该功能的最大亮点在于支持连续自然对话,用户说出问题后,系统会以AI生成语音回应,并允许用户像日常聊天一样继续提问,无需重复...

iOS 26测试版新增语音邮件举报功能 垃圾信息管理再升级

科技媒体MacRumors报道,苹果在iOS 26首个开发者测试版中为电话应用新增"Report Spam"功能,用户可举报疑似诈骗或垃圾语音邮件,并选择保留或删除相关记录。虽然苹果未明确说明处理机制,但参考iMessage的类似功能,此举或为优化垃圾信息过滤系统。此外,iOS 26的信息应用进一步细分垃圾管理,疑似垃圾信息...

Toma获1700万美元A轮融资,AI语音代理助力汽车经销商服务升级

AI语音研发商Toma近日完成1700万美元A轮融资,由Andreessen Horowitz-a16z领投,Y Combinator、Unpopular Ventures等机构跟投。Toma专注于为汽车经销商提供智能语音代理解决方案,其AI系统可高效处理客户预约、零件订单及销售咨询等需求,帮助经销商优化服务流程。本轮资金将用于技术研发与市场拓展,进一...

ChatGPT高级语音模式迎来重大升级

OpenAI近期为付费用户推出了升级版的高级语音模式,显著优化了语音语调、自然度及情感表达。新功能让交互更加流畅且富有"人情味",支持同情、讽刺等多情绪表达,同时新增高效的多语言翻译服务。用户只需请求翻译,系统即可在对话中持续提供服务。此次更新基于此前减少语音中断和优化口音的改进,但测试中...

OpenAI更新AI编程辅助工具Codex 新增语音输入和联网功能

[太平洋科技快讯]6月4日,OpenAI 宣布升级其AI编程辅助工具 Codex 。此次升级带来了联网功能、语音输入支持,并将使用权限扩展至 ChatGPT Plus 用户。Codex 的核心更新之一是新增了联网能力,这一功能使得 Codex 能够自动处理更多任务,例如安装基础依赖项、运行代码检查(Linting)和测试,甚至执行需要访...

《最终幻想战略版》重制版9月30日发售 新增全语音与新手模式

索尼PlayStation在最新State of Play活动中宣布,《最终幻想战略版》将推出重制版《Final Fantasy Tactics: The Ivalice Chronicles》,定于9月30日登陆PS5/PS4平台。此次重制版不仅保留了原版《狮子战争》的内容,还新增全语音对白、画面升级及专为新手设计的"见习兵"难度,提供经典与增强双模式选择。...