第一科技网

10 08月 2025

苹果测试全新Siri语音功能,或重塑iPhone交互方式

据彭博社记者马克・古尔曼透露,苹果正在测试一项全新的Siri语音功能,旨在让用户通过语音指令实现对iPhone的精准操作,涵盖跨应用控制、内容编辑与发布、商品浏览及加入购物车等,操作过程无需触碰屏幕。该功能基于改进的App Intents技术,原计划随新一代Siri一同发布,但因测试与兼容性问题,预计将于明年...

08 08月 2025

Meta收购情感语音AI初创公司Waveforms

近日,Meta宣布收购以色列音频AI初创公司Waveforms,该公司专注于开发能够识别语气、语调和口音等语音细微差别的音频大语言模型(LLM)。此次收购将进一步增强Meta在语音交互和情感计算领域的技术布局。Waveforms的技术有助于提升AI在语音助手、客户互动等场景中的情感理解能力,为用户提供更自然的交流体...

06 08月 2025

SoundHound二季报前瞻:语音AI业务增长推动营收加速

2025年8月7日,SoundHound AI(SOUN)将在美股盘后公布第二季度财报。分析师预计公司营收约3290万美元,同比增长145%,非GAAP每股亏损0.05美元。SoundHound重申全年营收指引为1.57亿至1.77亿美元,并计划在2025年底实现调整后EBITDA盈利。投资者将重点关注公司在餐饮、汽车、医疗等垂直领域的客户增长及订...

06 08月 2025

思科遭遇语音钓鱼攻击致用户信息泄露

网络设备巨头思科近日通报一起安全事故,一名员工遭语音钓鱼攻击,导致部分用户基础资料信息外泄。公司于7月24日发现该事件,调查显示攻击者通过诱骗员工获取了第三方CRM系统的访问权限。泄露信息包括用户姓名、所属机构、地址、用户ID、邮箱、电话号码及账户创建日期等。思科强调,企业客户的机密信息、...

06 08月 2025

微软展望2030年Windows愿景:AI驱动、语音主导人机交互

微软操作系统安全副总裁David Weston近日在一段视频中描绘了2030年Windows的未来图景,重点聚焦安全性、人工智能与商业应用。他预测,Windows将采用多模态交互方式,语音将成为主要操作手段,人们可通过对话让电脑"听用户所听、看用户所见",执行复杂任务。Weston认为,未来键盘与鼠标操作将逐渐被边缘化,...

05 08月 2025

微软宣布2026年起旧版Office 365将停用语音相关功能

科技媒体bleepingcomputer 8月4日报道,微软宣布自2026年1月底起,旧版Office 365应用将不再支持听录、听写和朗读功能。为继续使用这些功能,用户需在截止日期前将Office更新至16.0.18827.20202或更高版本。听录功能可将语音实时转为文字,便于回顾会议等内容；听写支持语音输入文本,朗读则将文字转为语...

31 07月 2025

微软推出DragonV2.1语音模型:支持百种语言,发音准确性提升12.8%

科技媒体NeoWin报道,微软近日发布新一代DragonV2.1 Neural零次学习模型,该文本转语音系统仅需数秒语音样本即可生成超100种语言的逼真语音。相比前代产品,新模型在发音准确性方面取得突破性进展,单词错误率平均降低12.8%,特别改善了专有名词的发音问题。这项技术创新通过SSML音素标签和自定义词典实现...

25 07月 2025

小米公布车外语音控制专利

2025年7月25日,小米汽车科技有限公司、北京小米移动软件有限公司及北京小米松果电子有限公司共同申请的'车外语音控制方法、装置、存储介质及电子设备'专利正式公布。该专利旨在实现车辆外部环境下的语音控制功能,提升智能汽车的交互体验。此项技术的发布体现了小米在智能出行领域的持续布局与创新。...

23 07月 2025

亚马逊收购AI可穿戴设备公司Bee 加码智能语音交互布局

人工智能可穿戴设备初创公司Bee近日被亚马逊收购,具体交易条款未公开。Bee的核心产品为智能腕带,内置人工智能及麦克风,可实时监听并分析用户对话,自动生成摘要、待办事项或执行其他任务。此次收购或将为亚马逊的智能语音生态补充关键技术,进一步拓展其在AI硬件领域的应用场景。行业分析指出,亚马逊此...

23 07月 2025

小红书可以发语音评论了?官方:内测中暂时不支持主动开通

近日,社交媒体上众多网友反馈,小红书的评论区可以发语音了。还有网友回复道: 仿佛听到了以后评论区吵架的盛况。不过很多网友的小红书App并没有此功能,即便更新也没有。据小红书官方提示,该功能尚未全量开放,还在内测中,仅部分用户可见,暂时不支持主动开通。不过,这不是小红书第一次涉足语音社交领域...

22 07月 2025

微信灰度测试语音转文字自动发送功能

微信近日面向部分用户启动"语音转文字内容自动发送"功能内测。用户在聊天界面点击新增的语音输入按钮后,系统会实时将语音转换为文字显示在输入框中。该功能采用微信自研语音识别技术,对普通话的识别准确率较高。值得注意的是,用户只需在说完内容后连续说出"over over"指令,系统...

22 07月 2025

小红书语音评论功能仍在内测

2025年7月22日,小红书社区客服回应语音评论功能相关问题时表示,该功能目前仍处于内测阶段,仅对部分用户开放,暂不支持主动开通。语音评论功能旨在为用户提供更多互动方式,但具体上线时间尚未公布。免责声明: 本文内容由开放的智能模型自动生成,仅供参考。

18 07月 2025

Mistral AI升级Le Chat:新增深度搜索、语音输入与项目管理功能

Mistral AI近日宣布为其聊天机器人Le Chat推出多项新功能,包括Deep Research深度搜索、Think Mode推理模式、语音输入模式以及文生图二次编辑功能,现已在网页版与移动App上线并开放免费试用。其中,深度搜索功能可对用户问题进行拆解,并通过联网检索生成结构清晰、附带来源的报告,提升信息获取效率。语...

16 07月 2025

Willow Voice获420万美元融资,AI语音输入工具加速普及

Willow Voice是一家致力于打造人工智能语音输入平台的初创企业,其核心产品是一款可将自然语音实时转化为规范文本的AI工具,旨在替代传统键盘输入方式。该工具兼容所有基于macOS的应用程序,结合上下文识别技术,能准确处理专业术语、姓名及短语,并自动纠正语法、去除口头填充词,实现智能化文本格式化。...

14 07月 2025

Meta收购语音AI企业Play.AI 加速人工智能语音领域布局

科技巨头Meta近日宣布完成对语音人工智能平台Play.AI的收购,该公司团队将整体加入Meta。Play.AI专注于构建AI语音模型及代理平台,其技术可帮助开发者和企业快速部署语音应用程序,覆盖客户支持、销售、内容创作等多个应用场景。此次收购将强化Meta在人工智能语音领域的技术储备,为其元宇宙及社交生态提...

14 07月 2025

Meta确认收购语音AI初创公司PlayAI,强化AI语音技术布局

彭博社当地时间11日报道,Meta已正式完成对语音AI初创企业PlayAI的收购,该公司全体成员将于本周加入Meta。PlayAI团队专注于人声克隆技术,未来将向此前从Sesame AI加入Meta的Johan Schalkwyk汇报工作。根据彭博社披露的内部备忘录,Meta表示PlayAI在自然语音生成及语音创建平台方面的技术,与其在AI角色...

12 07月 2025

Meta收购语音AI公司PlayAI,持续布局人工智能领域

近日,科技巨头Meta宣布收购语音AI初创企业PlayAI,进一步加强其在人工智能领域的技术储备。此次收购将助力Meta在语音识别和AI交互方向的发展,同时公司表示将继续招募全球顶尖AI人才,推动相关技术的商业化落地。免责声明: 本文内容由开放的智能模型自动生成,仅供参考。

11 07月 2025

微信测试语音转文字快捷功能输入框新增麦克风图标

据用户反馈,微信聊天界面近日出现新变化,部分用户输入框右侧新增了麦克风图标。点击该图标可直接启用语音转文字功能,操作时图标背景变为绿色。目前该功能仍处于灰度测试阶段,仅限部分用户体验。微信此前已支持语音转文字功能,需通过「+」菜单中的"语音输入"使用,支持普通话、粤语和英语。此次调整主...

11 07月 2025

苹果新专利:锁屏状态下可通过Siri语音指令完成转账

据The Mac Observer报道,苹果近日提交了一项新专利(US2025/0225985A1),允许用户在锁屏状态下通过语音指令直接操作Siri完成转账或访问个人数据等敏感任务。根据专利描述,设备会监听自然语音输入,并通过风控系统判断指令风险。若未触发警报,系统将进一步验证已连接的配件(如Apple Watch或AirPods)的安...

10 07月 2025

谷歌Gemini应用上线图像转视频功能,支持添加音效与语音

谷歌今日在Gemini应用中推出基于Veo 3模型的图像转视频功能,用户可将照片转化为最长8秒的短视频,并添加背景音效、环境声或对白,实现画面与音频同步。该功能已面向部分地区的AI Ultra和AI Pro用户开放,率先登陆网页版,移动端将在本周逐步上线。使用时,用户只需点击"工具"中的"视频"选项,上传图片并输...