OpenAI升级AI开发工具 新增TypeScript支持并强化语音交互
OpenAI于6月3日宣布对其AI智能体开发工具进行多项升级,涵盖开发者生态扩展与语音交互优化。其Agents SDK新增TypeScript支持,覆盖JavaScript和Node.js开发者,功能与Python版本对齐,包括任务转交、行为约束及执行追踪等核心组件,同时通过模型上下文协议(MCP)确保智能体步骤间流畅协作。针对语音应用场...
OpenAI于6月3日宣布对其AI智能体开发工具进行多项升级,涵盖开发者生态扩展与语音交互优化。其Agents SDK新增TypeScript支持,覆盖JavaScript和Node.js开发者,功能与Python版本对齐,包括任务转交、行为约束及执行追踪等核心组件,同时通过模型上下文协议(MCP)确保智能体步骤间流畅协作。针对语音应用场...
5月29日,移远通信发布智能AI语音FWA/MBB整体解决方案,以5G模组为核心,深度融合AI大模型技术。该方案集成高精度语音识别模块,可精准捕捉中英文指令,并支持对接DeepSeek、ChatGPT等主流AI模型,实现意图识别与情景理解功能。通过移远5G模组的驱动,该方案为固定无线接入(FWA)和移动宽带(MBB)用户提供更高...
[太平洋科技快讯]苹果近日公布了一项名为《Foundation Model Hidden Representations for Heart Rate Estimation from Auscultation》的研究报告,探索了利用语音处理的基础模型估算心率的可行性。尽管语音处理模型最初是为识别语音而设计的,但苹果的研究人员发现,这些模型同样能够有效处理心音图(Pho...
微软今日向 Canary 通道的预览体验用户推送了 Windows 11 Insider Preview Build 27868 更新。新版本对语音访问功能进行了优化,新增沉浸式产品内体验,便于用户快速了解并尝试新特性。此外,本次更新还修复了多个问题,包括手写笔输入无响应、Spotify 等应用无法启动以及微软商店安装失败(错误代码 0x80...
Anthropic公司近期为其Claude聊天机器人推出了"语音模式",该功能目前处于测试阶段,支持用户通过语音与Claude进行完整互动。根据官方信息,语音模式将以英语版本在未来几周内上线。此功能由Claude Sonnet 4模型驱动,旨在让用户在双手不便时,仍能通过语音交流并听到回应。语音模式不仅支持文档和图像讨...
5月28日,腾讯混元发布并开源语音数字人模型HunyuanVideo-Avatar。该模型由腾讯混元视频大模型与腾讯音乐天琴实验室联合研发,支持多景别、多风格及双人场景,可生成高一致性和高动态性的视频。用户上传人物图像与音频后,模型能自动理解环境与情感信息,生成包含自然表情、唇形同步和全身动作的视频,助力...
任天堂近日公布,即将推出的Switch 2游戏机内置GameChat语音聊天功能将要求用户绑定手机号进行验证。首次使用时,所有用户需通过短信验证手机号,16岁以下玩家还需家长通过Parental Controls应用授权。作为任天堂首款实时社交功能,GameChat支持4人视频通话或24人语音群聊,用户可通过手柄新增的"C键"快速...
5月23日,深兰科技发布一款人工智能语音病历自动生成系统。该系统利用先进的语音识别和自然语言处理技术,可快速将医生口述内容转化为结构化电子病历。这一创新工具旨在提高医务人员工作效率,减少手动记录时间。系统适用于各类医疗机构,有助于提升医疗信息化水平。免责声明: 本文内容由开放的智能模型...
在谷歌I/O大会上,实时语音翻译功能正式亮相,将率先应用于Meet视频会议平台。借助Gemini人工智能技术,该功能可将用户语音实时翻译成对方使用的语言,同时保留语义、语气及情感表达。目前,此功能已向Pro和Ultra订阅用户开放,并计划年内推广至企业客户。演示中,一位英语用户与西班牙语同事通话时,系统自...
2025年5月, DoorDash宣布停止为餐厅客户提供语音订单的人工智能产品。该项目运行了一年,但因效果或需求未达预期而结束。此举表明公司可能重新评估AI技术在业务中的应用方向。免责声明: 本文内容由开放的智能模型自动生成,仅供参考。
5月20日,Keep上线AI教练(卡卡)新版本,增加图片识别、语音反馈等功能。新版位于APP一级页面,可生成智能运动方案、提供训练指导及饮食评价。AI教练根据用户目标、场地和器械情况制定个性化计划,并在训练中实时调整。图片识别功能可分析食物信息并提供建议,语音指导覆盖多种运动场景。3月发布的Kinetic....
[太平洋科技快讯]5月19日,在nova 14系列及鸿蒙电脑新品发布会上,华为正式发布了旗下首款鸿蒙商用笔记本电脑——华为擎云 HM940, 该机提供两种配置版本: 24GB+512GB 和 32GB+1TB,并有晴蓝和砚黑两种颜色可选,但具体价格尚未公布。在硬件方面,华为擎云 HM940 机身重量仅为 970 克,厚度仅 13....
据外媒报道,任天堂即将为Switch 2推出"Game Chat"游戏聊天功能,新增文字转语音和实时字幕技术。玩家输入的文字消息可由系统朗读,同时在聊天过程中,其他玩家的语音将被即时转录为文字显示,极大提升了交流便利性和无障碍体验。此外,"Game Chat"支持多玩家语音交流,并能同步共享不同游戏的画面内容。例...
据彭博社报道,苹果计划为欧盟用户开放设置第三方语音助手为默认选项的权限,涵盖iPhone、iPad和Mac等设备。爆料人Mark Gurman和Drake Bennett透露,此举旨在顺应欧盟法规要求,未来用户或可选择亚马逊Alexa、谷歌助手等替代Siri。此前,苹果已在欧盟允许第三方应用替代默认浏览器、导航等服务,此次调整进...
5月16日,AI企业MiniMax发布新一代语音大模型Speech-2。该模型在Artificial Analysis和Hugging Face TTS Arena两项权威榜单中超越OpenAI与ElevenLabs,位列第一。此成果标志着MiniMax在语音技术领域取得重要突破,进一步提升国际竞争力。免责声明: 本文内容由开放的智能模型自动生成,仅供参考。
明裕丰基于上海海思WS63解决方案,正式发布业界首款商用星闪AI智能语音模组。该模组集成了星闪SLE、Wi-Fi 6和BLE技术,具备小尺寸、高性能、低延迟的优势,广泛应用于智能家电、AI玩具、机器人及工业运维等领域。MYF-F63AI01-DK开发板以上海海思HiSpark为核心,提供一站式AI接入方案,大幅降低开发门槛。...
微软近日向Windows Insider项目成员推送了新版Microsoft Copilot应用程序(1.25051.10.0及以上),重点加入了"Hey Copilot"语音唤醒功能。用户启用该选项后,可通过语音指令唤醒Copilot,无需手动操作即可开启AI对话。目前,该功能仅支持英语,且需在设备解锁状态下使用。微软表示,唤醒词识别仅在本地完成,...
5月12日,支付宝推出"好友语音通话功能",旨在保障用户资金往来安全。用户可通过实名认证的好友发起语音通话,核实身份以避免诈骗风险。该功能仅限相互添加的好友使用,用户可设置隐私保护。分析师认为,此举有助于增加用户黏性和使用频次,但主要目的是优化支付安全性,而非社交转型。此外,支付宝近期还推...
近日,Search Engine 播客节目披露了一项关于苹果信息应用(Messages)的奇怪问题。用户在发送包含"&"符号的语音消息时,会出现消息丢失的现象。例如,提及品牌名称"Dave & Buster's"或"Tiffany & Co."时,语音消息会在接收端凭空消失,仅显示三个小点,随后彻底不见。经开发者 Guilherme Rambo 研究发现,问...
科技快报网5月12日消息,近日支付宝新上线了语音通话功能。用户升级至最新版本支付宝后,在消息界面与好友聊天框中点击 "+",即可找到语音通话入口。若首次使用,页面会提示该功能特点: 账号经支付宝实名认证,安全有保障;通话无变声,确保真实性;支付宝不储存通话内容,保障用户隐私。​邀请免责声...