阿里通义实验室开源音频生成模型ThinkSound 实现AI"听懂画面"

04 07月 2025

2025-07-04 18:27

阿里通义实验室今日宣布开源首个音频生成模型ThinkSound，该模型创新性地将思维链(CoT)技术应用于音频生成领域，使AI能够逐步分析画面事件与声音的关系，实现高保真、强同步的空间音频生成。

ThinkSound由多模态大语言模型和统一音频生成模型两部分组成，通过理解整体画面、聚焦具体物体、响应用户指令三个阶段生成精准对位的音频效果。为支持模型训练，研究团队构建了多模态音频数据集AudioCoT，包含2531.8小时高质量样本，涵盖动物鸣叫、机械运转等多种真实场景，并设计了精细化的数据筛选流程。

该模型解决了传统视频到音频生成技术难以捕捉动态细节和空间关系的问题，使AI能够像人类音效师一样结构化地分析和合成声音。

我国电磁发射技术实现跨越式发展

近日,记者从第二届全国电磁发射技术论坛获悉,我国电磁发射技术在多个关键领域实现系统性突破。当前,该技术发展已从'跟跑'转变为'并跑',并在部分领域取得'领跑'优势。此次进展标志着我国在电磁...

23 08月 2025

国家超算互联网接入算力中心突破30家,中国移动发布算网大脑3.0

在2025中国算力大会主论坛上,国家超算互联网与七城算力中心完成互联互通接入仪式,标志着接入的骨干节点型算力中心突破30家,联合体成员数量超过200家,全国一体化算力调度网络加速成型。同期,中...

23 08月 2025

谷歌更新YouTube Premium服务条款,限制跨地区订阅使用

谷歌今日宣布更新YouTube付费服务条款,规定Premium、Music Premium及Lite订阅用户需主要在注册国家/地区使用服务。新条款将于2025年9月26日生效,若用户长期(超过30天)在非注册地区使用或移居...

23 08月 2025

光伏产业链价格回暖融资客加仓7只设备股

2025年8月23日,近期光伏产业链价格出现回暖迹象。受'反内卷'预期、自律销售公约及部分企业减产影响,硅料、硅片价格大幅上涨,电池片和组件价格也有所回升。数据显示,2025年上半年净利润增长的...

23 08月 2025

我国电磁发射技术实现跨越式发展关键领域取得系统性突破

据央视新闻报道,第二届全国电磁发射技术论坛近日成功举办。会上披露,我国电磁发射技术已从"跟跑"迈向"并跑",并在多个关键领域达到"领跑"水平,实现系统性突破。来自军地科研院所的120位专家学...

23 08月 2025

中国移动发布算网大脑3.0 推动智能化演进

今日,中国移动正式发布算网大脑3.0。该体系融合九天大模型,面向算网复杂环境实现自主任务规划执行的超级智能体。此举标志着算力网络中枢系统由自动化向智能化演进迈出关键一步。据悉,算网大脑...

23 08月 2025

深圳机场T2航站区及配套工程正式开工

8月23日,深圳机场宣布T2航站区北货运区及综合配套工程正式开工。该工程建成后将提升深圳机场的规模体量、保障能力与运行效率,助力其打造国际航空枢纽。免责声明: 本文内容由开放的智能模型自...

23 08月 2025

热带风暴'剑鱼'接近香港发布1号戒备讯号

2025年8月23日,香港天文台表示,热带风暴'剑鱼'正稳定向偏西方向移动,并将在今晚最接近香港,在香港以南约500公里处掠过。受其影响,香港南部离岸及高地已间中吹强风,预计今日余下时间至明早风势...

23 08月 2025

星际荣耀完成双曲线三号火箭地面转场起竖系统联调试验

2025年8月23日,星际荣耀宣布,双曲线三号液氧甲烷可重复使用运载火箭地面转场起竖系统联调试验近日完成。该系统由起竖架、活动发射台、转场运输车等组成,试验内容涵盖产品对接、火箭转载、功能...

23 08月 2025

2025中国算力大会在大同开幕

2025年8月23日,以"算网筑基智引未来"为主题的2025中国算力大会在山西省大同市开幕。工业和信息化部副部长熊继军表示,工信部将深化算力赋能教育、医疗、能源等重点行业应用,推动构建算力产业生...

23 08月 2025

七城算力中心接入国家超算互联网

8月23日,2025中国算力大会主论坛上举行算力互联互通接入仪式。太原、青岛、长沙、万达开等七地算力中心正式接入国家超算互联网。此举使国家超算互联网骨干节点型算力中心突破30家,联合体成员...

23 08月 2025

微软推出"进阶着色器交付"技术,显著缩短游戏加载时间

微软DirectX团队公布全新"进阶着色器交付"技术,将游戏着色器编译过程迁移至云端处理。该技术通过在云端预编译着色器文件,使玩家在下载游戏时即可获得优化后的着色器数据,大幅缩短首...

23 08月 2025

幸运咖海外首店落地马来西亚

8月23日,蜜雪集团旗下现磨咖啡品牌幸运咖在马来西亚开设首家海外门店,开业当天售出近2000杯产品。此举标志着幸运咖正式开启全球化布局。截至7月,幸运咖国内签约门店已突破7000家。下一步,品牌...

23 08月 2025

京东物流可移动冷藏仓在盘锦投用

2025年8月23日,京东物流自主研发的可移动生鲜冷藏仓在辽宁盘锦正式投用。该冷藏仓通过制冷机组、保温箱体和控制系统等技术,实现河蟹在产地的低温预冷,显著提高存活率。同时,依托京东物流"航空...

23 08月 2025

三部门规范互联网平台价格行为

8月23日,三部门联合发布《互联网平台价格行为规则(征求意见稿)》。该文件历时两年多起草,多次征求相关平台意见,旨在规范平台补贴促销行为,要求平台公示活动规则,禁止虚假宣传和夸大补贴金额,...

23 08月 2025

新和成: 牛磺酸产品销量与销售额同比双升

8月23日,新和成(002001)在互动平台透露,公司牛磺酸产品今年销售量与销售额同比均呈上升趋势。公司目前牛磺酸年产能为3万吨,但具体销量和销售金额未单独披露。免责声明: 本文内容由开放的智能...

阿里通义实验室开源音频生成模型ThinkSound 实现AI&quot;听懂画面&quot;

阿里通义实验室开源音频生成模型ThinkSound 实现AI"听懂画面"