最新最快科技资讯
太阳能光伏网

阿里云发布多模态旗舰模型Qwen2.5-Omni,全面支持文本、图像、音频及视频处理

阿里云今日凌晨推出新一代端到端多模态模型Qwen2.5-Omni,并在Hugging Face、ModelScope等平台开源。该模型采用创新的Thinker-Talker架构,能无缝处理文本、图像、音频和视频输入,并实时生成文本及语音输出。

Qwen2.5-Omni通过TMRoPE技术实现音视频精准同步,在实时交互与语音生成方面表现优异。测试显示,其性能超越同类单模态模型及部分封闭源模型,在OmniBench多模态任务中达到SOTA水平,同时在语音识别、翻译、图像推理等单模态任务中表现突出。

阿里云表示,Thinker模块负责多模态语义理解,Talker模块则实现流式语音合成,形成高效统一的架构。目前,模型已在多个平台开放体验。

最新相关

《超级马力欧银河大电影》上映10天破亿

4月12日,猫眼专业版数据显示,动画电影《超级马力欧银河大电影》上映10天总票房突破1亿元人民币。该片由照明娱乐与任天堂联合制作、环球影业发行,为2023年《超级马力欧兄弟大电影》续作,延续太...

微软或于下周举办Xbox小型发布会

据科技媒体Windows Central编辑Jez Corden于4月12日透露,微软可能在下周举行一场小型Xbox发布会。活动规模有限,但有望公布包括《辐射3》重制版在内的新消息。该消息引发玩家热议,部分推测此举...

顽皮狗或正开发《神秘海域》新作

近日,多方线索显示顽皮狗工作室可能正在秘密开发《神秘海域》系列新作。据爆料者@AlexandreNGamR称,该项目已进入开发阶段;前《失落的遗产》总监肖恩·埃斯凯格亦曾发布疑似暗示性图片。该系...

全球甲醇电动生态联盟在京成立

4月11日,2026智能电动汽车发展高层论坛在北京开幕,同期宣布成立'全球甲醇电动生态联盟'。该联盟由车百会研究院发起,联合整车、零部件、能源、科研及投资等多方机构,旨在构建开放共赢的甲醇电...

暴雪胜诉乌龟服私服案,法院颁永久禁令

2026年4月12日,美国加利福尼亚中区联邦地区法院对暴雪诉AFKCraft Ltd.(运营'乌龟服')一案作出终局裁决。法院颁布永久禁令,禁止被告及其关联方开发、运营、分发或推广《魔兽世界》私服及衍生客...