2026年1月29日,阿里千问团队正式开源Qwen3-ASR系列模型,包括Qwen3-ASR-1.7B、Qwen3-ASR-0.6B语音识别模型及Qwen3-ForcedAligner-0.6B强制对齐模型。该系列支持52种语种与方言识别,覆盖中英文、22种中文方言及16国英文口音,在歌唱识别、低信噪比等复杂场景表现优异。1.7B模型达开源SOTA水平;0.6B模型实现高吞吐(128并发下10秒处理5小时音频);强制对齐模型支持11语种、精度超越WhisperX等主流工具。全部模型权重、结构及推理框架同步开源。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。

扫一扫关注微信