2026年4月2日,微软正式推出自研语音转录模型MAI-Transcribe-1。该模型在FLEURS基准测试(覆盖25种语言)中实现3.9%平均字错误率,宣称全球最精准。其在11种核心语言排名榜首,性能超越Whisper-large-v3及Gemini 3.1 Flash。转录速度达Azure Fast服务的2.5倍,定价仅0.36美元/小时,为当前主流云厂商中性价比最优。模型已上线Microsoft Foundry平台,首发版本暂不支持实时转录、说话人分离与偏见调整。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。

扫一扫关注微信