2026年2月4日,法国AI公司Mistral AI发布Voxtral Transcribe 2系列模型。其中,Voxtral Realtime(4B参数)采用流式架构,支持13种语言(含中文),转录延迟低于200ms,以Apache 2.0许可开源;Voxtral Mini Transcribe V2面向批量处理,单次支持3小时音频,准确率优于GPT-4o mini及Gemini 2.5 Flash。两款API均支持多语种,定价分别为每分钟0.003美元和0.006美元。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。

扫一扫关注微信