OSSとして利用できる「Voxtral Realtime」は、遅延200ミリ秒未満に設定できるライブ文字起こし専用として設計されており、エッジデバイスやローカル環境で機能する。英語、中国語、ヒンディー語、スペイン語、アラビア語、フランス語、ポルトガル語、ロシア語、ドイツ語、日本語、韓国語、イタリア語、オランダ語などを対応言語に挙げる。API経由で0.003ドル/1分あたり(発表時)で提供される「Voxtral Mini Transcribe V2」は、エンタープライズ展開向けにエラーの軽減やノイズに対する堅牢性の向上を図っており、公式ブログでは、単語エラー率約4%などのベンチマーク結果を示してその精度をアピールしている。