## Mistral AIが文字起こしAI「Voxtral Mini Transcribe V2」と「Voxtral Realtime」を発表

概要

https://gigazine.net/news/20260205-mistral-ai-voxtral-transcribe-2/

詳細内容

## Mistral AIが文字起こしAI「Voxtral Mini Transcribe V2」と「Voxtral Realtime」を発表 https://gigazine.net/news/20260205-mistral-ai-voxtral-transcribe-2/ Mistral AIが、200ms未満の超低遅延と高精度な話者識別を低コストで提供する新型音声認識モデル「Voxtral」シリーズをリリースした。 **Content Type**: 📰 News & Announcements **Language**: ja **Scores**: Signal:5/5 | Depth:3/5 | Unique:4/5 | Practical:5/5 | Anti-Hype:4/5 **Main Journal**: 89/100 | **Annex Potential**: 85/100 | **Overall**: 84/100 **Topics**: [[Mistral AI, 音声認識 (ASR), リアルタイム文字起こし, オープンモデル, 話者識別]] フランスの **Mistral AI** が、新型の音声認識モデル **Voxtral Mini Transcribe V2** と、リアルタイム処理に特化した **Voxtral Realtime** を発表した。いずれも日本語を含む13言語に対応。 **Voxtral Mini Transcribe V2** は高精度な **話者識別（Diarization）** 機能を備え、Gemini 2.5 FlashやGPT-4o miniを上回る精度をより低コストで提供する。一方、 **Voxtral Realtime** は **200ミリ秒未満** の超低遅延を実現しており、対話型AIやライブ配信の字幕生成に適している。両モデルはAPI経由で利用可能なほか、 **Voxtral Realtime** はモデルデータが **Hugging Face** でオープンウェイトとして公開されており、ローカル環境での実行も可能だ。低遅延なボイスUIや、コスト効率の高い自動議事録機能を自社サービスに組み込みたい開発者は、まずこのモデルの性能を検証すべきである。

元記事を読む他のサマリーを見る