Mistral (Le Chat) lance son nouveau modèle IA vocal, les abonnés Free Mobile pourront bientôt en profiter

Mistral lance Voxtral, une nouvelle gamme de modèles open source pour la compréhension vocale.

Mistral a annoncé le lancement de Voxtral, une nouvelle famille de modèles de compréhension vocale, disponibles en open source sous licence Apache 2.0. Déclinés en deux tailles — Voxtral Small (24B) pour les applications à grande échelle et Voxtral Mini (3B) pour des usages locaux ou embarqués — ces modèles visent à améliorer l’accessibilité des systèmes de transcription et d’analyse audio.

Selon Mistral, Voxtral combine transcription automatique, compréhension du langage, fonctionnalités multilingues et détection d’intentions, avec un coût d’exploitation inférieur à celui des solutions concurrentes. Parmi les fonctionnalités annoncées :

Transcription longue durée (jusqu’à 30 minutes) avec 32k tokens de contexte.
Compréhension intégrée : résumés, questions-réponses et appels de fonctions déclenchés par la voix.
Support multilingue natif, avec détection automatique de la langue.
Performances textuelles comparables à Mistral Small 3.1.

Mistral affirme que Voxtral surpasse les principaux modèles open source comme Whisper large-v3 sur la transcription, ainsi que des API propriétaires comme GPT-4o Mini ou ElevenLabs Scribe, tout en étant proposé à un tarif inférieur (à partir de 0,001 $/minute via API). Les modèles sont disponibles au téléchargement sur Hugging Face et seront intégrés “dans les semaines à venir” via l’application Le Chat, dont la version pro est offerte pendant un an pour les abonnés Free Mobile.

Cet article a été repris sur le site Univers FreeBox