Kyutai (Xavier Niel/Iliad) lance une toute nouvelle IA vocale pour rendre la parole aux malades
Kyutai, le laboratoire d’IA cofondé par Xavier Niel, dévoile une technologie pour redonner une voix aux personnes atteintes de la maladie de Charcot.
Le laboratoire français d’intelligence artificielle Kyutai, souvent présenté comme un « OpenAI à la française », vient de présenter une nouvelle technologie vocale baptisée Invincible Voice. Développée en collaboration avec l’entrepreneur Olivier Goy, diagnostiqué de la maladie de Charcot en 2020, cette IA vise à permettre aux patients de communiquer à nouveau avec leur propre voix.
Après Moshi, Kyutai poursuit ses travaux dans le domaine de l’IA vocale. Fondé par Xavier Niel, Rodolphe Saadé et Eric Schmidt, le laboratoire a dévoilé ce mardi 20 janvier un prototype encore au stade expérimental, spécifiquement pensé pour les personnes atteintes de sclérose latérale amyotrophique (SLA).
L’objectif est de restaurer la capacité d’échange des patients. Invincible Voice est capable de recréer la voix d’une personne à partir de quelques enregistrements seulement. Dans le cas d’Olivier Goy, des extraits issus d’un ancien podcast ont suffi à reconstituer sa voix telle qu’elle était avant l’apparition de la maladie, comme le montre une vidéo publiée sur Instagram.
Une IA pensée pour fluidifier les échanges
Concrètement, Invincible Voice peut transcrire en temps réel les propos d’un interlocuteur, puis générer plusieurs réponses adaptées grâce à un modèle de langage. Le patient sélectionne ensuite la réponse souhaitée, soit à l’aide de ses mains, soit par le regard, l’outil étant compatible avec les dispositifs d’eye tracking. L’IA restitue alors la réponse à voix haute en conservant le timbre, les intonations et la voix du patient, selon Kyutai.
« Ce qu’on a fait ici avec Invincible Voice, c’est un outil capable de comprendre le contexte global de la discussion, de proposer des réponses basées sur ce qu’a dit l’interlocuteur et cela permet au malade de rebondir en temps réel pour fluidifier l’échange », explique Gabriel, ingénieur au sein du laboratoire.
Pour fonctionner, la technologie s’appuie sur les modèles de transcription et de synthèse vocale en temps réel développés par Kyutai, ainsi que sur Unmute, un système open source conçu par le laboratoire. Celui-ci permet de « doter tout chatbot textuel d’une interface vocale ».
« Etre capable de communiquer, c’était déjà génial. Le faire avec ma propre voix, c’était incroyable. La partie manquante, c’était l’échange », témoigne Olivier Goy, également parrain de l’association Les Invincibles.
Dans une volonté de diffusion large, Kyutai a choisi de rendre Invincible Voice disponible en open source. Le laboratoire espère ainsi permettre aux développeurs, chercheurs et acteurs du secteur de la santé de faire évoluer ce prototype et de l’adapter à d’autres pathologies, comme l’aphasie.
Source : BFM TV