Kyutai (Xavier Niel/Iliad) travaille à mettre son IA au service des médias

Kyutai (Xavier Niel/Iliad) travaille à mettre son IA au service des médias

Kyutai, le laboratoire d’IA soutenu par Xavier Niel, Rodolphe Saadé et Eric Schmidt, renforce ses liens avec les médias et multiplie les projets autour de la voix et des contenus audio grâce à ses technologies open source.

Lors du Mind Media Day, Patrick Pérez, CEO de Kyutai, a détaillé l’avancée des travaux du laboratoire d’intelligence artificielle fondé il y a deux ans par Xavier Niel, Rodolphe Saadé et Eric Schmidt. Après une première expérimentation avec La Provence autour du projet La Provence Audio, Kyutai multiplie désormais les échanges avec d’autres acteurs des médias.

Basée à Paris, Kyutai réunit aujourd’hui 25 personnes. Créée en novembre 2023 par Xavier Niel (Iliad), Rodolphe Saadé (CMA CGM) et Eric Schmidt, l’entité dispose de 300 millions d’euros de financement. Elle a pour objectif de développer en France des technologies fondamentales en intelligence artificielle, en open source et dans une logique non lucrative. Ses travaux portent notamment sur l’audio et le multimodal.

Patrick Pérez est revenu sur l’intégration d’un dispositif vocal automatisé au sein de l’offre numérique de La Provence, projet mené avec Mistral, BCG x et Google. Kyutai y a développé une technologie de synthèse vocale expressive en temps réel, conçue pour transformer un article écrit en un contenu audio dynamique, avec clonage des voix des journalistes. Et le laboratoire discute actuellement avec d’autres médias.

Cela a représenté un terrain d’expérimentation concret pour l’équipe. Comme l’a souligné Patrick Pérez: “Cela nous a permis d’apprendre et de confronter notre technologie aux contraintes d’un cas d’usage réel“. Il a également insisté sur le fait que certaines problématiques techniques demeurent centrales, notamment la gestion précise des entités nommées ou des sigles.

Selon lui, une part importante des efforts se concentre sur l’efficience technologique. “Nous travaillons beaucoup sur des tâches invisibles mais essentielles pour les données et l’IA, autour de l’efficacité”, a-t-il expliqué. Cela inclut l’optimisation de l’entraînement des modèles avec moins de données ou moins de calcul, des avancées méthodologiques visant à rendre les modèles plus performants, ainsi que des travaux sur la mémoire des IA conversationnelles. Parmi les autres axes évoqués: la transcription et la traduction.

Pour Patrick Pérez, l’expertise acquise sur la voix ouvre de nouvelles perspectives pour les groupes de médias, qu’il s’agisse de presse écrite souhaitant diversifier ses formats ou de groupes multimédias. Kyutai affiche d’ailleurs sa volonté de renforcer ses partenariats avec le secteur. “Des discussions sont en cours avec certains groupes”, a affirmé son CEO, qui assure que l’objectif est de permettre aux médias d’expérimenter des briques technologiques open source de pointe, de concevoir de nouveaux usages et produits, ou encore de nourrir leur réflexion sur la valorisation de leurs contenus et données dans leurs relations commerciales.

Source : Mind

Cet article a été repris sur le site Univers FreeBox