Alexa : Amazon dame le pion à la concurrence en intégrant une IA générative

Une intelligence artificielle encore plus boostée pour l’assistant vocal d’Amazon, qui va proposer de nombreuses nouvelles fonctionnalités grâce à l’IA générative.

Alexa “plus conversationnelle, utile et divertissante pour tous”. Telle est la promesse faite par Amazon hier en présentant l’avenir de son assistant vocal. Le géant américain présente l’utilisation d’un nouveau modèle de langage (LLM) à grande échelle pour ajouter de nombreuses capacités à son IA. Cette évolution se base sur 5 axes majeurs avec de nombreuses fonctionnalités qui doivent arriver prochainement, même si la première version sera d’abord déployée en anglais d’ici à la fin de l’année.

Ce nouveau modèle doit par exemple être personnalisé pour l’utilisateur, avec une personnalité plus définie : elle pourra ainsi donner un point de vue sur certaines questions comme quels films auraient dû remporter un Oscar, se réjouir lorsque vous répondez correctement à une question d’un quiz… Tous ces nouveaux échanges permis par cette nouvelle IA doit se faire dans la confidentialité et la sécurité des clients, affirme Amazon, qui promet contrôle et transparence sur les données utilisées.

Une conversation encore plus intéressante…

L’IA d’Amazon verra ainsi ses dispositions conversationnelles drastiquement améliorées grâce à l’étude poussées des échanges déjà réalisés avec l’assistant vocal, s’intéressant au langage corporel, au contact visuel etc. Amazon affirme ainsi avoir réduit la latence de la réponse, pour que la conversation se fasse plus naturellement, avec des réponses parfois plus concises, sans avoir l’impression d’écouter des textes lus à haute voix. Pour plus de détails, il suffira de le demander. Dans cette optique, un nouveau moteur de reconnaissance vocale a été construit pour s’adapter aux pauses et hésitations des humains lors d’une conversation normale et la voix de synthèse a été améliorée.

Dans cette même optique, Character.AI permettra d’échanger avec plus de 25 personnages uniques générés par l’intelligence artificielle : cela va des assistants tels que les planificateurs de voyage ou les coachs sportifs à des personnalités célèbres comme Einstein et Socrate. Le tout avec un suivi des conversations précédentes. Pour les enfants, qui posent plus de 25 millions de questions par mois à Alexa selon Amazon, l’assistant sera capable de tenir une conversation dirigée en combinant des faits amusants et des questions triviales adaptées de sources fiables. Lorsque les enfants demandent une blague ou un bruit d’animal, Alexa peut leur demander s’ils veulent entendre quelque chose d’intéressant, les incitant à continuer à explorer un sujet avec des faits amusants et des anecdotes.

De nouveaux usages

Mais ce nouveau modèle de langage doit également permettre de nouvelles fonctionnalités comme le contrôle intuitif de la maison intelligente : Alexa sera capable de traiter plusieurs demandes liées à la domotique en même temps et même déduire ce que vous souhaitez si votre énoncé ne correspond pas au nom spécifique que vous avez donné à votre pièce ou votre appareil. Même des déclarations comme “Alexa, il fait trop clair ici” seraient comprises comme une invitation à baisser les lumières. De plus, vous n’aurez plus besoin de votre smartphone pour programmer les routines Alexa, ce qui vous permettra simplement de dire quelque chose comme : ” Alexa, tous les soirs de la semaine à 21 heures, fais une annonce pour que les enfants commencent à se préparer à aller au lit et assure-toi de baisser les stores et allumer les lumières extérieures”. Il sera d’ailleurs possible de cartographier votre logement et d’épingler les appareils connectés sur votre téléphone si vous le souhaitez pour ne plus avoir à naviguer dans une liste d’équipements.

L’assistant sera même en mesure de vous aider à gérer le calendrier de votre famille en s’envoyant un e-mail, une invitation ou une photo d’un événement directement. L’intelligence artificielle extraira ensuite les détails de l’événement, l’ajoutera automatiquement à votre calendrier et vous enverra une confirmation. Alexa pourra même aider à la création musicale, avec Splash. En utilisant une IA générative, vous pourrez juste décrire la musique que vous souhaitez créer et obtenir une musique originale avec une variété d’options de personnalisation de chansons telles que l’ajout de voix ou de paroles, le passage du chant au rap ou le changement de genre.

D’autres sujets sont traités, comme l’aide aux personnes en situation de handicap les privant partiellement de parole ou de mobilité : au lieu d’utiliser la voix ou le toucher, le regard sur Alexa permettra aux clients de regarder leur tablette pour effectuer des actions Alexa prédéfinies, comme écouter de la musique et des émissions, contrôler leur environnement domestique et communiquer avec leurs proches… La firme de Jeff Bezos entend également proposer la traduction d’appels audio et vidéo en temps réel. Une fonctionnalité qui sera lancée auprès des clients des applications mobiles Echo Show et Alexa aux États-Unis, au Canada, au Mexique, au Royaume-Uni, en Allemagne, en France, en Italie et en Espagne dans plus de 10 langues, dont l’anglais, l’espagnol, le français, l’allemand et le portugais.

