Une intelligence artificielle apprend à parler

Le deep learning, la technique d’apprentissage par l’expérience pour les IA, semble avoir de beaux jours devant elle. Après avoir permis à une IA de découvrir Mario ou d’apprendre à lire, cette technique a maintenant été utilisée pour initier un robot aux subtilités du langage.

Une étude, publiée cette semaine lors de la conférence internationale conjointe sur les intelligences artificielles, décrit l’expérimentation menée par une équipe de chercheurs de l’université d’Austin au Texas. Cette étude, intitulée « Apprendre à interpréter les ordres du langage naturel par le dialogue humain-robot », avait pour but de créer un agent de discussion implémentable sur un robot traditionnel pour lui permettre de comprendre le langage de base. Pour les chercheurs, les dernières approches sur le sujet n’étaient pas satisfaisantes, puisque ne prenant pas en compte certaines variations linguistiques. Jusqu’ici les approches les plus courantes étaient la recherche de mots-clés dans une phrase pour en saisir le sens ou la mise en place au départ d’une base de donnée annotée immense pour permettre au robot d’apprendre les termes et les liens entre les mots.

L’agent de conversation conçu pour cette étude possède un système inédit. Sa technique d’apprentissage repose sur trois caractéristiques. Le robot est tout d’abord capable, grâce au parsage sémantique, c’est-à-dire sa capacité à découper une phrase en segments syntaxiques, de comprendre et d’identifier les termes. De plus il est également capable de lever les ambigüités concernant certains mots grâce à un gestionnaire de dialogues. Enfin, grâce à la paraphrase demandée aux utilisateurs, le robot peut apprendre progressivement des échanges humain-robot. Les conversations étaient menées grâce à l’interface web du robot via la plateforme Mechanical Turk. L’agent de dialogue a également été implémenté sur un robot mobile, chargé d’apprendre à comprendre les demandes de déplacement ou de livraison dans un contexte professionnel.

Le robot mobile était une version modifiée d’un segway, un gyropode sur lequel avait été installé un ordinateur portable faisant fonctionner le système d’exploitation Robot Operating System (ROS). Le test était divisé en trois parties : déplacement, livraison et validation. Le déplacement impliquait de demander au robot de se rendre dans une pièce aléatoire avec la commande : « [Personne] a besoin du robot. Envoyez-le dans le bureau où il/elle travaille ». Les désignations étaient choisies à partir des noms complets, des prénoms, des surnoms ou des titres. La livraison impliquait d’envoyer le robot assister une personne avec l’ordre : « [Personne] a besoin de l’objet de l’emplacement [numéro] ». Les personnes et objets étaient choisis aléatoirement au sein des objectifs du test. Enfin, afin d’identifier les personnes ne jouant pas le jeu, les chercheurs ont mis en place la dernière partie du test. Cette partie consistait à demander à une personne de « fournir le prénom et le nom de la personne dans le bureau numéro [numéro] ». Les réponses incorrectes étaient ensuite analysées et validées ou invalidées, pour ne pas pénaliser une erreur d’orthographe par exemple.

L’agent de discussion utilisait la structure de parsage sémantique de l’université de Washington. Des formules de lambda calcul servaient à représenter le sens des mots (éléments lexicaux). Un système de grammaire catégorielle combinatoire permettait à l’IA d’étiqueter chaque mot selon une catégorie syntaxique. Ce système était doublé par le programme GENLEX, une méthode de génération de lexique basée sur des modèles pré-existants. Ceci permettait au robot, lors de la reformulation de questions d’associer les termes inconnus à des termes maîtrisés. Ainsi si une personne demandait au robot de « livrer l’objet 5 à Pierre » puis reformulait la question, à la demande du robot, qui n’avait pas compris la requête, en « apporter l’objet 5 à Pierre », l’agent de discussion reliait livrer et apporter pour déduire le sens de l’ordre donné.

L’agent de discussion pouvait en outre, lors des interactions avec les personnes chargées du test, corriger les erreurs de grammaire dans les phrases de ses interlocuteurs. Les chercheurs songent maintenant à implémenter un programme de reconnaissance vocale pour savoir si le robot peut corriger automatiquement des erreurs de reconnaissance vocale régulières.


Laisser un commentaire