Une tasse de café fait faire un grand pas à l’intelligence artificielle

Imaginez un robot capable de vous servir un café quand vous le lui demandez. Ashutosh Saxena, chercheur à l’Université de Cornell aux USA, sait déjà le plaisir que cela procure, puisque son robot Tell Me Dave lui prépare des cafés et les lui sert à table.

Tell Me Dave est le nom donné à ce robot vaguement humanoïde capable de se déplacer dans une cuisine, recevoir des instructions vocales, et cuisiner des repas simples. Mais il n’a pas été simple pour l’équipe scientifique de parvenir à programmer correctement cette plateforme robotique dérivée du PR2.

Les scientifiques de Cornell travaillent sur les fonctions du PR2 depuis plusieurs années, notamment sur ses capacités à comprendre les désirs des humains. La difficulté réside dans le fait que chacun dit les choses à sa façon et que la même idée peut être exprimée de plusieurs façons, parfois très différentes les unes des autres. Ainsi, pour arriver à faire comprendre à Tell Me Dave qu’une même idée pouvait se dire de plusieurs façons, l’équipe a lancé un appel à participation via un site de crowdsourcing.

Ashutosh Saxena et ses collègues ont mis en place un jeu en ligne pour permettre à leur robot de comprendre des demandes complexes. Le jeu consistait à plonger les internautes dans un environnement virtuel représentant une cuisine et à leur demander de réaliser des tâches selon des instructions bien précises, de la même manière que l’on demanderait à un robot de faire une action. A l’issue de cette expérience, les résultats des joueurs ont permis à l’équipe d’élaborer un algorithme pour permettre à Tell Me Dave de comprendre des instructions comme « fais bouillir de l’eau », « prépare-moi un café », « fais cuir des pâtes », etc. Deux fois sur trois, l’intelligence artificielle mise en place par l’équipe a juste.

L’ancrage en robotique

Quand les humains communiquent entre eux, il leur arrive d’utiliser des signes non verbaux comme le regard ou les mains afin de se faire comprendre. Par exemple, pour avertir une personne qu’elle parle trop fort, on peut le lui faire comprendre en mettant un index devant notre bouche. Les robots n’ont pas cette faculté de compréhension et encore moins les compétences pour la mettre en œuvre.

Tell Me Dave est un projet qui se focalise sur la compréhension du langage, souvent source de confusion, y compris chez les humains. L’objectif du laboratoire Robot Learning Lab de l’Université de Cornell est justement d’aider les robots à faire le lien entre des mots prononcés et les objets et actions qui en découlent dans un environnement réel. Ce processus est appelé l’ancrage.

Tell me Dave a ses limites

Les robots ont donc besoin d’instructions précises pour réussir les tâches qu’on leur demande de réaliser et surtout, ils ont besoin d’avoir le plus de données possibles sur les objets qui les entourent. Si vous voulez par exemple demander à un robot de cuire des spaghettis, il aura besoin de savoir ce qu’est un spaghetti, combien de temps il faut pour le cuire, dans quoi on le cuit, etc. Bien évidemment, vous ne pourrez pas transmettre toutes ces informations au robot en une seule et même phrase.

Robot-PR2-remplit-une-tassé-de-café

Le robot PR2 est équipé d’une caméra 3D pour scanner son environnement proche et identifier les objets qui l’entoure grâce à un logiciel de vision développé par l’équipe de chercheurs. PR2 a été programmé pour pouvoir associer des objets à des actions : une casserole peut faire chauffer des ingrédients, peut contenir de l’eau, etc. Quand le robot identifie une casserole, et qu’il détecte un robinet, il sait qu’il peut faire chauffer de l’eau. Si un humain lui demande de faire bouillir de l’eau, PR2 saura le faire, y compris si vous déplacez la casserole d’endroit ou si vous mettez le robot dans un environnement qui lui est totalement inconnu.

Un seul bémol avec l’approche Tell Me Dave : il ne faut pas surprendre le robot en lui demandant quelque chose de nouveau ou en employant un mot qu’il ne connaît pas. Le pauvre robot se retrouve perdu ne sachant pas comment gérer la situation !

En lui apprenant de cette façon les fonctions d’un objet et les actions qui en découlent, PR2 n’a pas besoin de comprendre tous les mots d’une phrase mais l’idée globale. Autrement dit, le robot peut déduire les étapes à franchir pour mener à bien une tâche à partir d’une demande.

Tell Me Dave sera présenté prochainement lors d’une conférence sur les sciences et les systèmes à Berkeley (en Californie).


Laisser un commentaire