Georgia Tech élabore un manuel de savoir-vivre pour les robots

Et si les robots obéissaient aux mêmes règles sociales que nous ? C’est la question à laquelle tentent de répondre des chercheurs de Georgia Tech sous l’égide de l’Office of Naval Research américain.

Ils quittent l’industrie

Nous le voyons tous les jours. Des aspirateurs aux nettoyeurs de grille à barbecue, des chatbots aux assistants virtuels et des animaux de compagnie aux machines pour aider contre l’autisme, la robotique a enfin quitté ses secteurs de prédilection : l’armée et l’industrie.

Aujourd’hui, les projets d’assistants ou de divertissement sont plus nombreux que jamais, et ce sont eux qui dessineront l’avenir de la robotique grand public. Du service à la santé, ils investissent tous les domaines de la vie quotidienne. Mais il est un problème que peu d’entre eux réussissent à résoudre : la compréhension de l’homme et de ses comportements.

Comprendre les comportements humains

Si l’imagination de l’homme lui permet d’inventer une multitude de scénarios possibles pour une même histoire, il n’existe en réalité que peu de scénarios qui viennent rythmer nos journées. Cela, les chercheurs de Cornell et de Stanford l’avaient bien compris. Ils ont déjà mis au point un programme intelligent capable d’anticiper les actions humaines en fonction de schémas récurrents. A force d’entraînement, il est en mesure de vous prévenir quand vous laissez le lait sur la table plutôt que de le ranger dans le réfrigérateur. Puisque dans la majorité des cas observés, l’humain range le lait dans ledit frigo.

Un autre projet de l’Université de Stanford consiste à laisser carte blanche à un robot à roues sur le campus de l’université. Le but ? Le confronter directement à la vie naturelle, face aux comportements parfois imprévisibles des êtres humains. Muni de capteurs et de caméras, le logiciel embarqué dans JackRabbot peut ainsi analyser les trajectoires des piétons et en tirer des schémas récurrents de manière à pouvoir mieux anticiper leurs déplacements à l’avenir. Ce que cherchent avant tout les ingénieurs californiens, c’est d’observer et de comprendre les conventions sociales humaines, souvent implicites et donc impossible à encoder directement dans le logiciel d’une machine.

Parce que la vie en société est en réalité régie par des règles très strictes mais non moins implicites, il est indispensable pour les robots de les connaître pour se déplacer sans encombre parmi nous.

Quixote

Quixote est le nouveau système d’entraînement d’agents crédibles de l’Office of Naval Research américain. Il s’appuie sur des éléments de narration pour raconter des histoires et aider les programmes informatiques à développer un minimum de conscience situationnelle. Autrement dit, ils nourrissent leur système de petites histoires au déroulement plus que banal : « lorsque je me rends à la pharmacie, je fais la queue, je ne double personne, j’arrive au comptoir, je passe ma commande, si on refuse, je prend le départ… Ce genre de situations là. Ils ont donc décortiqué ces histoires en plusieurs étapes et situations, l’objectif du programme était donc de les remettre dans le bon ordre afin d’éviter d’enfreindre les règles de politesse, comme couper la file d’attente par exemple.

Ces travaux ont été menés par des chercheurs du Georgia Institute of Technology. Le but étant que le programme génère ses propres algorithmes afin d’améliorer les interactions homme-machine. « Pendant des années, les chercheurs ont débattu sur la manière d’enseigner aux robots la façon dont ils doivent se comporter dans certains situations » explique Marc Steinberg, superviseur du programme à l’ONR. Le plus difficile selon lui est « de leur inculquer des concepts complexes comme les règles, les valeurs ou l’éthique« . Ce sont les éléments qui aident les hommes à vivre en harmonie. Sans règles et sans valeurs communes, il est impossible de prévoir le déroulement d’un scénario et donc de s’y insérer de manière non-invasive. C’est encore aujourd’hui le principal défaut des machines. En deux mots, Quixote doit servir « de manuel de savoir-vivre » pour les machines.

Un algorithme bien bavard

Et le meilleur moyen, c’est encore de raconter des histoires. Ce n’est pas pour rien que les parents racontent des histoires à leur enfant, elles sont toutes porteuses d’une vision du monde et d’une morale qui doivent éduquer l’enfant dès le plus jeune âge.

L’idée est donc de transposer ce mode d’apprentissage aux machines. Mais elles sont des élèves particulièrement mauvais. Le problème avec les programmes informatiques, c’est qu’ils obéissent aux ordres, et aux ordres de leur code seulement. Aussi, si vous commandez à votre robot d’aller chercher des médicaments au plus vite, celui-ci va se rendre à la pharmacie et couper la file d’attente. Or un humain, même si son objectif est d’aller au plus vite, il y a un certain nombre de règles qu’il n’enfreindra pas pour autant. Il pourrait même conclure que le vol est la solution la plus adaptée pour remplir sa mission. Quixote, sa mission, c’est justement de permettre aux autres machines de remplir les leurs sans enfreindre les règles sociales humaines.

georgia-tech-onr-ai

Entraînement intensif

Pour entraîner leur système, ils ont donc opté pour des situations très banales et simples trouvées sur internet : aller au restaurant ou à la pharmacie et ce en prenant en compte les actions capitales comme le paiement du repas.

L’entraînement a pris la forme d’un jeu vidéo dans lequel Quixote devait finir des niveaux (histoires) le plus vite possible, mais avec des récompenses pour chaque règle sociale respectée (et calquée sur les personnages de cette histoire). Au terme de plus de 500 000 simulations de ce type, le programme était finalement capable de répondre adéquatement aux situations dans 90% des cas. Si le résultat est bluffant, Riedl reste modeste « ces jeux sont très simples, du type Pac-Man plutôt que Halo« . Mais il s’agit d’un bon début, et au fil des simulations, les histoires pourront être de plus en plus complexes. Le but étant selon Riedl d’apprendre aux machines « la bonne succession d’actions et d’être encodées avec les bons schémas comportementaux« , et ce pour être intégré dans des robots « offrant une multitude d’applications possibles« .

Aussi, l’équipe de Marc Diedl espère élever progressivement le niveau de jeu dans les six prochains mois et peut-être s’attaquer au jeu Minecraft, qui constitue décidément le principal terrain d’entraînement des IA ces derniers temps.


Laisser un commentaire