Des robots qui apprennent en imaginant grâce aux réseaux de neurones

Robot humanoïde debout

Les robots humanoïdes peuvent (parfois, souvent, tout le temps…) paraître instables sur leurs jambes. Celui utilisé dans le laboratoire de l’Université de Californie (UC Berkeley), paraît encore plus maladroit. En réalité, il le fait exprès, à chaque geste il apprend à mieux marcher.

Tels ceux d’un enfant, les mouvements de ce DARwIn-OP semblent encore maladroits car hésitants. En fait, il s’agit d’une démonstration de l’utilisation d’un réseau neuronal artificiel intégré au robot pour faire face à des environnements difficiles ou inconnus. Le robot apprend à effectuer une nouvelle tâche en utilisant le même processus d’apprentissage qu’un enfant.

Les gestes de DARwIn sont contrôlés par plusieurs réseaux de neurones. Au fur et à mesure que DARwIn effectue des gestes, ses algorithmes d’apprentissage automatique imitant les connexions entre neurones d’un cerveau humain, progressent et accumulent des modélisations nouvelles. Par exemple, pour que le robot apprenne à se tenir debout, il procède d’abord à une série de simulations afin que les réseaux de neurones procèdent à des modélisations abstraites de cet ensemble de gestes. Les chercheurs comparent ce processus à celui de notre imagination. Cette méthode fournit un guidage approximatif au robot, tandis qu’un deuxième réseau profond se charge d’apprendre à effecteur le mouvement lui-même, en tenant compte de la dynamique des articulations du robot et la complexité de son environnement.

Robot humanoïde tient en équilibre

Pour l’instant les chercheurs de l’équipe de Pieter Abbeel ont réussi à faire apprendre au robot comment se dresser, faire bouger sa main et rester debout quand le sol n’est pas stable. Le DARwIn pratique ses simulations pendant une heure. Il sait réagir ensuite en temps réel face une situation. Cette nouvelle approche, qui diffère de l’habituelle méthode essai-erreur est importante car les robots peuvent être confrontés à des situations où tester plusieurs possibilités avant de choisir la bonne est impossible -conduite sur route d’une voiture autonome par exemple.

Si les robots peuvent apprendre à réagir automatiquement à des situations inhabituelles, ils pourront servir dans de nombreux nouvelles applications. Cette technique pourrait également permettre aux robots humanoïdes de se déplacer d’un pas plus sûr. Actuellement, la plupart des robots humanoïdes ont encore du mal à avancer dès qu’un paramètre nouveau entre en jeu (inclinaison du terrain, type de sol, obstacle, etc.). Il suffit de regarder les finales de la DARPA pour se faire une idée… Les réseaux de neurones ont donc encore beaucoup à apprendre aux robots humanoïdes.


Laisser un commentaire