Les robots pourront bientôt apprendre de leurs erreurs

Afin d’optimiser l’apprentissage des robots, Frank Lewis, un professeur du département d’ingénierie électrique et de l’institut de recherche de l’université du Texas à Arlington, et son équipe ont conçu un logiciel pour qu’un robot puisse prendre une décision en se basant sur des variables qui changent selon les choix faits.

L’équipe de chercheurs a récemment obtenu un brevet intitulé « Control Methodology for Online Adaptation to Optimal Feedback Controller Using Integral Reinforcement Learning » (Méthodologie de contrôle pour une adaptation en ligne du contrôleur à feed-back optimal en utilisant l’apprentissage renforcé intégral). Ce brevet protège le procédé inventé par l’équipe qui consiste à permettre à la machine d’apprendre et de prendre des décisions contrôlées selon une gamme de variables qui se modifient en fonction chaque décision prise.

IRL apprend par traitement de lot, c’est-à-dire en analysant un ensemble de données avant de mettre ses équations de contrôle à jour. Ce brevet permet de développer une nouvelle technologie grâce à laquelle les robots pourront apprendre en temps réel et sans délai, autorisant ainsi une plus grande autonomie et des réactions plus rapides.

Selon Frank Lewis, « le contrôleur à feed-back optimal permet à une machine d’utiliser le moins d’énergie possible tout en économisant du temps et de l’énergie. On les voit souvent dans les auto-pilotes d’engins aériens, dans les contrôles d’émission pour les véhicules et dans les technologies similaires. L’avantage d’utiliser l’apprentissage renforcé intégral adaptatif est que la machine peut avoir des contrôles optimaux en analysant le système et en calculant les changements en temps réel, plutôt que hors ligne, qui implique que la machine soit à l’arrêt pour que les changements soient faits. »

Selon le recteur de la faculté d’ingénierie de l’université, « en augmentant l’efficacité de différents modes de transports grâce au contrôleur intelligent IRL, nous rendons possible le fait de déplacer des marchandises ou de fournir des services à meilleur prix et avec moins d’impacts négatifs sur l’environnement. »


Laisser un commentaire