Google DeepMind apprend à une IA à lire

Si permettre aux robots de se déplacer ou d’effectuer certaines actions est un point important de la robotique, le développement des intelligences artificielles en est un autre tout aussi crucial. Google DeepMind, la filiale de Google spécialisée dans la recherche et le développement d’IA a récemment fait une découverte majeure dans le domaine.

En utilisant la méthode appelée « deep learning », ou apprentissage profond, les intelligences artificielles sont actuellement capables, à partir de bases de données gigantesques, d’apprendre de façon autonome. Cette technique a révolutionné le monde des intelligences artificielles. Elle présente toutefois une lacune, celle de ne pas permettre le traitement automatique du langage naturel.

C’est ici que les chercheurs de Google DeepMind entrent en scène. Partant du constat qu’il n’existe aucune base de données suffisamment annotée pour permettre le deep learning, l’équipe, menée par Karl Moritz Hermann, a cherché une solution. Celle-ci s’est révélée être les sites internet du Daily Mail et de CNN, deux journaux anglophones. La façon dont chaque article est annoté de mots-clefs, indépendants du texte de l’article, c’est-à-dire ne reprenant pas des phrases entières du texte, permettent en effet aux IA d’avoir une référence absolue.

Des techniques de lecture diverses

Une référence absolue est une référence à laquelle l’IA peut se rapporter pour déduire la validité d’une information. Pour la reconnaissance faciale par exemple, la référence absolue est une base de données contenant assez de différentes prises de vues de visages pour permettre à l’IA d’identifier un visage, y compris de profil.

Créer une base de données de ce type pour le langage est plus compliqué. Il est bien sûr possible d’extraire des mots-clef ou des phrases importantes d’un texte pour l’annoter, toutefois, l’intérêt est très réduit puisque n’importe quel algorithme correctement programmé en est capable. Les annotations doivent au contraire décrire le texte en utilisant des termes qui ne s’y trouvent pas. L’IA est ainsi forcée d’analyser les liens causals et les structures grammaticales du texte.

L’utilisation des bases de données de CNN et du Daily Mail ont permis d’avoir une base de données valable pour les IA. Les annotations des articles sur ces sites ne sont pas de simples extraits mais des mots-clef abstraits, fournissant la base de données idéale pour le deep learning. Les IA pouvaient donc être soumises à un test simple, des questions dont les réponses se trouvent dans les textes de la base de données.

Google DeepMind apprend à lire aux IA

Afin d’empêcher les IA de répondre aux questions grâce à une simple recherche de termes, l’équipe de chercheurs a décidé d’anonymiser la base de donnée en supprimant les acteurs des phrases et en les remplaçant par des termes génériques du type « ent212 ». Le test se présente sous l’aspect suivant :

« Identifier le terme X à partir des phrases suivantes :

  1. Ce soutien-gorge hi-tech permet de combattre le X du sein
  2. Est-ce que la saccharine peut aider à vaincre le X
  3. Est-ce que les huiles de poisson peuvent être utiles contre le X.

Avec une simple recherche des termes les plus présents dans des phrases de ce type, un algorithme basique peut trouver que X = cancer. En anonymisant la base de données, les chercheurs forcent donc l’IA à analyser les liens grammaticaux et les relations causales entre les acteurs des textes.

Les résultats sont impressionnants, puisque la meilleure IA a été capable de répondre à 60 % des questions. Les difficultés rencontrées seraient dues aux structures grammaticales complexes. La voie des IA capables de lire est en train de se profiler à l’horizon.

Les IA de demain sauront lire


Laisser un commentaire