Des réseaux convolutifs pour créer de nouveaux Pokémon

Un chercheur japonais s’est amusé à trafiquer l’apparence de 151 Pokémon avec des réseaux de neurones convolutifs pour en créer de nouveaux.

Yann LeCun en personne félicitait l’inventivité sans failles des spécialistes du machine learning quand il s’agissait d’utiliser DCGAN. DCGAN tient pour Deep Convolutional Generative Adversarial Networks. Il s’agit d’un système de génération d’image basé sur les réseaux convolutifs (CNN ou ConvNets), la technique développée par Yann LeCun et qui lui a valu d’être embauché à la tête du laboratoire d’intelligence artificielle de Facebook pour ses prouesses en termes de reconnaissance visuelle par ordinateur.

Le DCGAN a quant à lui été développé par Alec Radford, actuellement chercheur en machine learning pour le compte d’OpenAI, Luke Metz, qui travaille pour Google Brain et Soumith Chintala, lui-même chercheur en intelligence artificielle chez Facebook. Les trois scientifiques ont été amenés à inventer cette nouvelle technique pour combler l’absence de recherche dans le domaine de l’apprentissage non supervisé à base de réseaux convolutifs.

Très rapidement, leur technique associe des aspects de l’apprentissage non supervisé (les réseaux adverses) et des aspects de l’apprentissage supervisé (les réseaux convolutifs) et permettrait d’en créer une nouvelle très efficace. Ce système est constitué de deux éléments clés, un générateur d’image (G) et un discriminateur (D) qui compare de vrais images à celles qui ont été générées. Les deux réseaux de neurones entrent alors en compétition pour se tromper l’un l’autre. C’est ce qu’on appelle l’apprentissage adverse. C’est la raison pour laquelle les chercheurs se réfèrent à G par « voleur » et à D par « police ». L’un consiste d’un réseau deconvolutif et l’autre d’un réseau convolutif.

C’est avec cette technique que de nombreux chercheurs se sont amusés à recréer de nouvelles fleurs, de nouveaux caractères chinois ou bien de nouveaux personnages de manga.

dgcan-reseaux-convolutifs

Les ConvNets pour créer de nouveaux Pokémon

Comment populariser une discipline de laboratoire que seuls quelques adeptes comprennent et maîtrisent ? Ce n’est peut-être pas la question qui a décidé Yota Ishida, alias Bohemian, à appliquer la fameuse technique du DGCAN au petit monde virtuel des Pokémon. Mais en tout cas, cela a le mérite d’avoir plus de retentissement. Malheureusement, l’actuel code fourni par le trio de chercheurs ne permet pas encore à ses utilisateurs comme Ishida de sortir des images en haute-résolution. Il faudra donc se contenter d’images relativement pixelisées.

Des images de nouveaux Pokémon, obtenues justement grâce au DGCAN. Pour y parvenir, le japonais a nourri son système d’une liste d’images de 151 créatures du tout nouveau Pokémon Go, mais qui reprend les originaux des premiers opus. Et pour chacun d’entre eux il a pris une série de points de vues différents pour obtenir environ 3000 images au total.

20160813120840

Il a ensuite étendu sa banque d’images à 16 000 unités en déformant légèrement ces 3000 de départ. C’est à dire en modifiant les courbes ou le contraste. Comme le relève le site FastCoDesign, la beauté de l’expérience tient surtout du fait qu’elle a révélé la difficulté de créer de nouveaux Pokémon à partir des 151 originaux. Tout simplement parce que à l’époque, la résolution de la Game Boy était si médiocre que les designers avaient du trouver des caractéristiques physiques spécifiques à chacun de ces petits monstres, de manière à ce qu’on puisse facilement les identifier malgré la qualité de l’image. Aussi, dans les images générées à partir des originales, on retrouve dans la plupart des cas les traces de cette fameuse spécificité physique.

A l’arrivée on obtient de curieux méli-mélo de différents Pokémon. Si le résultat n’est pas tout à fait réussi, on attend avec impatience l’arrivée des images haute-qualité pour voir d’un peu plus prêt à quoi pourraient bien ressembler ces créatures de sang-mêlé. Et qui sait, peut-être que les studios de Nintendo recourront à ce genre de techniques lorsqu’il seront à court d’idées pour inventer toujours plus de Pokémon.

Amateurs de machine learning, vous pouvez accéder librement au code Torch ici.


Laisser un commentaire