Comment IBM Watson a créé le « meilleur » trailer pour le film Morgane

affiche du film de science-fiction Morgane

Le film Morgane, qui sortira le 28 septembre, a déjà connu deux bandes-annonces. Une troisième vient tout juste de sortir et elle a été réalisée par un ordinateur.

Quoi de mieux pour donner un avant-goût d’un film sur la technologie que d’employer la technologie la plus en vogue : l’intelligence artificielle. C’est ce qu’ont très bien compris IBM et 20th Century Fox, le distributeur du film Morgane, un film bientôt en salle, traitant de l’amélioration physique et cognitive de l’être humain et que nous vous avons déjà présenté ici.

L’intelligence artificielle et le progrès scientifique ont toujours suscité fascination et craintes. Combien de films mettent en scène des robots intelligents et destructeurs ? Combien de films traitent des dérives d’une technologie employée pour exercer le mal ? Lorsqu’il est question de peur, le buzz n’est jamais très loin. C’est en tout cas le postulat de départ de l’initiative engagée par la 20th Century Fox.

Dans une publication sur le blog d’IBM, le responsable des relations presse explique comment l’équipe s’y est prise. Comme pour tout système d’intelligence artificielle, la première étape a été de « l’entraîner à comprendre une zone grâce aux techniques de machine learning et des API de Watson« .

A l’instar de ce qu’avait déjà fait l’équipe du film Impossible Things, le premier film réalisé par une IA, le système d’IBM a été nourri des images d’exactement 100 bande-annonces de films d’horreur. Chaque scène de ces 100 bande-annonces a été segmentée en petites séquences afin que les algorithmes de Watson puissent les analyser et les comprendre. Une analyse de la composition des images qui s’est faite en trois étapes.

Trois étapes d’apprentissage

D’abord, le système a identifié les personnes présentes, les objets et les éléments du paysage. Chaque scène a ainsi été associée à une émotion, issue d’une banque de 24 types d’émotions, et catégorisée selon près de 22 000 types : effrayante, romantique, apaisante et ainsi de suite.

En second lieu, le système a procédé à une analyse audio de la bande-son pour y détecter des sons distincts et ainsi déterminer les éléments clés du type ton de la voix du personnage, bruitages, ambiance musicale etc. L’objectif étant, encore une fois, de parvenir à labelliser les scènes selon les sentiments suscités.

Enfin, la composition générale de chaque scène est passée au crible du programme, qui a pu en déterminer le contenu avec finesse : emplacement de la scène (intérieur/extérieur, cuisine/salon…), cadrage de l’image (gros plan, contre-plongée, plan américain…) ou encore tonalité de la lumière ambiante. L’objectif, ici, étant d’identifier les ingrédients types de la recette idéale du film d’horreur à suspens.

L’heure de vérité

La partie décorticage enfin terminée, est venu le temps du choix des scènes et du montage. A noter que le système n’était pas limité dans son action : il était libre de choisir n’importe quelle scène du film et pas seulement celles issues des précédents trailers officiels.

Une fois le film visionné dans son entier, Watson a sélectionné 10 moments clés qui feraient les candidats parfaits pour occuper le devant de la scène. Ayant donné libre court au logiciel, ils s’attendaient néanmoins assez facilement aux résultats qu’il donnerait. Toutefois, IBM met en lumière le fait que parmi ces 10 moments choisis, une bonne partie n’était tout simplement pas inclus dans les versions précédentes. Enfin, parmi ces 10 scènes élues, l’équipe a jugé que l’une d’entre elles ne correspondait tout bonnement pas à l’idée générale qu’ils souhaitent transmettre à travers ce film, aussi ont-ils décidé de la supprimer.

Si c’est à une équipe bien humaine de finir le travail en montant le tout, avec un peu plus d’entraînement, de tels logiciels de tri pourraient faciliter les travaux de nombreux monteurs vidéo, pas nécessairement pour les films cinématographiques (où la touche humaine devrait encore longtemps dominer), mais pour d’autres applications diverses et variées comme le documentaire ou la surveillance vidéo pour ne citer qu’elles. D’après IBM, l’usage de ce procédé original a permis de créer une bande-annonce en moins de 24h, contre 10 à 30 heures pour le montage d’une bande-annonce normale.

Pour être honnête, la version d’IBM est bien moins dynamique et intrigante que les initiales. Mais à vous de juger comment l’IA s’en est sortie. La première vidéo est celle d’IBM, la seconde est le trailer original du film Morgane.


Laisser un commentaire

  1. Rhoda

    Il est fascinant de constater que les deux versions sont vraiment bonnes quoique absolument différentes.
    La version conçue par Watson est moins émotive mais elle atteint quand même l'objectif visé qui est de capter l'attention des auditeurs. Un fait intéressant à signaler est que le trailer représente Morgan comme étant moins hostile,agressive et donc par le fait même plus humaine que l'autre version :)

  2. oerton

    "ce procédé original a permis de créer une bande-annonce en moins de 24h, contre 10 à 30 heures pour le montage d’une bande-annonce normale". Donc ça n'a rien changé ?

  3. Anticipation

    La bande annonce commence quand même par it's the first birthday puis nice to meet you...

    Et çà je ne risque pas de l'oublier !

    Sachant qu'elle est faite par une machine, et si la bande son est aussi créée par la machine, elle fait bien flipper...

  4. Anticipation

    Désolé je vais encore faire mon rabat joie, mais voilà, çà résume l'humain, quoi de mieux pour commencer que de faire un film d'horreur et l'enseigner à un IA, génial, c'est comme si je mettais un môme devant des films d'horreur de 1 à 5 ans, qu'est ce qui va en ressortir, bien sûr j’exagère mais voyez, ils aurait pu justement mettre en avant la beauté plutôt que l'horreur ! ?