Intelligence artificielle

Ce qui mijote dans les labos

La crème des chercheurs en intelligence artificielle avait rendez-vous à Montréal cette semaine, pour le Deep Learning Summit organisé par l’organisme britannique RE•WORK. Entre les équations pour initiés et les recherches intrigantes, voici trois exemples de ce qui se trame dans les laboratoires en apprentissage profond et qui pourrait changer nos vies.

Karim Benessaieh La Presse

Apprendre en jouant

Sous ses allures de petit jeu simple qu’on peut essayer en ligne, GuessWhat?! (Devinez quoi?!) est un projet particulièrement efficace pour entraîner une intelligence artificielle. Le but est de trouver la personne ou l’objet choisi au hasard par l’ordinateur sur une photo. L’humain pose des questions (« Est-ce bleu ? Est-ce vivant ? ») et la machine, appelée « oracle », ne peut répondre que par oui ou par non.

Un de ses concepteurs, Aaron Courville, de l’Université de Montréal, a expliqué qu’on avait ainsi compilé 155 280 parties et 821 889 questions posées pour obtenir une intelligence artificielle particulièrement habile à détecter les détails d’une photo. En conférence, il a comparé l’élaboration de cette IA à la cuisine. « C’est un peu comme le sel et le poivre, vous en mettez et constatez que c’est meilleur ainsi. »

Détail troublant, on a testé puis abandonné l’idée de laisser deux machines discuter entre elles : très rapidement, leur dialogue « évolue pour devenir non humain », a constaté le chercheur. Les intelligences artificielles se sont en fait mises à poser des questions très pointues en disséquant les images pour trouver la solution.

S’entraîner avec Obama

Trouver des corrélations entre le son et l’image d’une vidéo est une tâche particulièrement difficile pour un ordinateur tant les deux contenus ont des formats différents. Avec son équipe de l’Université de Washington et en association avec Facebook, Ira Kemelmacher-Shlizerman a choisi de concevoir une intelligence artificielle en analysant plus de 300 allocutions de l’ex-président américain Barack Obama.

Pour les 17 heures et quelque 2 millions d’images, on a associé la forme de la bouche et les sons émis et établi mathématiquement des corrélations entre les deux. La machine a par exemple appris qu’on ne pouvait associer des images mouvantes et un silence et qu’il lui fallait prévoir la fin des mots pour choisir le bon mouvement des lèvres.

Le résultat est plutôt réussi : la conférencière a ainsi montré en simultané quatre vidéos différentes d’Obama prononçant les mêmes phrases, sans qu’on puisse identifier la « vraie » vidéo. « Mais on n’arrive pas à modéliser les émotions, précise la chercheuse. On se retrouve à parler de choses joyeuses en ayant l’air triste. »

Les applications pour ce genre de prouesses sont nombreuses, a précisé Mme Kemelmacher-Shlizerman : doublage, synchronisation des communications en direct, langage des signes… et fausses nouvelles.

Dehors, les chanteurs

Des géants de la diffusion en continu comme Spotify investissent énormément en recherche sur l’intelligence artificielle.

Il s’agit évidemment de cerner les goûts des quelque 140 millions d’utilisateurs pour leur proposer des chansons, mais on va plus loin. Un de ses scientifiques, Eric Humphrey, est ainsi venu faire le point sur une recherche plutôt intrigante qui n’a pas encore été publiée, visant à séparer les parties vocales et instrumentales des chansons. Pour créer, par exemple, des karaokés automatisés à partir de n’importe quelle chanson. « On s’est inspiré d’une recherche où on transformait des zèbres et chevaux, et on s’est dit : “Wow ! On devrait appliquer ça à la musique !” », a expliqué en conférence le chercheur, dont la plus récente publication sur l’apprentissage profond explorait les possibilités de description automatisée de la musique.

Comme pour tout projet en intelligence artificielle, le premier défi est de trouver des données en quantité suffisante pour « nourrir » l’ordinateur et créer un algorithme. C’est parmi les quelque 30 millions de chansons du catalogue de Spotify qu’on a trouvé la matière première : des chansons dont on avait lancé deux versions, avec et sans voix. On a ensuite laissé un algorithme déterminer les différences pour apprendre à isoler la voix.

Si les versions instrumentales ainsi créées sont très satisfaisantes, les voix extraites ont une sonorité artificielle dérangeante, a reconnu M. Humphrey. « L’isolation vocale n’est pas concluante… mais le futur est prometteur. »