INTELLIGENCE ARTIFICIELLE

L’ART DE COPIER SANS PAYER

Si une image vaut mille mots, avec l’intelligence artificielle, il suffit désormais d’écrire une courte phrase dans une boîte de dialogue pour générer des images époustouflantes à l’infini. La Presse est allée à la rencontre d’artistes québécois dont les œuvres ont servi, à leur insu et sans qu’ils y aient consenti, à entraîner un logiciel qui « apprend » un peu trop vite à les imiter.

Un dossier de Tristan Péloquin

Quand l’IA avale les œuvres
à l'insu des artistes

Le fonctionnement du logiciel est d’une simplicité déroutante. Imaginez une scène, banale, fantastique ou surréelle, et tapez sa description (en anglais) dans une boîte de dialogue. Ajoutez le nom du grand peintre que vous voulez imiter, puis patientez quelques secondes.

Si l’une des quatre images qui apparaissent à l’écran ne vous satisfait pas, il suffit de reformuler et de recommencer. Encore, et encore.

Depuis un peu plus d’un mois, le fruit de cette opération sans effort, répétée des centaines de milliers de fois par des internautes de partout sur la planète, a donné naissance à ce qui est certainement une des plus grandes galeries d’images d’art que l’humanité a pu voir à ce jour. Le répertoire, diffusé sur le site Lexica.art, contient déjà des centaines de portraits improbables de Justin Trudeau posant avec un fusil d’assaut, des milliers de paysages urbains fantastiques inspirés du monde réel, et des gigaoctets d’images reconstituant autant d’exploits de hockeyeurs fantasmagoriques, d’illustrations de batailles historiques de la guerre du Viêtnam ou de dessins de Céline Dion en héroïne de la série The Walking Dead.

La matrice d’intelligence artificielle derrière cette prouesse, Stable Diffusion, de la société britannique Stability AI, n’est pas la seule à se disputer le marché naissant de l’art créé par le langage naturel (« text-to-image art »). Ses concurrentes, Midjourney, lancée en mars, et Dall-E, apparue en avril, sont aussi en train de s’imposer à coups de cycles de financement récoltant des centaines de millions en capital de risque. Google promet une réplique qui s’appellera Imagen.

Mais il y a un os.

Pour qu’ils puissent générer de l’art sur demande, les développeurs de ces logiciels ont d’abord dû leur faire ingurgiter des millions de photos descriptives et d’œuvres d’art existantes, afin d’entraîner leur « réseau neuronal » à « comprendre » et « interpréter » le monde.

Stable Diffusion a révélé que les 2,3 millions d’images qui ont servi à son entraînement proviennent d’un gigantesque coup de gratte passé sur le web grâce à des robots d’indexation (web crawlers, en anglais). Le groupe de chercheurs universitaires qui a réalisé l’opération n’a jamais demandé la moindre autorisation aux dizaines de milliers d’artistes qui détiennent les droits de ces œuvres.

« Les gens croyaient que les images venaient de bases de données publiques, mais ce n’est pas le cas. Je pensais que ça devait être connu de la population et des artistes touchés », lance Andy Baio, influent blogueur technologique et ex-administrateur du site de sociofinancement Kickstarter, qui a mis en ligne, au début septembre, un moteur de recherche permettant de fouiller dans la base de données d’images ainsi englouties par Stable Diffusion.

La Presse a trouvé dans cette base de données les noms de plusieurs peintres et photographes canadiens et québécois, dont les œuvres ont servi à leur insu à entraîner le logiciel.

« Ils ne m’ont pas demandé la permission », confirme le peintre Mathieu Laca, que nous avons rencontré dans son atelier de Laval à son retour d’une tournée en Allemagne. Une quinzaine de ses portraits éclatés de René Lévesque, de Michel Tremblay et de Marilyn Monroe, notamment, figurent dans la base de données.

« Ça fait chier qu’ils puissent utiliser ça sans consentement, et que ce soit même éventuellement vendu. »

— Mathieu Laca, peintre

Se prêtant néanmoins au jeu, l’artiste a essayé de se servir de Stable Diffusion pour générer un portrait de Samuel Beckett imitant son propre style « brutal et texturé ». « Les résultats sont assez aléatoires, constate-t-il. On n’a pas vraiment de contrôle sur la composition, et l’image est extrêmement contrastée, sans nuances », analyste-t-il.

N’empêche, le résultat plaît à l’œil. « J’ai aussi fait un Dalí. Il y a quelques bizarreries dans les teintes, mais on reconnaît son style », constate Mathieu Laca.

Nous avons aussi trouvé dans la base de données quelques photos architecturales du photographe montréalais Louis-Philippe Provost.

Après quelques essais avec le logiciel, nous avons créé une série de photos d’Habitat 67 qui s’approchent de son style très léché.

« Dorénavant, n’importe qui pourra concocter une photo parfaite de n’importe quoi sans même sortir de sa maison. »

— Louis-Philippe Provost, photographe

« J’ai mis une vingtaine d’années à perfectionner mon style et à apprendre les différentes techniques de logiciels photo, ajoute-t-il. Je travaille de nombreuses heures sur chacune des photos que je produis. De voir mes œuvres se retrouver sur ce genre de site sans mon consentement devient très frustrant. »

Denis Nolet, un peintre dont une demi-douzaine de toiles figuratives montrant la ville de Québec se trouve aussi dans la base de données, soulève d’autres considérations éthiques. « La grande majorité des toiles que je crée, je les jette parce que je juge qu’elles ne sont pas à la hauteur, parce qu’elles n’ont pas d’âme. J’ai le luxe de le faire. Avec cette machine, il n’y a pas mon jugement final. L’intelligence artificielle ne rehausse rien », estime le peintre.

« L’art, c’est faire des choix. Une multitude de choix, tranche Mathieu Laca. Pourquoi j’ai décidé de faire les rides sous les yeux de mon sujet avec des coups de spatule ou avec des dégoulinures ? Pourquoi tu décides de gratter ci et d’estomper ça ? Il y a, dans toute œuvre d’art, tout ce qui est de l’ordre de l’accident, de l’inconscient ! Tu ne peux pas décrire tout ça dans la boîte de dialogue d’un logiciel. »

De nouveaux « artistes »
de la boîte de dialogue

L’Institut d’éthique en intelligence artificielle de Montréal, qui s’intéresse de près à la question, reconnaît que « l’échelle et le rythme » sans précédent auxquels ces machines sont capables de produire bousculeront certains métiers artistiques.

« Mais ça ne veut pas dire que les humains ne sont pas impliqués. Il y a un nouveau champ en émergence lié à l’IA, qui s’appelle le prompt engineering, qui est en soi une forme d’art », indique Abhishek Gupta, chercheur principal et directeur de l’Institut.

Sur les forums Reddit et Discord, ces « artistes de l’art par le langage naturel » se partagent des trucs et des phrases clés pour « créer » des œuvres toujours plus saisissantes avec l’IA. « Ça va devenir un savoir-faire qui peut s’apprendre et s’améliorer avec l’entraînement, prédit M. Gupta. Il y aura, éventuellement, une catégorie de personnes qui pourront être employables grâce à ces compétences. »

Mais d’ici là, il faudra d’abord régler l’enjeu épineux des droits d’auteur, reconnaît-il.

Déjà, les grandes agences de photos et d’images créatives Getty Images et Shutterstock, dont des millions d’images protégées ont été ingurgitées par Stable Diffusion, ont annoncé qu’elles bannissaient de leurs catalogues tout ce qui est créé par l’intelligence artificielle. Andy Baio s’attend à ce qu’une des deux entreprises intente des poursuites contre Stable Diffusion. « Elles sont les seules à avoir les ressources pour le faire », croit-il.

Trop tard pour « désapprendre »

Pour les artistes, par contre, les recours judiciaires, qui impliquent de s’attaquer à une entreprise établie à l’étranger, s’annoncent plus difficiles, estime Karim Benyekhlef, directeur du Laboratoire de cyberjustice de l’Université de Montréal. « Que leurs œuvres se retrouvent dans une base de données de 6 millions, de 600 millions ou 6 milliards d’images n’a pas d’incidence sur la gravité du viol d’une propriété intellectuelle », souligne-t-il.

« Mais on est ici dans la logique californienne [de la Silicon Valley] : ces entreprises-là foncent, enfreignent les règles, et ça fait partie de leur calcul de se dire qu’au bout du compte, il n’y a qu’une centaine d’artistes qui vont avoir les reins assez solides pour les poursuivre, donc le jeu en vaut la chandelle. »

— Karim Benyekhlef, directeur du Laboratoire de cyberjustice de l’Université de Montréal

Et de toute façon, le génie est déjà sorti de la bouteille. « Même si des artistes arrivent à faire retirer leurs œuvres d’art de la base de données, à ce stade, à moins de recréer l’intelligence artificielle de la machine en partant de zéro, elle ne peut pas “désapprendre” ce qu’elle a déjà appris », assure Andy Baio.

Ce texte provenant de La Presse+ est une copie en format web. Consultez-le gratuitement en version interactive dans l’application La Presse+.