Facktualité

Ce que l’art généré par l’IA signifie vraiment pour la créativité humaine

Par

18 novembre 2022

Photo Lee Unkrich, l’un des animateurs les plus distingués de Pixar, en tant qu’élève de septième. Il regarde l’image d’une locomotive sur l’écran du premier ordinateur de son école. Ouah, il pense. Une partie de la magie s’estompe, cependant, lorsque Lee apprend que l’image n’est pas apparue simplement en demandant « une photo d’un train ». Au lieu de cela, il a dû être minutieusement codé et rendu par des humains qui travaillent dur.

Maintenant, imaginez Lee 43 ans plus tard, tombant sur DALL-E, une intelligence artificielle qui génère des œuvres d’art originales basées sur des invites fournies par l’homme qui peuvent littéralement être aussi simples qu’une « image d’un train ». Alors qu’il tape des mots pour créer image après image, le wow est de retour. Sauf que cette fois, ça ne part pas. « C’est comme un miracle », a-t-il dit. « Lorsque les résultats sont apparus, j’ai eu le souffle coupé et les larmes me sont montées aux yeux. C’est magique.

Nos machines ont franchi un seuil. Toute notre vie, nous avons été rassurés que les ordinateurs étaient incapables d’être véritablement créatifs. Pourtant, tout à coup, des millions de personnes utilisent désormais une nouvelle génération d’IA pour générer des images époustouflantes et inédites. La plupart de ces utilisateurs ne sont pas, comme Lee Unkrich, des artistes professionnels, et c’est le point : ils n’ont pas à l’être. Tout le monde ne peut pas écrire, réaliser et monter un lauréat d’un Oscar comme Toy Story 3 ou cocomais tout le monde boîte lancer un générateur d’images AI et saisir une idée. Ce qui apparaît à l’écran est stupéfiant de réalisme et de profondeur de détails. Ainsi la réponse universelle : Ouah. Sur quatre services seulement – Midjourney, Stable Diffusion, Artbreeder et DALL-E – les humains travaillant avec des IA cocréent désormais plus de 20 millions d’images chaque jour. Avec un pinceau à la main, l’intelligence artificielle est devenue un moteur de wow.

Parce que ces IA génératrices de surprises ont appris leur art à partir de milliards d’images faites par des humains, leur sortie oscille autour de ce à quoi nous nous attendons à ce que les images ressemblent. Mais parce qu’il s’agit d’une IA extraterrestre, fondamentalement mystérieuse même pour leurs créateurs, ils restructurent les nouvelles images d’une manière à laquelle aucun humain n’est susceptible de penser, remplissant des détails que la plupart d’entre nous n’auraient pas l’art d’imaginer, sans parler des compétences éxécuter. Ils peuvent également être chargés de générer plus de variations de quelque chose que nous aimons, dans le style que nous voulons, en quelques secondes. Ceci, en fin de compte, est leur avantage le plus puissant : ils peuvent créer de nouvelles choses qui sont compréhensibles et compréhensibles mais, en même temps, complètement inattendues.

En fait, ces nouvelles images générées par l’IA sont si inattendues que, dans la crainte silencieuse qui suit immédiatement la wow– une autre pensée vient à l’esprit à peu près tous ceux qui les ont rencontrés : l’art créé par l’homme doit maintenant être terminé. Qui peut rivaliser avec la vitesse, le bon marché, l’échelle et, oui, la créativité sauvage de ces machines ? L’art est-il une autre poursuite humaine que nous devons céder aux robots ? Et la prochaine question évidente : si les ordinateurs peuvent être créatifs, que peuvent-ils faire d’autre qu’on nous a dit qu’ils ne pouvaient pas ?

J’ai passé les six derniers mois à utiliser des IA pour créer des milliers d’images saisissantes, perdant souvent une nuit de sommeil dans la quête sans fin pour trouver juste un de plus beauté cachée dans le code. Et après avoir interrogé les créateurs, les utilisateurs expérimentés et d’autres utilisateurs précoces de ces générateurs, je peux faire une prédiction très claire : l’IA générative modifiera la façon dont nous concevons à peu près tout. Oh, et pas un seul artiste humain ne perdra son emploi à cause de cette nouvelle technologie.

C’est non exagération d’appeler des images générées à l’aide de l’IA cocréations. Le secret de ce nouveau pouvoir qui donne à réfléchir est que les meilleures applications de celui-ci ne sont pas le résultat de la saisie d’une seule invite, mais de très longues conversations entre les humains et les machines. Les progrès pour chaque image proviennent de très nombreuses itérations, allers-retours, détours et heures, parfois jours, de travail d’équipe, le tout grâce à des années de progrès dans l’apprentissage automatique.

Les générateurs d’images IA sont nés du mariage de deux technologies distinctes. L’un était une ligne historique de réseaux neuronaux d’apprentissage en profondeur qui pouvaient générer des images réalistes cohérentes, et l’autre était un modèle de langage naturel qui pouvait servir d’interface avec le moteur d’image. Les deux ont été combinés dans un générateur d’images basé sur le langage. Les chercheurs ont récupéré sur Internet toutes les images contenant du texte adjacent, comme des légendes, et ont utilisé des milliards de ces exemples pour relier les formes visuelles aux mots et les mots aux formulaires. Avec cette nouvelle combinaison, les utilisateurs humains pouvaient entrer une chaîne de mots – l’invite – décrivant l’image qu’ils recherchaient, et l’invite générerait une image basée sur ces mots.