À l’intérieur de DALL-E Mini, la machine à mèmes d’intelligence artificielle préférée d’Internet

Le 6 juin, Hugging Face, une entreprise qui héberge des projets d’intelligence artificielle open source, a vu le trafic vers un outil de génération d’images AI appelé DALL-E Mini monter en flèche.

L’application extérieurement simple, qui génère neuf images en réponse à n’importe quelle invite de texte tapée, a été lancée il y a près d’un an par un développeur indépendant. Mais après quelques améliorations récentes et quelques tweets viraux, sa capacité à esquisser grossièrement toutes sortes de visions surréalistes, hilarantes et même cauchemardesques est soudainement devenue magique. Voici ses interprétations de « Thanos à la recherche de sa mère chez Walmart », « des gars torse nu ivres errant dans le Mordor », « des images de caméras de vidéosurveillance de Darth Vader breakdance » et « un hamster Godzilla dans un sombrero attaquant Tokyo.”

Au fur et à mesure que de plus en plus de personnes créaient et partageaient des images DALL-E Mini sur Twitter et Reddit, et que de nouveaux utilisateurs sont arrivés, Hugging Face a vu ses serveurs submergés de trafic. « Nos ingénieurs n’ont pas dormi de la première nuit », explique Clément Delangue, PDG de Hugging Face, lors d’un appel vidéo depuis son domicile à Miami. « Il est vraiment difficile de servir ces modèles à grande échelle ; ils ont dû tout réparer. Ces dernières semaines, DALL-E Mini a servi environ 50 000 images par jour.

Illustration : WIRED Staff/Hugging Face

Le moment viral de DALL-E Mini n’annonce pas seulement une nouvelle façon de créer des mèmes. Il fournit également un premier aperçu de ce qui peut se produire lorsque les outils d’IA qui créent des images sur commande deviennent largement disponibles, et un rappel des incertitudes quant à leur impact possible. Les algorithmes qui génèrent des photographies et des illustrations personnalisées pourraient transformer l’art et aider les entreprises en matière de marketing, mais ils pourraient également avoir le pouvoir de manipuler et d’induire en erreur. Un avertissement sur la page Web de DALL-E Mini avertit qu’il peut « renforcer ou exacerber les préjugés sociétaux » ou « générer des images contenant des stéréotypes contre les groupes minoritaires ».

DALL-E Mini a été inspiré par un outil de création d’images d’IA plus puissant appelé DALL-E (un portemanteau de Salvador Dali et WALL-E), révélé par la société de recherche en IA OpenAI en janvier 2021. DALL-E est plus puissant mais n’est pas ouvertement disponible, en raison de craintes qu’il ne soit utilisé à mauvais escient.

Il est devenu courant que les percées dans la recherche sur l’IA soient rapidement reproduites ailleurs, souvent en quelques mois, et DALL-E n’a pas fait exception. Boris Dayma, un consultant en apprentissage automatique basé à Houston, au Texas, se dit fasciné par le document de recherche original de DALL-E. Bien qu’OpenAI n’ait publié aucun code, il a pu mettre au point la première version de DALL-E Mini lors d’un hackathon organisé par Hugging Face et Google en juillet 2021. La première version produisait des images de mauvaise qualité souvent difficiles à reconnaître, mais Dayma a continué à l’améliorer depuis. La semaine dernière, il a renommé son projet en Craiyon, après qu’OpenAI lui ait demandé de changer le nom pour éviter toute confusion avec le projet DALL-E original. Le nouveau site affiche des publicités, et Dayma prévoit également une version premium de son générateur d’images.

Les images DALL-E Mini ont un aspect distinctement extraterrestre. Les objets sont souvent déformés et tachés, et les gens apparaissent avec des visages ou des parties du corps manquants ou mutilés. Mais il est généralement possible de reconnaître ce qu’il tente de représenter, et il est souvent amusant de comparer la sortie parfois désordonnée de l’IA avec l’invite d’origine.