Une nouvelle IA génère des personnes d’un réalisme effrayant qui n’existent pas en réalité

À première vue, les deux rangées de portraits figurant en haut de cet article ressemblent à un groupe de personnes d’apparence moyenne. Le problème est qu’aucun d’entre eux n’existe. Tous ces visages sont des faux, créés par une intelligence artificielle.

Pour être plus précis, ces visages sont créés par un réseau adversatif génératif (GAN) développé par Nvidia, qui utilise des techniques d’apprentissage profond pour produire des portraits réalistes à partir d’une base de données de photos existantes.

Rendez-vous sur le site Cette personne n’existe pas pour le constater par vous-même : chaque fois que vous rafraîchissez la page, vous obtenez un nouveau visage. (Voyez combien de temps vous pouvez tenir avant d’être effrayé)

Avec un GAN, deux réseaux neuronaux – neuronaux comme conçus pour imiter le processus de décision du cerveau – travaillent en tandem. Ici, un réseau génère un faux visage, tandis qu’un autre décide s’il est suffisamment réaliste en le comparant à des photos de personnes réelles.

Si le test n’est pas réussi, le générateur de visage réessaie ; cette boucle de rétroaction est responsable des images que vous pouvez voir ici et sur le site. Des GAN similaires ont été utilisés pour faire passer une scène de l’hiver à l’été.

Nous avons déjà vu l’impressionnant codage de visage de Nvidia en action, mais il parvient maintenant à ajouter un nouveau niveau d’authenticité grâce à ce que l’on appelle le “transfert de style” : le traitement séparé de différentes parties de l’image (comme la forme du visage et la coiffure).

Cela signifie que différents visages peuvent être mélangés plus facilement et de manière plus réaliste, de la même manière que les applications photo transforment votre visage en peinture ou en croquis.

“Nous avons imaginé un nouveau générateur qui apprend automatiquement à séparer les différents aspects des images sans aucune supervision humaine”, expliquent les ingénieurs de Nvidia dans une vidéo YouTube.

“Après l’entraînement, nous pouvons combiner ces aspects de la manière que nous voulons”

Le transfert de style décompose les visages en différents éléments. (Nvidia)

La pondération de ces différents aspects du visage peut être modifiée et ajustée si nécessaire, ce qui donne aux programmeurs un plus grand contrôle sur le résultat final.

Quant au site Web, il n’a pas été créé par Nvidia elle-même, mais par Philip Wang, ingénieur chez Uber, sur la base du code que Nvidia a rendu public.

“Chaque fois que vous rafraîchissez le site, le réseau génère une nouvelle image faciale à partir de zéro, à partir d’un vecteur de 512 dimensions”, écrit Wang sur Facebook.

Nvidia a également appliqué ses techniques ” StyleGAN ” à la création d’autres fausses collections, notamment celles des voitures, des chats et des chambres à coucher. Les algorithmes qui sous-tendent l’IA sont entraînés à l’aide de photos accessibles au public, puis il leur est demandé de créer de nouvelles variations répondant au niveau de réalisme requis.

Bien sûr, tout cela nous ramène à la question des “deep fakes” : de faux actifs numériques, comme des photos ou des vidéos, qui ne peuvent être distingués des vrais.

Les systèmes d’intelligence artificielle vont devenir de plus en plus intelligents dans la production de ce type de contenu. Peut-être pourrons-nous ensuite les entraîner à repérer leurs propres contrefaçons et créer une sorte de processus de vérification avant que nous ne soyons submergés de séquences falsifiées de choses et de personnes qui n’ont jamais existé.

Entre-temps, si vous recherchez des photos de visages qui ne nécessitent pas l’autorisation des modèles, vous savez où vous adresser.

Les dernières recherches de Nvidia n’ont pas encore été évaluées par des pairs, mais vous pouvez consulter un article à ce sujet sur le serveur de préimpression arXiv.org.