À une époque où l’IA est de nouveau au centre de l’attention du monde de la technologie, Google a présenté son générateur d’IA texte-en-image qui peut vous fournir des images en fonction du texte saisi. Il s’agit du système d’IA Imagen, créé par l’équipe de Google Brain, et si l’on en croit Google et le lot d’exemples d’images, il peut générer « des images photoréalistes et un niveau profond de compréhension du langage ».

Comme son nom l’indique, la tâche n’est pas difficile. Tout ce que vous devez faire, c’est taper ce que vous voulez voir et, en se basant sur sa compréhension après avoir lu des tas de données, Imagen va générer une image pour vous. Le site Web d’Imagen présente quelques cas d’utilisation et ce que nous voyons est assez impressionnant. Imagen combine de grands modèles de langage transformateur pour comprendre le texte et des modèles de diffusion pour créer des images de haute qualité.

Les résultats semblent assez précis et concurrencent fortement d’autres modèles d’IA de conversion de texte en image comme le populaire DALL-E d’OpenAI (qui a même un successeur) et VQ-GAN+CLIP. Google en a même la preuve. Il a mis en place un outil de benchmarking appelé DrawBench à cet effet et ses données perçoivent Imagen comme le meilleur.

Google révèle également que sur le COCO, Imagen a pu obtenir un FID de 7,27 et que les évaluateurs humains ont trouvé les résultats « équivalents aux images de référence ».

Mais, il faut savoir que les exemples d’images fournis par ces systèmes d’IA sont souvent ceux qui sont jugés les meilleurs et ceux qui dérapent restent bien en dessous. Ainsi, considérer le modèle d’IA de Google comme le meilleur peut être trop tôt.

Impressionnant… mais effrayant

Le modèle d’IA a également son lot de mises en garde, que Google ne se prive pas de souligner. L’IA peut être utilisée comme un outil pour des activités malveillantes, comme la création de contenus désobligeants ou de fausses images, et c’est pourquoi elle n’est pas encore disponible pour être testée. De plus, l’IA peut être sujette à divers préjugés sociaux.

Sur le site Web d’Imagen, on peut lire : « Imagen présente de sérieuses limitations lorsqu’il s’agit de générer des images représentant des personnes. Nos évaluations humaines ont montré qu’Imagen obtient des taux de préférence significativement plus élevés lorsqu’il est évalué sur des images qui ne représentent pas des personnes, ce qui indique une dégradation de la fidélité de l’image. L’évaluation préliminaire suggère également qu’Imagen encode plusieurs biais et stéréotypes sociaux, y compris un biais général vers la génération d’images de personnes au teint plus clair et une tendance à aligner les images représentant différentes professions sur les stéréotypes de genre occidentaux ».

On peut donc dire qu’Imagen a encore besoin d’un peu de travail pour pouvoir correctement fonctionner. Néanmoins, pour la partie ludique, Imagen semble être un bon choix et si vous avez l’intention de voir quelque chose de loufoque et d’irréel, Imagen peut peut-être vous aider. Que pensez-vous de l’IA texte-image de Google ?

Google obtient l’exclusivité pour explorer les contenus de Reddit au détriment de Bing ou DuckDuckGo

Apple Plans débarque sur le Web : Itinéraires et avis en ligne maintenant disponibles

Un nombre « significatif » des 8,5 millions de PC touchés par la panne de CrowdStrike sont réparés

Juillet explosif sur Xbox Game Pass : Call of Duty Modern Warfare 3 et Valorant

Test du Roborock Flexi Pro : Un aspirateur balai intelligent et puissant

Test de la Withings ScanWatch Nova : Alliant élégance et technologies de santé

Test de la Honor Pad 9 : Un équilibre idéal entre performance et prix

Test du Samsung Galaxy S24 : 6 mois plus tard, est-il toujours intéressant ?

Oppo Find X8 Ultra : Un design raffiné et une batterie impressionnante pour 2025

SMIC et Huawei : Vers des smartphones 5G plus puissants avec des puces en 5 nm

La caméra de l’iPhone 17 sera un capteur Samsung et non Sony

Xiaomi lancera le Mix Flip en Europe : Un smartphone pliable pour rivaliser avec Samsung

Meta AI : Nouveaux outils de création d’images et disponibilité élargie à 22 pays

NotchNook : Transformez l’encoche de votre MacBook en outil pratique

Xiaomi SU7 Ultra : La nouvelle berline électrique à 1548 chevaux

Adobe Illustrator révolutionne le design avec le Remplissage génératif de forme

L’assistant de codage IA Pieces, une alternative à GitHub Copilot

Figma désactive son outil Make Design après accusations de plagiat

Apple admet que 8 Go de RAM ne suffisent plus pour certaines fonctions

Figma lance des fonctionnalités IA pour révolutionner le design de produits

Google Workspace vs Microsoft 365 : Quelle suite de productivité choisir ?

Comment installer la bêta publique d’iOS 18 sur votre iPhone et iPad ?

Comment obtenir le nouveau Windows Copilot sur n’importe quel appareil ?

Comment refuser que ChatGPT utilise vos chats pour former ses modèles ?

L’IA text-to-image de Google peut fournir des « images photoréalistes »

Impressionnant… mais effrayant

Motorola lancera en juillet le premier smartphone doté d’une caméra de 200 mégapixels

Amazon Fire OS 8, la surcouche basée sur Android 11, débarque cet été

The author Yohann Poiron

L’IA text-to-image de Google peut fournir des « images photoréalistes »

Impressionnant… mais effrayant

The author Yohann Poiron

vous pourriez aussi aimer