Le modèle de génération d’images DALL-E 2 d’OpenAI n’est plus à la pointe de la technologie. DALL-E, sorti pour la première fois en janvier 2021, a précédé d’autres plateformes d’art généré par l’IA de Stability AI et Midjourney. Au moment de la sortie de DALL-E 2 en 2022, OpenAI a ouvert une liste d’attente pour contrôler qui pouvait utiliser la plateforme après les critiques selon lesquelles DALL-E pouvait générer des images explicites photoréalistes et faisait preuve de partialité lorsqu’il générait des photos. L’entreprise a supprimé la liste d’attente en septembre de l’année dernière et a ouvert DALL-E 2 au public.

Aujourd’hui, OpenAI a annoncé DALL-E 3, son dernier générateur de texte à partir d’images, et a présenté certaines de ses nouvelles fonctionnalités impressionnantes, notamment la capacité de générer du texte lisible directement dans les images elles-mêmes — ce qui n’était pas facile avec DALL-E 2, et que d’autres modèles d’IA générateurs d’images concurrents, tels que Midjourney, ont encore du mal à réaliser.

« DALL-E 3 apporte des améliorations significatives par rapport à DALL-E 2 lorsqu’il s’agit de générer du texte à l’intérieur d’une image et dans des détails humains tels que les mains », écrit OpenAI sur sa page Web expliquant le nouveau modèle.

Cette fonctionnalité place OpenAI en concurrence directe avec Ideogram, une startup d’anciens Googlers lancée le mois dernier, qui propose également la génération d’images avec texte/typographie intégré(e) en utilisant son propre modèle d’IA.

En outre, OpenAI a écrit que DALL-E 3 comprend beaucoup mieux les relations spatiales que les utilisateurs incluent dans leur le prompt, générant des images qui placent les personnages et les objets là où l’utilisateur les a décrits, les uns par rapport aux autres. Cela signifie que les messages descriptifs peuvent désormais être rendus de manière beaucoup plus précise, comme le montre l’exemple de la capture d’écran ci-dessous.

Disponible pour ChatGPT Plus

OpenAI a également indiqué que DALL-E 3 serait disponible pour ChatGPT Plus, le niveau d’abonnement payant de 20 dollars par mois de son modèle de langage étendu (LLM), et pour ses nouveaux plans ChatGPT for Enterprise annoncés le mois dernier, ce qui signifie que les entreprises clientes auront désormais la possibilité de générer des images avec du texte pour leur marketing ou leurs documents internes.

En outre, OpenAI indique que ChatGPT peut aider les utilisateurs à affiner automatiquement leurs prompts afin de générer l’imagerie qui correspond le mieux à leur intention.

Dans le même temps, OpenAI écrit que « comme pour les versions précédentes, nous avons pris des mesures pour limiter la capacité de DALL-E 3 à générer des contenus violents, adultes ou haineux ».

Boostez votre carrière : 6 conseils pour optimiser votre profil LinkedIn

Qu’est-ce que Copilot de Microsoft ? Voici tout ce qu’il faut savoir sur l’assistant d’IA

Proton Docs : Une alternative sécurisée à Google Docs pour la confidentialité

Threads de Meta : 175 millions d’utilisateurs en un an, une croissance continue

Test de la Honor Pad 9 : Un équilibre idéal entre performance et prix

Test du Samsung Galaxy S24 : 6 mois plus tard, est-il toujours intéressant ?

Test des Nothing ear : L’Innovation audio sans compromis

Test de la DJI Power 1000 : Chargez tous vos appareils avec style et efficacité

OnePlus 13 : Une batterie de 6 200 mAh pour une autonomie record ?

Xiaomi Mix Fold 4 : Le smartphone pliable le plus fin arrive bientôt

Le litige continue : Epic Games accuse Apple de blocage délibéré en Europe

Honor Magic V3 : Des photos en direct avant la révélation officielle

Paris 2024 : Comment l’IA d’Intel transforme les Jeux Olympiques

Cloudflare lance une solution gratuite pour bloquer les bots d’IA scrapers de données

NFC : Une nouvelle ère de paiements multiples en un seul geste

iMac M4 : Performances boostées et design raffiné attendus pour 2024

Figma désactive son outil Make Design après accusations de plagiat

Apple admet que 8 Go de RAM ne suffisent plus pour certaines fonctions

Figma lance des fonctionnalités IA pour révolutionner le design de produits

Pour la première fois, le C++ est plus populaire que le C

Comment refuser que ChatGPT utilise vos chats pour former ses modèles ?

Comment obtenir et utiliser l’application ChatGPT pour macOS ?

Slack vs Teams : Quelle application de discussion instantanée choisir ?

Comment utiliser la nouvelle application de bureau ChatGPT ?

OpenAI lance la troisième version de DALL-E, promettant une meilleure génération d’images

Disponible pour ChatGPT Plus

La famille Echo de Amazon accueille toutes sortes de nouveaux appareils : Echo Hub et Echo Show 8

Facebook change son logo, mais ce n’est pas aussi radical que Twitter

The author Yohann Poiron

OpenAI lance la troisième version de DALL-E, promettant une meilleure génération d’images

Disponible pour ChatGPT Plus

The author Yohann Poiron

vous pourriez aussi aimer