fermer
Intelligence Artificielle

OpenAI lance la troisième version de DALL-E, promettant une meilleure génération d’images

crab jpg
OpenAI lance la troisième version de DALL-E

Le modèle de génération d’images DALL-E 2 d’OpenAI n’est plus à la pointe de la technologie. DALL-E, sorti pour la première fois en janvier 2021, a précédé d’autres plateformes d’art généré par l’IA de Stability AI et Midjourney. Au moment de la sortie de DALL-E 2 en 2022, OpenAI a ouvert une liste d’attente pour contrôler qui pouvait utiliser la plateforme après les critiques selon lesquelles DALL-E pouvait générer des images explicites photoréalistes et faisait preuve de partialité lorsqu’il générait des photos. L’entreprise a supprimé la liste d’attente en septembre de l’année dernière et a ouvert DALL-E 2 au public.

Aujourd’hui, OpenAI a annoncé DALL-E 3, son dernier générateur de texte à partir d’images, et a présenté certaines de ses nouvelles fonctionnalités impressionnantes, notamment la capacité de générer du texte lisible directement dans les images elles-mêmes — ce qui n’était pas facile avec DALL-E 2, et que d’autres modèles d’IA générateurs d’images concurrents, tels que Midjourney, ont encore du mal à réaliser.

« DALL-E 3 apporte des améliorations significatives par rapport à DALL-E 2 lorsqu’il s’agit de générer du texte à l’intérieur d’une image et dans des détails humains tels que les mains », écrit OpenAI sur sa page Web expliquant le nouveau modèle.

potatoking jpg

Cette fonctionnalité place OpenAI en concurrence directe avec Ideogram, une startup d’anciens Googlers lancée le mois dernier, qui propose également la génération d’images avec texte/typographie intégré(e) en utilisant son propre modèle d’IA.

En outre, OpenAI a écrit que DALL-E 3 comprend beaucoup mieux les relations spatiales que les utilisateurs incluent dans leur le prompt, générant des images qui placent les personnages et les objets là où l’utilisateur les a décrits, les uns par rapport aux autres. Cela signifie que les messages descriptifs peuvent désormais être rendus de manière beaucoup plus précise, comme le montre l’exemple de la capture d’écran ci-dessous.

dalle image map jpg

Disponible pour ChatGPT Plus

OpenAI a également indiqué que DALL-E 3 serait disponible pour ChatGPT Plus, le niveau d’abonnement payant de 20 dollars par mois de son modèle de langage étendu (LLM), et pour ses nouveaux plans ChatGPT for Enterprise annoncés le mois dernier, ce qui signifie que les entreprises clientes auront désormais la possibilité de générer des images avec du texte pour leur marketing ou leurs documents internes.

En outre, OpenAI indique que ChatGPT peut aider les utilisateurs à affiner automatiquement leurs prompts afin de générer l’imagerie qui correspond le mieux à leur intention.

Dans le même temps, OpenAI écrit que « comme pour les versions précédentes, nous avons pris des mesures pour limiter la capacité de DALL-E 3 à générer des contenus violents, adultes ou haineux ».

Tags : ChatGPT PlusDall-EDALL-E 3OpenAI
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.