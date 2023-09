Le modèle de génération d’images DALL-E 2 d’OpenAI n’est plus à la pointe de la technologie. DALL-E, sorti pour la première fois en janvier 2021, a précédé d’autres plateformes d’art généré par l’IA de Stability AI et Midjourney. Au moment de la sortie de DALL-E 2 en 2022, OpenAI a ouvert une liste d’attente pour contrôler qui pouvait utiliser la plateforme après les critiques selon lesquelles DALL-E pouvait générer des images explicites photoréalistes et faisait preuve de partialité lorsqu’il générait des photos. L’entreprise a supprimé la liste d’attente en septembre de l’année dernière et a ouvert DALL-E 2 au public.

Aujourd’hui, OpenAI a annoncé DALL-E 3, son dernier générateur de texte à partir d’images, et a présenté certaines de ses nouvelles fonctionnalités impressionnantes, notamment la capacité de générer du texte lisible directement dans les images elles-mêmes — ce qui n’était pas facile avec DALL-E 2, et que d’autres modèles d’IA générateurs d’images concurrents, tels que Midjourney, ont encore du mal à réaliser.

« DALL-E 3 apporte des améliorations significatives par rapport à DALL-E 2 lorsqu’il s’agit de générer du texte à l’intérieur d’une image et dans des détails humains tels que les mains », écrit OpenAI sur sa page Web expliquant le nouveau modèle.

Cette fonctionnalité place OpenAI en concurrence directe avec Ideogram, une startup d’anciens Googlers lancée le mois dernier, qui propose également la génération d’images avec texte/typographie intégré(e) en utilisant son propre modèle d’IA.

En outre, OpenAI a écrit que DALL-E 3 comprend beaucoup mieux les relations spatiales que les utilisateurs incluent dans leur le prompt, générant des images qui placent les personnages et les objets là où l’utilisateur les a décrits, les uns par rapport aux autres. Cela signifie que les messages descriptifs peuvent désormais être rendus de manière beaucoup plus précise, comme le montre l’exemple de la capture d’écran ci-dessous.

Disponible pour ChatGPT Plus

OpenAI a également indiqué que DALL-E 3 serait disponible pour ChatGPT Plus, le niveau d’abonnement payant de 20 dollars par mois de son modèle de langage étendu (LLM), et pour ses nouveaux plans ChatGPT for Enterprise annoncés le mois dernier, ce qui signifie que les entreprises clientes auront désormais la possibilité de générer des images avec du texte pour leur marketing ou leurs documents internes.

En outre, OpenAI indique que ChatGPT peut aider les utilisateurs à affiner automatiquement leurs prompts afin de générer l’imagerie qui correspond le mieux à leur intention.

Dans le même temps, OpenAI écrit que « comme pour les versions précédentes, nous avons pris des mesures pour limiter la capacité de DALL-E 3 à générer des contenus violents, adultes ou haineux ».