fermer
IA

OpenAI ouvre la génération de texte-image par l’IA avec l’API DALL-E

OpenAI ouvre la génération de texte-image par l'IA avec l'API DALL-E

OpenAI rend son logiciel de génération d’images DALL-E beaucoup plus largement accessible aux entreprises avec le lancement d’une API en version bêta publique. L’API permettra aux entreprises d’ajouter plus facilement la fonctionnalité de conversion de texte en image de DALL-E à leurs produits, en donnant aux développeurs des outils simplifiés pour intégrer et personnaliser le logiciel à leur goût.

Un des premiers cas d’utilisation de l’API est l’application Designer de Microsoft, qui utilise le logiciel pour générer des images pour les utilisateurs d’Office, des diapositives PowerPoint aux illustrations pour les devoirs. Microsoft est l’un des principaux investisseurs d’OpenAI et a dévoilé l’application le mois dernier.

L’intérêt et l’adoption de l’IA texte-image ont explosé au cours de l’année dernière, et OpenAI, qui était autrefois le leader incontesté du domaine, a été concurrencé par de nouveaux venus comme Midjourney et Stability AI. Ces organisations ont imposé moins de restrictions aux utilisateurs, leur permettant de développer leurs systèmes d’IA avec peu de surveillance. Dans le même temps, d’autres acteurs de cet espace, comme Google et Meta, ont adopté une approche beaucoup plus prudente : ils ont développé des systèmes dotés de capacités analogues, mais ont restreint leur utilisation publique à des scénarios très limités.

Outre les avantages créatifs évidents qu’offre l’IA du texte à l’image, les dangers sont multiples. Le logiciel peut être utilisé pour générer des informations erronées et des images préjudiciables, comme des nus non consentis (bien qu’OpenAI rende difficile une telle utilisation de son logiciel grâce à des filtres par mots-clés), et l’utilisation des données soulève des questions éthiques délicates.

Les systèmes d’IA texte-image comme DALL-E sont formés à partir d’images extraites du Web, qui comprennent généralement des œuvres protégées par des droits d’auteur de photographes, d’artistes et de concepteurs. De nombreux artistes sont mécontents que la technologie qui en résulte puisse non seulement être utilisée pour imiter leur style personnel, mais aussi qu’ils n’aient pas été indemnisés pour l’utilisation de leur travail afin de générer des revenus pour des sociétés multimilliardaires comme OpenAI.

OpenAI affirme que l’accès à l’API de DALL-E sera limité dans un premier temps, à mesure que l’entreprise développera ses systèmes, et qu’elle ne contrôlera pas la manière dont les clients utilisent la technologie. Les clients seront facturés par image générée et pourront choisir entre trois niveaux de résolution. Les images 256 x 256 coûteront 0,016 dollar l’unité, les images 512 x 512 0,018 dollar l’unité et les images 1024 x 1024 0,02 dollar l’unité.

Tags : APIAPI DALL-EDall-EIAOpenAI
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.