fermer
Intelligence Artificielle

Qu’est-ce que Midjourney et comment fonctionne-t-il ?

39468b21 583b 437c 9b41 eaebca07 jpg
Qu'est-ce que Midjourney et comment fonctionne-t-il ?

Avez-vous déjà souhaité pouvoir faire apparaître une image tout droit sortie de votre imagination ? C’est désormais possible en quelques minutes, grâce à des générateurs d’images comme Midjourney.

Peu importe que vous n’ayez pas de compétences artistiques ou que vous n’ayez jamais tenu un pinceau de votre vie. L’intelligence artificielle peut se charger de tout — tout ce dont vous avez besoin, c’est d’un peu de texte décrivant l’image que vous avez à l’esprit.

Mais d’où vient Midjourney et comment fonctionne-t-il ? Voici tout ce qu’il faut savoir.

Qu’est-ce que Midjourney ?

Midjourney est un exemple d’IA générative capable de convertir des messages en langage naturel en images. Ce n’est que l’un des nombreux générateurs d’images basés sur l’apprentissage automatique qui ont récemment vu le jour. Malgré cela, il est devenu l’un des plus grands noms de l’IA, aux côtés de DALL-E et de Stable Diffusion.

Avec Midjourney, vous pouvez créer des images de haute qualité à partir de simples invites textuelles. Vous n’avez pas besoin de matériel ou de logiciel spécialisé pour l’utiliser, car il fonctionne entièrement depuis l’application de discussions Discord. Le seul inconvénient ? Vous devez souscrire à un plan Midjourney avant de pouvoir commencer à générer des images. Ce n’est pas le cas de la plupart des concurrents, qui fournissent généralement au moins quelques générations d’images gratuitement.

Capture decran 2023 05 15 16.33.15 jpg

Néanmoins, la barrière à l’entrée avec Midjourney est extrêmement basse et tout le monde peut l’utiliser pour générer des images réalistes en quelques minutes. Les résultats peuvent aller de l’étrange à l’époustouflant, en fonction de la demande.

Dans certains cas, les images générées par Midjourney ont même trompé des experts en photographie et dans d’autres domaines. De même, vous avez peut-être vu des images générées par l’IA extrêmement convaincante sur les réseaux sociaux. Les exemples vont du pape François vêtu d’une veste à manches longues à l’arrestation supposée de Trump quelques jours avant l’événement.

Contrairement à DALL-E, qui est soutenu par OpenAI, le créateur de ChatGPT, Midjourney se décrit comme un projet indépendant et autofinancé. Il n’a d’ailleurs reçu aucun financement extérieur à ce jour. En revanche, OpenAI a levé jusqu’à 10 milliards de dollars auprès de Microsoft et d’une poignée d’autres investisseurs. Étant donné les origines modestes de Midjourney, ses résultats sont donc assez impressionnants.

Comment fonctionne Midjourney ?

Nous ne connaissons pas tous les rouages de Midjourney, car il s’agit d’un logiciel fermé qui fonctionne sur la base d’un code propriétaire. Cela dit, nous en savons assez sur la technologie sous-jacente pour proposer une explication générale.

Midjourney s’appuie sur deux technologies d’apprentissage automatique relativement nouvelles, à savoir les modèles de diffusion et de langage étendu. Le premier vous est peut-être déjà familier si vous avez utilisé des chatbots d’IA comme ChatGPT. Un modèle de langage étendu aide d’abord Midjourney à comprendre le sens de ce que vous tapez dans vos messages. Ce sens est ensuite converti en ce que l’on appelle un vecteur, que vous pouvez imaginer comme une version numérique de l’invite. Enfin, le vecteur guide un autre processus complexe connu sous le nom de diffusion.

La diffusion n’est devenue populaire que depuis une dizaine d’années, ce qui explique l’afflux soudain de générateurs d’images d’IA. Dans un modèle de diffusion, un ordinateur ajoute progressivement du bruit aléatoire à son ensemble d’images d’apprentissage. Au fil du temps, il apprend à récupérer l’image originale en inversant le bruit. Avec suffisamment d’entraînement, le modèle peut alors générer de nouvelles images en dénaturant une image aléatoire.

À quoi cela ressemble-t-il du point de vue d’un générateur d’images d’IA ? Lorsque vous entrez un texte comme « des chats blancs sur la Tour Eiffel post-apocalyptique », l’IA commence par un champ de bruit visuel. On peut considérer cette première étape comme l’équivalent des parasites de la télévision. À ce stade, l’image ne ressemble à rien. Cependant, un modèle d’IA entraîné peut utiliser la diffusion latente pour soustraire le bruit par étapes. Il finira par produire une image qui ressemble aux objets et aux idées du monde réel.

Soit dit en passant, c’est aussi la raison pour laquelle il faut généralement attendre une minute ou deux pour qu’une image générée par l’IA se développe complètement. Si vous arrêtez le processus plus tôt, vous obtiendrez une image avec du bruit qui n’aura pas subi suffisamment d’étapes de débruitage.

Combien coûte Midjourney ?

Si des chatbots comme ChatGPT et Bing Chat offrent une utilisation quasi illimitée gratuitement, il n’en va pas de même pour les générateurs d’images. La quasi-totalité d’entre eux sont limités, Midjourney n’offrant même pas d’essai gratuit. En effet, chaque tâche de génération d’images nécessite une grande puissance de calcul, en particulier des unités de traitement graphique (GPU). En outre, chaque GPU dispose d’une mémoire vidéo limitée, qui est utilisée en grande quantité pour le processus de débruitage.

Capture decran 2023 05 15 16.45.59 jpg

Dans ces conditions, il n’est pas surprenant qu’un générateur d’images d’IA de pointe vous coûte de l’argent. Dans le cas de Midjourney, vous devrez payer un minimum de 10 dollars par mois. Cela vous permet d’obtenir 3,3 heures de temps GPU, ce qui correspond à environ 200 générations d’images.

Les offres haut de gamme de Midjourney vous permettent d’obtenir un nombre illimité d’images, mais vous devrez attendre jusqu’à 10 minutes pour la génération. Si vous n’avez pas besoin de la meilleure qualité possible, je vous recommande de vous tourner vers d’autres générateurs d’images AI. Bien que la plupart des options gratuites n’aient pas encore rattrapé Midjourney, elles sont toujours aussi amusantes à utiliser.

Tags : Midjourney
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.