fermer
Intelligence Artificielle

Gemini 2.5 Flash Image : Google ouvre l’ère de l’édition et de la génération vidéo parfaite par l’IA

Gemini 2.5 Flash Image : Google ouvre l'ère de l'édition et de la génération vidéo parfaite par l'IA
Gemini 2.5 Flash Image : Google ouvre l'ère de l'édition et de la génération vidéo parfaite par l'IA

Google vient d’annoncer la disponibilité générale de Gemini 2.5 Flash Image pour un usage en production. Cette mise à jour apporte aux développeurs de nouvelles possibilités en matière de génération et d’édition d’images assistées par l’IA, avec davantage de formats, d’outils créatifs et de cas d’usage concrets.

Gemini 2.5 Flash Image : De nouveaux formats et une flexibilité inédite

La grande nouveauté de Gemini 2.5 Flash Image réside dans la prise en charge de 10 formats d’image différents, couvrant aussi bien les besoins cinématographiques que ceux des réseaux sociaux.

Les rapports d’aspect désormais disponibles sont :

  • Paysage : 21:9, 16:9, 4:3, 3:2
  • Carré : 1:1
  • Portrait : 9:16, 3:4, 2:3
  • Flexibles : 5:4, 4:5

En plus, les développeurs peuvent désormais générer des images seules, sans texte ni légende, ce qui ouvre la voie à une utilisation plus directe dans des projets multimédias ou marketing.

Des fonctionnalités avancées pour les créateurs

Gemini 2.5 Flash Image ne se contente pas de produire des visuels : il apporte une véritable couche d’intelligence créative. Parmi les fonctions mises en avant par Google :

  • Fusion d’images pour combiner plusieurs sources visuelles de manière fluide.
  • Cohérence des personnages, permettant de conserver les mêmes traits dans différentes scènes, idéal pour le storytelling visuel.
  • Éditions ciblées en langage naturel, par exemple : « change la couleur de la veste en rouge » ou « ajoute un coucher de soleil en arrière-plan ».
  • Exploitation des connaissances du monde pour générer des images précises et réalistes.

Cas d’usage concrets pour les développeurs

Plusieurs entreprises explorent déjà le potentiel de Gemini 2.5 Flash Image :

  • Cartwheel combine le modèle avec son outil de 3D posing, garantissant un contrôle précis des personnages et une continuité narrative dans la création de scènes.
  • Volley, créateur du jeu Wit’s End, l’utilise pour générer et éditer des portraits de personnages, des scènes dynamiques et des compositions multi-personnages, le tout en temps réel à partir d’entrées textuelles ou vocales.

Par ailleurs, Google met en avant des applications expérimentales comme :

  • Bananimate : générer des GIF animés à partir d’images et de prompts.
  • Enhance: un zoom infini créatif avec upscale des photos.
  • Fit Check : un essayage virtuel pour tester des tenues grâce à l’IA.

Prix et disponibilité

Le modèle est accessible dès maintenant via :

  • Google AI Studio, avec un mode « build » pensé pour créer et tester rapidement des applications IA.
  • Vertex AI, destiné aux usages professionnels et aux entreprises.

Côté tarifs, Google reste aligné avec le modèle Flash 2.5 standard : 0,039 dollar par image générée et 30 dollars pour 1 million de tokens de sortie.

Un outil stratégique pour l’IA créative

Avec Gemini 2.5 Flash Image, Google fait un pas de plus vers une IA créative accessible et efficace. En élargissant les formats disponibles et en intégrant des outils d’édition intelligente, l’entreprise propose aux développeurs un modèle capable de rivaliser avec les meilleurs du marché, tout en facilitant la création d’applications interactives, artistiques ou commerciales.

Désormais disponible en production, Gemini 2.5 Flash Image ouvre la voie à une nouvelle génération d’outils créatifs basés sur l’IA, alliant puissance, cohérence et flexibilité.

Tags : Gemini 2.5Google
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.