Google vient d’annoncer la disponibilité générale de Gemini 2.5 Flash Image pour un usage en production. Cette mise à jour apporte aux développeurs de nouvelles possibilités en matière de génération et d’édition d’images assistées par l’IA, avec davantage de formats, d’outils créatifs et de cas d’usage concrets.
Gemini 2.5 Flash Image : De nouveaux formats et une flexibilité inédite
La grande nouveauté de Gemini 2.5 Flash Image réside dans la prise en charge de 10 formats d’image différents, couvrant aussi bien les besoins cinématographiques que ceux des réseaux sociaux.
Les rapports d’aspect désormais disponibles sont :
- Paysage : 21:9, 16:9, 4:3, 3:2
- Carré : 1:1
- Portrait : 9:16, 3:4, 2:3
- Flexibles : 5:4, 4:5
En plus, les développeurs peuvent désormais générer des images seules, sans texte ni légende, ce qui ouvre la voie à une utilisation plus directe dans des projets multimédias ou marketing.
Des fonctionnalités avancées pour les créateurs
Gemini 2.5 Flash Image ne se contente pas de produire des visuels : il apporte une véritable couche d’intelligence créative. Parmi les fonctions mises en avant par Google :
- Fusion d’images pour combiner plusieurs sources visuelles de manière fluide.
- Cohérence des personnages, permettant de conserver les mêmes traits dans différentes scènes, idéal pour le storytelling visuel.
- Éditions ciblées en langage naturel, par exemple : « change la couleur de la veste en rouge » ou « ajoute un coucher de soleil en arrière-plan ».
- Exploitation des connaissances du monde pour générer des images précises et réalistes.
Cas d’usage concrets pour les développeurs
Plusieurs entreprises explorent déjà le potentiel de Gemini 2.5 Flash Image :
- Cartwheel combine le modèle avec son outil de 3D posing, garantissant un contrôle précis des personnages et une continuité narrative dans la création de scènes.
- Volley, créateur du jeu Wit’s End, l’utilise pour générer et éditer des portraits de personnages, des scènes dynamiques et des compositions multi-personnages, le tout en temps réel à partir d’entrées textuelles ou vocales.
Par ailleurs, Google met en avant des applications expérimentales comme :
- Bananimate : générer des GIF animés à partir d’images et de prompts.
- Enhance: un zoom infini créatif avec upscale des photos.
- Fit Check : un essayage virtuel pour tester des tenues grâce à l’IA.
Prix et disponibilité
Le modèle est accessible dès maintenant via :
- Google AI Studio, avec un mode « build » pensé pour créer et tester rapidement des applications IA.
- Vertex AI, destiné aux usages professionnels et aux entreprises.
Côté tarifs, Google reste aligné avec le modèle Flash 2.5 standard : 0,039 dollar par image générée et 30 dollars pour 1 million de tokens de sortie.
Un outil stratégique pour l’IA créative
Avec Gemini 2.5 Flash Image, Google fait un pas de plus vers une IA créative accessible et efficace. En élargissant les formats disponibles et en intégrant des outils d’édition intelligente, l’entreprise propose aux développeurs un modèle capable de rivaliser avec les meilleurs du marché, tout en facilitant la création d’applications interactives, artistiques ou commerciales.
Désormais disponible en production, Gemini 2.5 Flash Image ouvre la voie à une nouvelle génération d’outils créatifs basés sur l’IA, alliant puissance, cohérence et flexibilité.



