fermer
Intelligence Artificielle

Google prépare la vraie révolution : annoter directement une image pour guider Gemini

Google prépare la vraie révolution : annoter directement une image pour guider Gemini
Google prépare la vraie révolution : annoter directement une image pour guider Gemini

Fini les prompts interminables. L’avenir de l’édition photo par IA sera visuel, instinctif, et intégré. Qu’on soit pour ou contre les images modifiées par IA, une chose est désormais évidente : c’est la direction que prend la photographie mobile.

Google a pris une avance nette avec les outils d’édition basés sur Gemini. Mais, malgré la puissance du modèle — le dernier Nano Banana Pro, notamment, qui surclasse déjà Gemini 3 Pro Image —, il reste un irritant majeur : devoir expliquer à l’IA en texte ce qu’on veut changer.

Google le sait. Et, selon les dernières fuites, il travaille enfin sur la solution évidente.

Gemini va obtenir des « pouvoirs de gribouillage »

Une fuite de TestingCatalog dévoile ce que beaucoup attendaient depuis des mois : Google ajoute des outils d’annotation directement dans Gemini Web.

Au programme, dessiner sur une image, entourer des objets, ajouter du texte, indiquer une zone à retoucher… le tout dans la même interface que celle utilisée pour générer ou éditer les images.

G6t8NHpXgAAWbud scaled

Plus besoin d’exporter la photo dans une app tierce. Plus besoin d’ouvrir Google Photos ou un éditeur externe juste pour faire un cercle rouge autour d’un élément. C’est un pas de géant en ergonomie.

D’un prompt compliqué… à un geste simple

Les traces repérées dans l’app mobile allaient déjà dans ce sens, avec des fenêtres de dialogue pour lier un marquage visuel à une instruction textuelle.

Un exemple, tu entoures un élément sur la photo, tu ajoutes « enlève cet objet », « change sa couleur », « adoucit l’ombre ». Résultat, une interprétation plus précise, moins d’erreurs, et moins d’essais ratés.

Les IA d’édition souffrent encore souvent d’un défaut : elles devinent mal l’intention. Rien n’est plus clair qu’un geste visuel.

Une petite fonction qui change tout

En surface, l’ajout d’un outil d’annotation semble presque banal. Mais dans le contexte des outils IA, c’est un changement structurel. En effet, on réduit massivement la friction, on rend Gemini plus accessible aux débutants, on améliore la précision des éditions complexes (détails fins, zones qui se chevauchent, objets multiples) et on rapproche l’édition IA d’un vrai workflow pro.

Le message implicite de Google ? L’IA doit s’adapter à l’utilisateur, pas l’inverse.

Une arrivée imminente

Entre les éléments déjà présents dans le code mobile et cette nouvelle interface testée sur le web, il ne s’agit clairement plus d’une expérimentation théorique.

La fonctionnalité est en phase avancée. L’annonce officielle pourrait tomber à tout moment.

Et quand elle débarquera, Gemini pourrait devenir le premier éditeur d’images IA véritablement intuitif, où la communication avec l’algorithme ne passe plus seulement par les mots, mais aussi par des gestes.

 

Tags : GeminiGoogle
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.