Fini les prompts interminables. L’avenir de l’édition photo par IA sera visuel, instinctif, et intégré. Qu’on soit pour ou contre les images modifiées par IA, une chose est désormais évidente : c’est la direction que prend la photographie mobile.

Google a pris une avance nette avec les outils d’édition basés sur Gemini. Mais, malgré la puissance du modèle — le dernier Nano Banana Pro, notamment, qui surclasse déjà Gemini 3 Pro Image —, il reste un irritant majeur : devoir expliquer à l’IA en texte ce qu’on veut changer.

Google le sait. Et, selon les dernières fuites, il travaille enfin sur la solution évidente.

Gemini va obtenir des « pouvoirs de gribouillage »

Une fuite de TestingCatalog dévoile ce que beaucoup attendaient depuis des mois : Google ajoute des outils d’annotation directement dans Gemini Web.

Au programme, dessiner sur une image, entourer des objets, ajouter du texte, indiquer une zone à retoucher… le tout dans la même interface que celle utilisée pour générer ou éditer les images.

Plus besoin d’exporter la photo dans une app tierce. Plus besoin d’ouvrir Google Photos ou un éditeur externe juste pour faire un cercle rouge autour d’un élément. C’est un pas de géant en ergonomie.

D’un prompt compliqué… à un geste simple

Les traces repérées dans l’app mobile allaient déjà dans ce sens, avec des fenêtres de dialogue pour lier un marquage visuel à une instruction textuelle.

Un exemple, tu entoures un élément sur la photo, tu ajoutes « enlève cet objet », « change sa couleur », « adoucit l’ombre ». Résultat, une interprétation plus précise, moins d’erreurs, et moins d’essais ratés.

Les IA d’édition souffrent encore souvent d’un défaut : elles devinent mal l’intention. Rien n’est plus clair qu’un geste visuel.

Une petite fonction qui change tout

En surface, l’ajout d’un outil d’annotation semble presque banal. Mais dans le contexte des outils IA, c’est un changement structurel. En effet, on réduit massivement la friction, on rend Gemini plus accessible aux débutants, on améliore la précision des éditions complexes (détails fins, zones qui se chevauchent, objets multiples) et on rapproche l’édition IA d’un vrai workflow pro.

Le message implicite de Google ? L’IA doit s’adapter à l’utilisateur, pas l’inverse.

Une arrivée imminente

Entre les éléments déjà présents dans le code mobile et cette nouvelle interface testée sur le web, il ne s’agit clairement plus d’une expérimentation théorique.

La fonctionnalité est en phase avancée. L’annonce officielle pourrait tomber à tout moment.

Et quand elle débarquera, Gemini pourrait devenir le premier éditeur d’images IA véritablement intuitif, où la communication avec l’algorithme ne passe plus seulement par les mots, mais aussi par des gestes.

Project Helix : Microsoft prépare une console Xbox capable de lire les jeux PC

Mastodon lance enfin son bouton de partage officiel : Ce qui change pour le Web

NotebookLM révolutionne vos notes : Générez de vrais films avec Cinematic Video Overviews

MacBook Air M5 vs MacBook Neo : Quelles différences pour votre prochain achat ?

Test du DJI ROMO P : DJI réussit-il son premier robot aspirateur haut de gamme ?

Test de NotebookLM : L’application de Google est-elle le copilot IA rêvé ?

Test Huawei MatePad 11.5 : La tablette PaperMatte, l’alliée idéale pour les étudiants et pros ?

Faut-il craquer pour la Huawei Watch GT 6 Pro ? Les premières impressions

Smalth Titanium Pro : La bague connectée avec ECG qui casse les prix

DXOMARK : Le TECNO CAMON 50 Ultra 5G surprend avec un score record pour son prix

OPPO Find X9 : L’envoi de fichiers vers iPhone via AirDrop arrive enfin en mars

OPPO Watch X3 : Titane, eSIM et le pari audacieux de la recharge USB-C

Étude Pew 2026 : Plus d’un ado sur deux utilise l’IA pour ses devoirs

Alibaba Qwen3.5 : La puissance de l’IA multimodale arrive enfin sur nos PC

Amazon Connect Health : AWS lance ses agents IA pour libérer les médecins

Xiaomi miclaw : L’agent IA qui prend les commandes de votre smartphone

Étude Pew 2026 : Plus d’un ado sur deux utilise l’IA pour ses devoirs

Alibaba Qwen3.5 : La puissance de l’IA multimodale arrive enfin sur nos PC

Amazon Connect Health : AWS lance ses agents IA pour libérer les médecins

Microsoft Office sur le MacBook Neo : L’aveu stratégique d’Apple pour conquérir le PC

Figma branche Codex d’OpenAI : quand le design et le code cessent (enfin) de se renvoyer la balle

Claude Code : Pourquoi l’édition directe de fichiers change tout pour les développeurs ?

Google Glimmer : Les futures directives de conception de design d’Android XR pour lunettes IA

GitHub Agent HQ : Invoquez Claude et Codex directement dans vos Pull Requests

Claude Code vs ChatGPT Codex : Quel agent choisir pour votre workflow en 2026 ?

Tracker du Père Noël 2025 : comment suivre le Père Noël en direct avec NORAD et Google ?

Spotify Wrapped 2025 : comment voir, partager et comprendre votre rétrospective

Pourquoi NotebookLM est un assistant personnel qui vaut son abonnement ?

Google prépare la vraie révolution : annoter directement une image pour guider Gemini

Gemini va obtenir des « pouvoirs de gribouillage »

D’un prompt compliqué… à un geste simple

Une petite fonction qui change tout

Une arrivée imminente

iPhone Air : l’échec qui refroidit toute l’industrie — et pousse les géants chinois à tout annuler

Xiaomi 17 Ultra fuite : le module photo passerait à 3 capteurs

The author Yohann Poiron

Google prépare la vraie révolution : annoter directement une image pour guider Gemini

Gemini va obtenir des « pouvoirs de gribouillage »

D’un prompt compliqué… à un geste simple

Une petite fonction qui change tout

Une arrivée imminente

The author Yohann Poiron

vous pourriez aussi aimer