Google dévoile Gemini 3 : un modèle frontier agentique, multimodal et plus puissant que jamais

Après des semaines de rumeurs, de leaks, Google dévoile officiellement Gemini 3. Une famille de modèles fermés, pensée comme l’itération la plus ambitieuse de Google depuis l’introduction de Gemini en 2023. Au programme : un moteur multimodal profondément réinventé, des capacités d’agents beaucoup plus avancées et une intégration totale dans l’écosystème Google.

Une sortie d’envergure : Gemini 3 débarque partout, d’un seul coup

Contrairement aux lancements fragmentés précédents, Gemini 3 arrive simultanément dans Google Search (AI Mode), l’app Gemini, Google AI Studio, Vertex AI, Gemini CLI, et même Antigravity, le tout nouvel environnement agent-first de Google.

Le groupe évoque son déploiement le plus coordonné à ce jour, rendu possible par un contrôle intégral de la chaîne : TPU maison, data centers, produits grand public et outils développeurs.

Avec 650 millions d’utilisateurs actifs mensuels sur l’app Gemini et 2 milliards interagissant avec les AI Overviews de Search, Google mise sur une diffusion massive dès le jour J.

Un virage vers l’IA agentique

Au cœur de Gemini 3 : une philosophie nouvelle. Google ne veut plus seulement générer du texte ou interpréter des images ; il s’agit désormais de planifier, naviguer, exécuter, et coordonner des outils dans un environnement logiciel complet.

Gemini 3 se décline en plusieurs versions :

Gemini 3 Pro, le modèle phare

Gemini 3 Deep Think, mode raisonnement intensif

Des modèles d’interface générative (Visual Layout, Dynamic View)

Gemini Agent, capable d’orchestrer des workflows complexes

Le moteur Gemini 3 intégré à Antigravity, destiné aux développeurs

L’ambition est limpide : transformer l’assistant conversationnel en véritable opérateur numérique, capable d’agir.

Gemini 3 Pro : des gains spectaculaires sur le raisonnement, le code et la multimodalité

Les benchmarks fournis par Google sont impressionnants. Gemini 3 Pro surclasse Gemini 2.5 Pro sur quasiment tous les axes :

Raisonnement : premier au leaderboard LMArena avec un Elo préliminaire de 1501, devant Grok-4.1-thinking, Grok-4.1 et Claude Sonnet/Opus.

Mathématiques : 95 % sur AIME 2025 sans outils, 100 % avec code execution,

Vision & vidéo : +13 points sur MMMU-Pro, progression spectaculaire sur ScreenSpot-Pro (11 % → 72,7 %).

Code & outils : LiveCodeBench Pro (+664 points), SWE-Bench Verified (59.6% → 76.2%).

Long contexte : 26,3 % à 1M tokens, une progression majeure pour les tâches à forte latence.

Planification : Vending-Bench x10 par rapport au modèle précédent.

Dans les faits, Gemini 3 devient un modèle capable de réflexions longues, de navigation écran et d’un usage stable des outils — trois défis historiques des modèles IA.

Interfaces génératives : Google veut dépasser le texte

Gemini 3 inaugure les Visual Layouts et Dynamic Views, des interfaces générées en temps réel :

pages magazine,

simulateurs interactifs,

graphiques,

modules UI complets.

Dans Google Search, l’expérience devient plus visuelle et immersive : simulations, tableaux, galeries, outils interactifs intégrés directement dans la réponse.

Google présente cela comme un pas de plus vers un moteur de recherche où l’IA n’explique pas seulement, elle construit.

Gemini Agent : l’IA qui fait, pas seulement qui répond

Disponible d’abord pour les abonnés AI Ultra, Gemini Agent permet de trier une boîte mail, rédiger des réponses, planifier un voyage, préparer des documents, naviguer sur le Web, orchestrer des tâches multi-étapes.

Le tout avec validation utilisateur — un compromis entre automatisation et contrôlabilité.

Antigravity: l’environnement de développement qui réunit IA, code et navigation

Google introduit aussi Antigravity, une sorte de super-IDE agentique où Gemini 3 peut écrire du code, prototyper des interfaces, tester, exécuter, corriger, manipuler l’UI du navigateur, générer reports et outils internes.

Le modèle peut même interpréter des mouvements de souris, des annotations visuelles et des maquettes multi-fenêtres pour orienter son action. Une vraie percée pour le « computer use » automatisé.

API : un positionnement tarifaire ambitieux

Gemini 3 Pro est proposé à :

2 dollars/M tokens input

12 dollars/M tokens output

Jusqu’à 200k tokens,

avec un tarif quasi doublé au-delà.

Face aux alternatives chinoises (Qwen, ERNIE), beaucoup moins chères, Google se positionne dans la tranche haute — un pari risqué pour l’adoption startup, mais assumé pour un modèle présenté comme premium.

Une hype rarement vue pour un modèle Google

Un tacle à peine voilé envers OpenAI

Google ne cache pas sa confiance : Gemini 3 Pro serait « plus direct, plus pertinent et moins flatteur » — une référence transparente aux corrections récentes apportées à ChatGPT pour réduire sa sycophantie.

La société affirme également offrir des réponses « plus factuelles » et « plus utiles », un terrain sur lequel OpenAI a vacillé avec le lancement complexe de GPT-5.

Une avancée stratégique pour Google

Avec Gemini 3, Google veut prouver trois choses :

Son hardware (TPU) est prêt pour l’IA frontier Ses modèles sont à nouveau compétitifs Son écosystème grand public peut servir de rampe de lancement massive

Au-delà des benchmarks, l’entreprise mise sur le fait que l’IA utile, déployée dans Search, Android, Workspace et Gemini, prime sur la course brute à la puissance.