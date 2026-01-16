Accueil » Gemini 3 : Google sépare enfin les quotas des modèles Thinking et Pro !

Gemini 3 : Google sépare enfin les quotas des modèles Thinking et Pro !

Google vient de corriger un irritant très concret dans Gemini : les limites d’usage ne sont plus mutualisées entre les modèles « Thinking » et « Pro ». Jusqu’ici, chaque prompt « complexe » venait grignoter la même réserve que vos demandes de code ou de maths avancées.

Désormais, chaque modèle a son quota dédié, avec des plafonds revus à la hausse pour les abonnés.

Fin du « pool partagé », place aux quotas indépendants

Au lancement de Gemini 3, Google appliquait une logique simple (mais frustrante) : Thinking et Pro tiraient dans le même stock — 100 prompts/jour pour AI Pro, 500 prompts/jour pour AI Ultra. Résultat : une session de raisonnement « long » pouvait vous priver rapidement de marge pour coder ou résoudre des problèmes plus techniques.

La nouvelle règle : quotas séparés. Vous pouvez basculer d’un modèle à l’autre sans que l’un n’épuise l’autre.

D’après la page d’assistance Google (et confirmé par 9to5Google), les limites quotidiennes deviennent :

Google AI Pro :

Thinking : jusqu’à 300 prompts/jour

Pro : jusqu’à 100 prompts/jour

Google AI Ultra :

Thinking : jusqu’à 1 500 prompts/jour

Pro : jusqu’à 500 prompts/jour

Pour le gratuit, Google reste volontairement flou : les deux modèles sont indiqués en « Basic access – daily limits may change frequently » (accès basique, limites susceptibles de changer).

Pourquoi c’est important : moins d’arbitrage mental, plus de sessions longues

Ce changement a un effet immédiat : il retire la petite gymnastique mentale du « est-ce que je crame mes derniers prompts Pro si je lance un raisonnement lourd ? ».

En clair, Thinking redevient le mode « session longue/réflexion/planification », tandis que Pro redevient le mode « maths + code » sans risque d’être sacrifié par du raisonnement exploratoire.

Derrière l’ergonomie, il y a une logique industrielle : le coût de calcul n’est pas le même selon les modèles et les modes. En séparant les quotas, Google réduit la frustration des power users (et donc les appels à l’abonnement Ultra), limite les pics de charge mal « canalisés », et rend le sélecteur de modèles plus compréhensible (Fast/Thinking / Pro).

C’est aussi un signal : Gemini 3 est sous forte demande, et Google continue d’ajuster le gratuit de manière dynamique quand la charge augmente.