ChatGPT permet désormais d’envoyer des emails directement depuis le web

par Yohann Poiron le 8 juin 2026

OpenAI veut faire de ChatGPT un véritable espace de travail, pas seulement un assistant de rédaction. Avec une nouvelle fonction intégrée aux blocs d’écriture, il devient possible de rédiger, modifier et envoyer un email sans quitter la conversation.

Jusqu’ici, l’utilisateur devait souvent rédiger son message dans ChatGPT, puis le copier dans Gmail, Outlook ou un autre client mail. Cette étape intermédiaire disparaît désormais sur la version web.

Les blocs d’écriture deviennent plus utiles

Les blocs d’écriture affichent les textes générés dans un espace séparé, plus proche d’un éditeur que d’une simple réponse de chatbot. Pour un email, l’utilisateur peut modifier directement le contenu, sélectionner une phrase, demander une reformulation, accepter ou refuser des suggestions, puis finaliser le message dans le même bloc.

La nouveauté ajoute l’étape décisive : l’envoi.

Draft it. Tweak it. Send it.

You can now send emails directly from writing blocks in ChatGPT on the web, without leaving the conversation. pic.twitter.com/GoQtlSFGFG

— ChatGPT (@ChatGPTapp) June 5, 2026

Un gain de temps pour les usages professionnels

Cette fonction renforce l’ambition de ChatGPT dans la productivité quotidienne. Rédaction de mails, feuilles de calcul, documents, analyse de données : OpenAI cherche à rapprocher son assistant des outils bureautiques classiques.

L’objectif est clair : réduire les allers-retours entre applications et transformer ChatGPT en interface centrale de travail. Cette avancée soulève toutefois une prudence évidente. Envoyer un email depuis ChatGPT implique de confier davantage de données personnelles ou professionnelles à la plateforme.

Pour les messages sensibles, confidentiels ou juridiques, mieux vaut conserver une approche mesurée et vérifier précisément les paramètres de confidentialité avant d’adopter cette fonction au quotidien.

ChatGPT devient un outil d’action

Avec l’envoi d’emails, ChatGPT franchit une nouvelle étape. Il ne se contente plus de proposer du texte : il commence à exécuter directement des tâches.

C’est une évolution discrète, mais importante. Car l’avenir des assistants IA ne se jouera pas seulement sur la qualité de leurs réponses, mais sur leur capacité à transformer une intention en action concrète.

Lire plus

Intelligence Artificielle

Qu’est-ce que Perplexity AI ? Le moteur de recherche IA qui cite ses sources (2026)

par Yohann Poiron le 8 juin 2026

Qu'est-ce que Perplexity, le moteur de recherche IA à connaître ?

Perplexity AI est une entreprise américaine, fondée en 2022, qui a popularisé une nouvelle façon de chercher sur le web : un moteur de recherche dopé à l’IA qui interroge le web en temps réel et cite systématiquement ses sources.

En 2026, Perplexity ne se limite plus à la recherche : avec le navigateur Comet devenu gratuit et l’agent Perplexity Computer, l’entreprise se transforme en plateforme de productivité et d’agents IA.

Qu’est-ce que Perplexity AI ?

Perplexity n’est pas un chatbot comme ChatGPT : c’est avant tout un outil de recherche. À chaque question, il interroge le web en temps réel, compile les résultats et génère une réponse synthétique. Chaque affirmation est accompagnée d’un numéro de source cliquable, permettant de vérifier l’information — un atout majeur pour la veille, la recherche documentaire et le fact-checking.

La plateforme a dépassé les 100 millions d’utilisateurs actifs mensuels et poursuit sa croissance rapide en 2026, portée par le lancement de nouvelles fonctionnalités comme le navigateur Comet, l’agent Computer et le tier Max.

Une particularité de Perplexity : il ne dépend pas d’un seul modèle, mais donne accès aux meilleurs modèles tiers selon l’abonnement (GPT, Claude, Gemini), en plus de ses propres modèles Sonar optimisés pour la recherche web.

Sur quelles plateformes ?

Perplexity est disponible sur :

Le Web : perplexity.ai
iOS et Android
Extensions de navigateur (Chrome, Edge, Safari)
Intégration API (pour développeurs, outils d’entreprise)

Les fonctionnalités clés de Perplexity en 2026

Deep Research

Le mode Deep Research effectue une recherche approfondie multi-sources, puis compile et synthétise automatiquement les résultats pour produire des rapports complets. Depuis une mise à jour de 2026, Deep Research peut générer directement des livrables — présentations, feuilles de calcul, tableaux de bord et sites web — à partir d’une simple demande, sans avoir à copier-coller les résultats dans d’autres outils.

Labs

Labs permet de créer des tableaux de bord, feuilles de calcul, présentations, rapports et applications web simples directement depuis l’interface.

Model Council

Réservé au tier Max, Model Council exécute votre requête simultanément sur plusieurs modèles frontières (par exemple GPT, Claude Opus et Gemini), puis synthétise une réponse en montrant les points d’accord et de divergence. C’est un outil précieux pour les décisions à fort enjeu, où l’on veut confronter une conclusion à plusieurs angles.

Finance et autres modes spécialisés

Perplexity propose des modes spécialisés, comme un mode Finance enrichi en 2026 avec les notes d’analystes, des liens directs vers les documents réglementaires (filings SEC) et des graphiques boursiers en temps réel avec synthèse d’actualité.

Comet : le navigateur IA de Perplexity

Comet est le navigateur web de Perplexity, conçu comme un « partenaire de pensée » pendant la navigation. Il analyse le contenu des pages visitées et répond aux questions en contexte, résume, compare, et peut automatiser certaines tâches grâce à son assistant intégré (navigation agentique).

Changement majeur en 2026 : Comet est devenu gratuit en mars 2026. Lancé à l’été 2025 comme un abonnement réservé au tier Max à 200 dollars/mois, le navigateur a vu son paywall supprimé et est désormais disponible gratuitement sur iOS, Android, Windows et Mac. La version gratuite conserve les fonctionnalités phares : recherche agentique, résumé de pages, mode vocal, assistance au shopping et Deep Research directement dans le navigateur. Un module optionnel, Comet Plus (environ 5 $/mois, inclus pour les abonnés Pro et Max), donne accès à du contenu d’éditeurs premium dans les réponses.

Perplexity Computer : l’agent qui exécute vos projets

Lancé en février 2026, Perplexity Computer est un agent IA basé sur le cloud qui orchestre jusqu’à 19 modèles différents pour exécuter des workflows complexes et en plusieurs étapes de manière autonome. On passe d’un modèle « question → réponse » à un modèle « objectif → exécution continue » : Computer peut faire de la recherche web approfondie, rédiger et éditer des documents, analyser des données, appeler des API ou écrire et tester du code.

Les workflows sont asynchrones (plusieurs projets en parallèle) et chaque tâche tourne dans un environnement isolé (sandbox), ce qui limite les risques : un échec reste contenu et ne peut pas atteindre les fichiers locaux de l’utilisateur. Perplexity propose aussi une déclinaison capable d’agir sur un ordinateur (notamment Mac), pilotable à distance.

Tarifs et accès en 2026

Gratuit : recherches de base illimitées avec réponses sourcées, quelques recherches Pro et Deep Research par jour, navigateur Comet gratuit.
Pro (environ 20 $/mois) : recherches Pro illimitées, accès aux modèles frontières, Deep Research étendu, Labs, Comet Plus inclus.
Max (environ 200 $/mois) : Model Council, Perplexity Computer (système de crédits), génération vidéo et image avancée, Labs illimité, accès prioritaire aux nouveautés.
Education : tarif réduit pour les étudiants vérifiés.
Enterprise : à partir d’environ 40 $/utilisateur/mois, avec des fonctionnalités d’équipe et de gouvernance.
API Sonar : facturée à l’usage, pour les développeurs.

Limites et points de vigilance

Sécurité des agents : les navigateurs IA agentiques comme Comet sont exposés aux attaques par injection indirecte de prompt, où un site malveillant glisse des instructions cachées dans une page. Des correctifs ont été déployés, mais la vigilance reste de mise sur les tâches sensibles.
Conformité réglementaire : les obligations européennes sur l’IA à usage général entrent en vigueur courant 2026 ; pour des usages réglementés en Europe, il convient de vérifier la conformité avant déploiement.
Hallucinations : bien que Perplexity cite ses sources, il peut mal interpréter ou synthétiser une information ; vérifier les sources reste indispensable.

Perplexity face à ses concurrents

Perplexity occupe une position particulière : il n’est pas un assistant généraliste mais un moteur de recherche et de synthèse.

Gemini / Google Search : Perplexity se distingue par la qualité de ses synthèses sourcées et l’absence de publicité ; Google reste supérieur sur les recherches locales et de marque.
ChatGPT et Claude : plutôt complémentaires — Perplexity pour la recherche et la vérification, ChatGPT ou Claude pour la création et le code.

Le verdict 2026 est souvent celui de la complémentarité : Perplexity pour chercher et vérifier, les assistants généralistes pour créer.

FAQ : tout ce que vous voulez savoir sur Perplexity AI

Qu’est-ce que Perplexity AI ?

Perplexity est un moteur de recherche dopé à l’IA qui interroge le web en temps réel et génère des réponses synthétiques en citant ses sources. En 2026, il s’est élargi avec le navigateur Comet et l’agent Perplexity Computer, devenant une véritable plateforme de productivité.

Perplexity est-il gratuit ?

Oui, une version gratuite offre des recherches de base illimitées avec réponses sourcées et quelques recherches Pro/Deep Research par jour. Le navigateur Comet est lui aussi gratuit depuis mars 2026. Les fonctionnalités avancées nécessitent un abonnement Pro (environ 20 $/mois) ou Max (environ 200 $/mois).

Quelle est la différence entre Perplexity et ChatGPT ?

ChatGPT est un assistant généraliste qui génère du contenu à partir de ses connaissances. Perplexity est avant tout un moteur de recherche qui interroge le web en temps réel et cite ses sources. Les deux sont complémentaires : Perplexity pour chercher et vérifier, ChatGPT pour créer.

Qu’est-ce que le navigateur Comet ?

Comet est le navigateur web de Perplexity, avec un assistant IA intégré capable de résumer, comparer et automatiser des tâches pendant la navigation. Devenu gratuit en mars 2026, il est disponible sur iOS, Android, Windows et Mac.

Qu’est-ce que Perplexity Computer ?

Lancé en février 2026, Perplexity Computer est un agent IA cloud qui orchestre jusqu’à 19 modèles pour exécuter des workflows complexes de manière autonome (recherche, rédaction, analyse de données, code), dans un environnement isolé. Il est inclus dans l’abonnement Max via un système de crédits.

Perplexity est-il fiable ?

Perplexity cite ses sources, ce qui facilite la vérification, mais il peut mal interpréter une information ou synthétiser des sources de qualité inégale. Pour les usages agentiques (Comet, Computer), des questions de sécurité (injection de prompt) appellent à la prudence sur les tâches sensibles.

Conclusion

En 2026, Perplexity AI a dépassé son statut de moteur de recherche pour devenir un écosystème complet : recherche sourcée, navigateur Comet gratuit, agent Computer et accès aux meilleurs modèles du marché. Sa force reste la recherche : interroger le web en temps réel et citer ses sources, là où les assistants généralistes répondent depuis leurs connaissances. Pour la veille, le fact-checking et la recherche documentaire, c’est aujourd’hui l’un des outils les plus pertinents — à condition de garder un œil critique sur les sources et la sécurité.

Lire plus

Intelligence Artificielle

Qu’est-ce que Mistral AI ? Le champion européen de l’IA en 2026

par Yohann Poiron le 8 juin 2026

Mistral AI est la startup française d’intelligence artificielle fondée en 2023 par Arthur Mensch, Guillaume Lample et Timothée Lacroix, d’anciens chercheurs de DeepMind et Meta. En 2026, elle s’est imposée comme le champion européen de l’IA, avec une stratégie singulière : des modèles open source, une souveraineté numérique européenne assumée, et un positionnement orienté entreprises. Avec la levée de fonds menée par ASML, Mistral est devenue la première licorne européenne de l’IA.

Qu’est-ce que Mistral AI ?

Mistral AI développe des modèles de langage selon une approche hybride : des modèles open source sous licence permissive pour la communauté des développeurs, et des modèles propriétaires de pointe pour les entreprises. Son chatbot grand public, Le Chat, est accessible gratuitement sur le web et en application mobile.

L’entreprise se distingue par ses engagements en matière de souveraineté : ses données sont hébergées en Europe, ses modèles respectent le RGPD, et elle construit sa propre infrastructure de calcul sur le continent. C’est un argument de poids pour les organisations européennes soucieuses d’éviter la dépendance aux services cloud américains ou chinois.

Les modèles Mistral en 2026

Mistral Medium 3.5, le modèle phare (avril 2026)

Annoncé en avril 2026, Mistral Medium 3.5 est le nouveau modèle par défaut de Mistral. Sa particularité : il fusionne dans une seule architecture ce qui était auparavant réparti entre plusieurs modèles (chat, raisonnement, code). Doté de 128 milliards de paramètres, il propose un effort de raisonnement réglable par requête et une fenêtre de contexte allant jusqu’à 256 000 tokens. Ses poids sont publiés en open source sous une licence MIT modifiée, et il peut être auto-hébergé sur un nombre limité de GPU.

Mistral 3, la gamme open source la plus complète (fin 2025)

Fin 2025, Mistral a lancé Mistral 3, une suite particulièrement ambitieuse de modèles open source couvrant tous les usages, du smartphone au cloud massif. La philosophie de Mistral est claire : dans la majorité des cas, un petit modèle spécialisé et fine-tuné fait mieux qu’un gros modèle généraliste. Cette gamme inclut notamment Mistral Large 3 (architecture sparse Mixture-of-Experts) et les modèles Ministral 3 (3B, 8B, 14B), capables de tourner sur un seul GPU, un laptop, un robot ou une voiture, sans connexion au cloud.

Une gamme spécialisée

Au-delà des modèles généralistes, Mistral propose une famille d’outils spécialisés :

Codestral et Devstral : modèles dédiés au code, accompagnés de Mistral Vibe, l’assistant de développement.
Magistral : modèle de raisonnement utilisant la chaîne de pensée pour les problèmes complexes.
Voxtral : modèles audio (transcription et synthèse vocale), rivalisant avec Whisper.
Mistral OCR : extraction de texte depuis images et PDF scannés.
Pixtral : modèle multimodal pour l’analyse d’images.

Le Chat (Vibe) : l’assistant grand public

Le Chat est le chatbot de Mistral, analogue à ChatGPT, Gemini ou Claude. Lancé en février 2024, il a connu de nombreuses évolutions et a été renommé Vibe à partir de fin mai 2026. Il permet de choisir entre différents modèles selon l’usage et propose en 2026 :

Flash Answers : réponses ultra-rapides, parmi les plus véloces du marché.
Deep Research : compilation et synthèse web sourcées en temps réel.
OCR intégré : extraction de texte depuis images et PDF.
Interpréteur de code Python : exécution directe dans l’interface.
Génération d’images : via un partenariat avec Black Forest Labs (Flux).
Interaction vocale : dialogue oral avec l’assistant.
Agents et connecteurs : création d’assistants personnalisés et intégration avec des outils professionnels.
Mémoire étendue : Le Chat mémorise vos préférences et le contexte entre les sessions.

Work Mode et agents distants (2026)

En 2026, Mistral a doté Le Chat d’un Work Mode, propulsé par Medium 3.5, pour exécuter des workflows en plusieurs étapes à travers plusieurs outils connectés (e-mails, calendriers), avec validation explicite de l’utilisateur avant toute action sensible. En parallèle, l’outil de développement Mistral Vibe a gagné des agents de code distants (cloud), capables de traiter des tâches comme des corrections de bugs de manière autonome, en parallèle.

Mistral AI Studio et la plateforme entreprise

Pour les entreprises, Mistral propose Mistral AI Studio, une plateforme web permettant de concevoir, observer et industrialiser des applications et des agents IA. Elle succède à « La Plateforme » et met l’accent sur l’observabilité, la gouvernance et le déploiement (cloud, on-premise ou auto-hébergé).

Tarifs et accès en 2026

Gratuit : accès à Le Chat (Vibe) avec un modèle de base et la recherche web.
Pro (environ 15 €/mois) : accès aux modèles avancés, Deep Research, génération d’images, projets, Work Mode et agents distants.
Team (environ 25 €/mois par utilisateur) : fonctionnalités collaboratives.
Enterprise : déploiement on-premise, résidence des données en Europe, gouvernance et conformité, tarif sur devis.
API : facturée à l’usage. Mistral met en avant un coût nettement inférieur à celui des modèles haut de gamme américains pour des performances proches.

Souveraineté, financement et infrastructure

Mistral incarne l’ambition européenne en matière d’IA. La startup a levé d’importants financements, dont une levée menée par ASML qui l’a valorisée autour de 10 à 14 milliards d’euros. Elle investit dans ses propres data centers en Europe (notamment en région parisienne) pour réduire sa dépendance aux infrastructures étrangères. Son modèle économique repose sur l’API, les abonnements Le Chat et les contrats entreprise, avec une majorité de revenus réalisés en Europe.

Limites et points de vigilance

Échelle grand public : Mistral reste moins connu du grand public que ChatGPT ou Gemini ; son avantage est l’efficacité et la souveraineté, pas la notoriété de masse.
Performances frontières : ses modèles sont compétitifs mais restent généralement quelques points derrière les meilleurs modèles fermés sur certains benchmarks — à un coût bien inférieur.
Hallucinations : comme tout LLM, Le Chat peut produire des informations inexactes ; la vérification reste nécessaire.

Mistral face à ses concurrents

ChatGPT (OpenAI) : la référence grand public, mais sans l’argument de souveraineté européenne.
Gemini (Google) : intégration profonde à l’écosystème Google.
Claude (Anthropic) : référence sur le code complexe et la sécurité.
DeepSeek : autre acteur open source, mais hébergé en Chine.

L’argument différenciant de Mistral est clair : une IA performante, ouverte, hébergée en Europe et conforme au RGPD — un positionnement unique pour les organisations soucieuses de souveraineté.

FAQ : tout ce que vous voulez savoir sur Mistral AI

Qu’est-ce que Mistral AI ?

Mistral AI est une startup française d’IA fondée en 2023, championne européenne de l’IA open source. Elle développe des modèles de langage (open source et propriétaires) et le chatbot Le Chat, renommé Vibe en 2026, avec un fort accent sur la souveraineté européenne et le RGPD.

Le Chat est-il gratuit ?

Oui, Le Chat (Vibe) est accessible gratuitement sur le web et en application mobile avec un modèle de base. Les fonctionnalités avancées (Deep Research, génération d’images, Work Mode, agents) nécessitent un abonnement Pro (environ 15 €/mois) ou supérieur.

Quel est le dernier modèle de Mistral ?

À la date de publication, le modèle phare est Mistral Medium 3.5 (avril 2026), qui fusionne chat, raisonnement et code dans une seule architecture de 128 milliards de paramètres, avec un raisonnement réglable et un contexte jusqu’à 256 000 tokens.

Mistral AI est-il vraiment open source ?

En partie. Mistral suit une approche hybride : de nombreux modèles sont publiés en open source (licences Apache 2.0 ou MIT modifiée), tandis que certains modèles propriétaires de pointe sont réservés à l’API et aux offres entreprise.

Mistral respecte-t-il la confidentialité des données ?

Oui, c’est l’un de ses principaux arguments. Les données sont hébergées en Europe, les modèles respectent le RGPD, et l’entreprise construit ses propres data centers sur le continent. Les offres Enterprise permettent un déploiement on-premise.

Qu’est-ce que Mistral Vibe ?

Mistral Vibe est l’outil de développement de Mistral (agent de code), et c’est aussi le nouveau nom donné au chatbot Le Chat à partir de fin mai 2026. Vibe propose désormais des agents de code distants, exécutés dans le cloud, pour traiter des tâches de développement de manière autonome.

Conclusion

En 2026, Mistral AI prouve qu’une alternative européenne crédible aux géants américains et chinois est possible. Avec Mistral 3, Medium 3.5 et Le Chat (Vibe), la startup parisienne mise sur l’open source, l’efficacité et la souveraineté plutôt que sur la course au modèle le plus gros. Pour les entreprises et les développeurs européens attachés au contrôle de leurs données, c’est aujourd’hui un acteur de premier plan.

Lire plus

Intelligence Artificielle

Qu’est-ce que DeepSeek ? L’IA chinoise open source qui défie OpenAI (2026)

par Yohann Poiron le 8 juin 2026

DeepSeek est une startup d’intelligence artificielle basée à Hangzhou, en Chine, devenue mondialement connue début 2025 lorsque son modèle de raisonnement R1 a provoqué une onde de choc sur les marchés. En 2026, DeepSeek confirme sa stratégie : proposer des modèles open source de niveau quasi frontière, à une fraction du prix des solutions américaines. Avec DeepSeek V4, lancé en avril 2026, la startup franchit une nouvelle étape.

Qu’est-ce que DeepSeek ?

DeepSeek est à la fois une entreprise, une famille de modèles de langage et une application de chat accessible gratuitement. Sa particularité tient à deux choix structurants : l’open source (les poids des modèles sont téléchargeables et auto-hébergeables) et un rapport performance/prix agressif, rendu possible par une architecture Mixture-of-Experts (MoE) très optimisée.

L’application DeepSeek est utilisable gratuitement et sans limite de requêtes via le site officiel (chat.deepseek.com) ou les applications mobiles. Les développeurs peuvent aussi accéder aux modèles via l’API DeepSeek, sur des plateformes comme OpenRouter, ou en auto-hébergement depuis Hugging Face.

De R1 à V4 : l’évolution des modèles DeepSeek

R1, le modèle qui a fait trembler les marchés (2025)

En janvier 2025, le lancement du modèle de raisonnement R1 a provoqué une chute boursière historique pour Nvidia — environ 600 milliards de dollars de capitalisation effacés en une seule journée. La raison : DeepSeek démontrait qu’on pouvait atteindre des performances de pointe avec des coûts d’entraînement bien inférieurs à ceux des laboratoires américains.

V3 et V3.1, la consolidation (2025)

Avec DeepSeek V3.1 (685 milliards de paramètres), publié à l’été 2025, la startup a unifié ses lignes de produits et impressionné par des scores élevés sur les benchmarks de code, à un coût des dizaines de fois inférieur à celui de ses concurrents fermés.

DeepSeek V4, la nouvelle génération (avril 2026)

Après des mois de rumeurs, DeepSeek V4 a été lancé en preview le 24 avril 2026, sous licence ouverte (MIT) sur Hugging Face. Il se décline en deux variantes :

DeepSeek V4-Pro : le modèle phare, une architecture MoE de 1,6 trillion de paramètres (49 milliards activés par token), orienté performance maximale en code et en raisonnement.
DeepSeek V4-Flash : une version plus légère (284 milliards de paramètres), optimisée pour la vitesse et les coûts.

Les deux modèles offrent une fenêtre de contexte d’un million de tokens par défaut, grâce à une nouvelle architecture d’attention hybride (DeepSeek Sparse Attention). Fait notable : V4 intègre un mode de raisonnement optionnel qui couvre les usages auparavant dévolus à R1. La ligne R1 est ainsi progressivement remplacée par V4.

Sur les benchmarks, V4-Pro se rapproche des meilleurs modèles fermés : il revendique environ 80,6 % sur SWE-bench Verified, plaçant le modèle dans la même zone que Gemini 3.1 Pro et les dernières générations d’OpenAI et d’Anthropic. DeepSeek reconnaît toutefois lui-même un retard de 3 à 6 mois sur les modèles propriétaires — une transparence rare dans le secteur.

Des prix cassés : l’arme stratégique de DeepSeek

Le positionnement tarifaire reste l’atout numéro un de DeepSeek. En mai 2026, la startup a rendu permanente une baisse de 75 % du prix de V4-Pro. Les tarifs de l’API se situent désormais autour de :

V4-Pro : environ 0,44 $ par million de tokens en entrée et 0,87 $ en sortie.
V4-Flash : environ 0,14 $ / 0,28 $ par million de tokens.

À titre de comparaison, ces tarifs rendent V4-Pro plusieurs dizaines de fois moins cher que les modèles haut de gamme d’OpenAI ou d’Anthropic à l’usage. DeepSeek envoie ainsi un message clair au marché : les modèles puissants doivent devenir beaucoup moins chers à exploiter. L’attention se porte aussi sur l’usage de puces chinoises (Huawei Ascend) pour faire tourner V4-Pro, signe d’une volonté d’indépendance vis-à-vis de l’écosystème Nvidia.

Comment accéder à DeepSeek ?

Interface web et mobile gratuite : chat.deepseek.com et applications iOS/Android, sans limite de requêtes.
API : tarifs très bas, idéale pour les développeurs et les applications à fort volume.
Auto-hébergement : téléchargement gratuit des poids sur Hugging Face, sous licence MIT. Le modèle complet nécessite une infrastructure serveur, mais des versions allégées sont envisageables sur du matériel plus accessible.

Limites et points de vigilance

Confidentialité et hébergement : l’application grand public traite les données sur des serveurs en Chine, ce qui peut poser problème pour des usages soumis à des contraintes réglementaires (RGPD, données sensibles). L’auto-hébergement reste l’option recommandée pour ces cas.
Censure et biais : comme d’autres modèles chinois, DeepSeek peut éviter ou orienter certaines réponses sur des sujets politiquement sensibles.
Statut « preview » : V4 est encore étiqueté preview ; son comportement peut évoluer avant la version finale. Pour un usage en production, il est conseillé de figer la version et de prévoir une phase de re-validation.
Hallucinations : comme tous les LLM, DeepSeek peut produire des informations inexactes ; la vérification reste nécessaire.

DeepSeek face à ses concurrents

Le marché des IA est désormais mature et concurrentiel :

ChatGPT (OpenAI) : la référence grand public, mais à un coût d’API bien supérieur.
Gemini (Google) : intégration profonde à l’écosystème Google.
Claude (Anthropic) : référence sur le code complexe et la sécurité.

L’argument de DeepSeek n’est pas d’être le meilleur en absolu, mais d’offrir le meilleur rapport performance/prix en open source. Pour les développeurs, chercheurs et entreprises non soumis à des contraintes de confidentialité strictes, c’est aujourd’hui l’une des options les plus économiques du marché.

FAQ : tout ce que vous voulez savoir sur DeepSeek

Qu’est-ce que DeepSeek ?

DeepSeek est une startup chinoise d’IA basée à Hangzhou, et la famille de modèles de langage open source qu’elle développe. Connue pour son modèle R1 en 2025, elle propose en 2026 la génération V4 (V4-Pro et V4-Flash), avec un rapport performance/prix très agressif.

DeepSeek est-il gratuit ?

Oui. L’application web et mobile est utilisable gratuitement et sans limite de requêtes. Les poids des modèles sont téléchargeables gratuitement sur Hugging Face. Seule l’API, destinée aux développeurs, est payante — mais à des tarifs très bas.

Quel est le dernier modèle de DeepSeek ?

À la date de publication, le modèle le plus récent est DeepSeek V4, lancé en preview le 24 avril 2026, décliné en V4-Pro (performance maximale) et V4-Flash (vitesse et coûts). V4 remplace progressivement la ligne de raisonnement R1.

DeepSeek est-il vraiment open source ?

Oui, les poids de DeepSeek V4 sont publiés sous licence MIT sur Hugging Face, ce qui permet de les télécharger, les modifier et les auto-héberger. C’est un positionnement frontal face aux stratégies fermées d’OpenAI et de Google.

DeepSeek est-il fiable pour les données sensibles ?

L’application grand public traite les données sur des serveurs en Chine, ce qui peut poser problème pour des usages réglementés (RGPD, données confidentielles). Pour ces cas, l’auto-hébergement des modèles open source est l’option recommandée.

Pourquoi DeepSeek est-il si peu cher ?

Grâce à une architecture Mixture-of-Experts très optimisée et à l’usage de puces chinoises (Huawei Ascend). En mai 2026, DeepSeek a rendu permanente une baisse de 75 % du prix de V4-Pro, le rendant plusieurs dizaines de fois moins cher que les modèles haut de gamme américains à l’usage.

Conclusion

En 2026, DeepSeek incarne une voie alternative dans la course à l’IA : celle de l’open source performant et abordable. Avec DeepSeek V4, la startup ne cherche pas à battre les modèles fermés sur tous les terrains, mais à rendre l’IA avancée beaucoup moins chère et plus accessible. Pour les développeurs et les entreprises soucieuses de leurs coûts, c’est un acteur impossible à ignorer — à condition de bien gérer la question de la confidentialité.

Lire plus

Intelligence Artificielle

OpenAI veut transformer ChatGPT en « super app » : la fin du simple chatbot approche

par Yohann Poiron le 8 juin 2026

ChatGPT pourrait bientôt devenir bien plus qu’un assistant conversationnel. Selon plusieurs informations récentes, OpenAI prépare une transformation majeure de sa plateforme afin d’en faire un véritable système d’exploitation personnel basé sur des agents d’intelligence artificielle.

L’objectif est ambitieux : passer d’un chatbot capable de répondre à des questions à un assistant intelligent capable d’agir, d’organiser et d’exécuter des tâches dans la vie quotidienne comme dans le monde professionnel.

Si cette vision se concrétise, elle pourrait redéfinir la manière dont nous utilisons les logiciels au cours de la prochaine décennie.

OpenAI mise désormais sur les agents IA

Selon le Financial Times, la direction d’OpenAI considère que l’avenir de l’intelligence artificielle ne repose plus uniquement sur les conversations. La prochaine étape consiste à créer des agents capables d’agir directement au nom des utilisateurs.

Ces systèmes pourraient gérer un agenda, réserver des voyages, organiser des réunions, rédiger du contenu, développer du code, automatiser des tâches complexes, et coordonner plusieurs services numériques.

L’idée est de faire de ChatGPT un assistant permanent, capable de comprendre les besoins de l’utilisateur et d’intervenir de manière proactive.

ChatGPT veut devenir la nouvelle interface informatique

Cette évolution traduit un changement stratégique profond. Depuis l’arrivée des smartphones, notre interaction avec la technologie repose principalement sur des applications distinctes. Chaque besoin implique l’ouverture d’un logiciel spécifique.

Au lieu de naviguer entre plusieurs applications, l’utilisateur pourrait simplement dialoguer avec un assistant capable d’orchestrer toutes ces actions en arrière-plan.

Dans cette vision, ChatGPT deviendrait une couche d’intelligence située au-dessus des applications elles-mêmes.

Codex joue un rôle central dans cette stratégie

L’un des moteurs de cette transformation est Codex. La plateforme dédiée au développement logiciel connaît une forte croissance et démontre le potentiel économique des agents spécialisés.

Pour OpenAI, les outils capables d’écrire du code, d’automatiser des tâches ou d’exécuter des workflows complexes pourraient représenter une opportunité bien plus importante que les simples conversations textuelles.

Cette approche rapproche progressivement ChatGPT d’un véritable collaborateur numérique.

Une intégration plus profonde avec les services tiers

Pour devenir une super app, ChatGPT devra également s’ouvrir davantage aux autres plateformes. Plusieurs partenaires seraient déjà au cœur de cette stratégie.

Des services comme Canva ou Booking.com pourraient bénéficier d’intégrations plus poussées, permettant à l’assistant de créer, réserver ou organiser directement certaines actions sans quitter l’interface.

Cette logique rappelle les super apps asiatiques comme WeChat, qui regroupent de multiples services au sein d’une même expérience utilisateur.

La pression concurrentielle accélère la transformation

Cette évolution intervient alors que la concurrence s’intensifie. OpenAI doit désormais faire face à des rivaux particulièrement agressifs :

Le marché évolue rapidement d’une bataille des modèles vers une bataille des usages. La question n’est plus seulement de savoir quelle IA répond le mieux, mais laquelle devient indispensable au quotidien.

L’entreprise se tourne de plus en plus vers les professionnels

Cette transformation est également motivée par des enjeux financiers. Les produits destinés aux entreprises représentent une part croissante des revenus d’OpenAI.

Les agents capables d’automatiser des tâches professionnelles, de développer du logiciel ou de gérer des opérations complexes offrent des perspectives économiques beaucoup plus importantes que les utilisateurs gratuits du chatbot.

ChatGPT devient progressivement une plateforme de productivité avant de rester un simple outil conversationnel.

Une nouvelle génération d’assistants numériques

Si OpenAI réussit son pari, ChatGPT pourrait devenir l’un des premiers véritables assistants numériques universels. L’utilisateur n’ouvrirait plus forcément un moteur de recherche, une application de réservation ou un logiciel bureautique. Il exprimerait simplement un objectif.

L’IA se chargerait ensuite de trouver les informations, prendre les décisions nécessaires et exécuter les actions.

Cette vision reste encore en construction, mais elle illustre parfaitement l’évolution actuelle du secteur : l’intelligence artificielle ne cherche plus seulement à répondre à nos questions. Elle cherche désormais à travailler avec nous.

Et potentiellement, à notre place.

Lire plus

Intelligence Artificielle

Anthropic élargit Project Glasswing : l’IA entre dans la cybersécurité des infrastructures critiques

par Yohann Poiron le 6 juin 2026

Alors que la course à l’intelligence artificielle se concentre souvent sur les assistants conversationnels et la productivité, Anthropic poursuit une stratégie différente : utiliser l’IA pour protéger les infrastructures les plus sensibles au monde.

L’entreprise américaine vient d’annoncer l’extension de Project Glasswing, son programme dédié à la détection proactive des vulnérabilités logicielles. Après une phase pilote lancée en avril, l’initiative s’ouvre désormais à près de 150 organisations réparties dans plus de 15 pays.

Claude Mythos au cœur du dispositif

Au centre de Project Glasswing se trouve Claude Mythos, le modèle de cybersécurité le plus avancé développé par Anthropic à ce jour. Selon l’entreprise, ce système est capable d’analyser d’immenses bases de code et d’identifier des milliers de vulnérabilités inédites, y compris des failles dites « zero-day », sur plusieurs semaines d’investigation continue.

Lors de la phase initiale du programme, une cinquantaine de partenaires, dont plusieurs agences gouvernementales américaines ont obtenu un accès anticipé afin de scanner leurs infrastructures logicielles critiques.

La nouvelle vague de participants couvre des domaines particulièrement sensibles : énergie, distribution d’eau, santé, télécommunications, matériel informatique et infrastructures numériques critiques. Anthropic explique avoir volontairement ciblé des organisations dont les logiciels sont utilisés par des gouvernements, des opérateurs stratégiques ou des millions d’utilisateurs.

Selon l’entreprise, une compromission majeure de certains de ces systèmes pourrait affecter plus de 100 millions de personnes et avoir des conséquences importantes sur la sécurité nationale ou internationale.

Parmi les organisations citées par plusieurs médias figureraient notamment : Okta, Samsung, SK Hynix, SK Telecom, NATO et ENISA. L’initiative s’étend également à plusieurs pays alliés des États-Unis, dont la France, l’Allemagne, le Canada, le Japon ou encore l’Inde.

Une nouvelle course aux armes… défensives

L’annonce intervient dans un contexte où les grands laboratoires d’IA considèrent désormais la cybersécurité comme l’un des marchés stratégiques les plus importants de la décennie.

Anthropic estime que d’autres modèles atteindront rapidement le niveau de Claude Mythos. L’entreprise cherche donc à mettre en place des mécanismes de gouvernance et de contrôle avant que ces capacités ne deviennent largement accessibles.

La concurrence s’organise déjà. Quelques semaines après le lancement de Mythos, OpenAI a dévoilé GPT-5.5-Cyber, un modèle spécialisé dans l’analyse de sécurité actuellement testé auprès d’un groupe restreint de partenaires.

L’IA passe de la génération à la protection

Depuis deux ans, l’essentiel des investissements dans l’IA s’est concentré sur la création de contenu, l’automatisation du travail de bureau et les assistants numériques. Project Glasswing illustre une évolution plus profonde : l’IA devient progressivement un outil de défense infrastructurelle.

L’enjeu dépasse largement la simple détection de bugs. Les infrastructures critiques modernes reposent sur des millions de lignes de code souvent impossibles à auditer manuellement. Les modèles capables d’analyser ces systèmes à grande échelle pourraient devenir des composants essentiels de la cybersécurité mondiale.

Le défi sera désormais d’éviter que les mêmes capacités utilisées pour détecter les vulnérabilités ne puissent également être exploitées pour les découvrir à des fins offensives. C’est précisément cette dualité qui transforme aujourd’hui l’IA en sujet stratégique pour les gouvernements, les industriels et les acteurs de la défense.

Lire plus

Intelligence Artificielle

Anthropic tire la sonnette d’alarme : l’IA pourrait bientôt s’améliorer seule, sans supervision humaine

par Yohann Poiron le 6 juin 2026

L’un des acteurs les plus influents de l’intelligence artificielle appelle à ralentir la course aux modèles avancés. Selon Anthropic, l’industrie se rapproche d’un seuil technologique où certaines IA pourraient commencer à améliorer leurs propres capacités, ouvrant un débat majeur sur la sécurité et la gouvernance mondiale.

Alors que la compétition entre les géants de l’IA s’intensifie, Anthropic adopte une position de plus en plus prudente. L’entreprise fondée par d’anciens chercheurs d’OpenAI estime que les progrès actuels pourraient dépasser la capacité des gouvernements, des institutions et même des développeurs à en maîtriser les conséquences.

Au cœur de cette inquiétude se trouve un concept longtemps réservé aux débats théoriques : l’auto-amélioration récursive.

Quand l’IA commence à améliorer l’IA

L’idée est simple à formuler, mais potentiellement révolutionnaire. Aujourd’hui, les modèles d’intelligence artificielle sont conçus, entraînés et améliorés par des équipes humaines. Dans un scénario d’auto-amélioration récursive, une IA deviendrait capable d’optimiser elle-même son architecture, son code ou ses performances, réduisant progressivement l’intervention humaine dans le processus.

Selon plusieurs chercheurs d’Anthropic, les premières formes de cette capacité pourraient apparaître dans les prochaines années si le rythme actuel de développement se maintient.

À ce stade, il ne s’agit pas d’une réalité observable, mais d’une hypothèse jugée suffisamment crédible pour justifier une réflexion immédiate.

Le risque identifié n’est pas nécessairement celui d’une intelligence artificielle « hors de contrôle » au sens hollywoodien du terme. Il s’agit plutôt d’un problème de vitesse : une IA capable d’améliorer ses propres performances pourrait accélérer son évolution plus rapidement que les mécanismes de supervision, de réglementation ou de sécurité.

Une industrie qui avance plus vite que sa gouvernance

Pour Anthropic, le véritable enjeu n’est pas uniquement technique. L’entreprise estime que le développement des modèles de pointe progresse aujourd’hui à un rythme supérieur à celui des cadres réglementaires capables de les encadrer.

Cette situation crée un décalage grandissant entre innovation et gouvernance.

Alors que les capacités des modèles augmentent rapidement — raisonnement avancé, autonomie accrue, utilisation d’outils numériques, programmation et agents IA — les mécanismes internationaux de contrôle restent fragmentés et largement expérimentaux.

L’arrivée potentielle de systèmes capables de contribuer eux-mêmes à leur évolution pourrait accentuer encore davantage cette asymétrie.

L’idée controversée d’un ralentissement mondial

Face à ce scénario, Anthropic défend l’idée d’une coordination internationale visant à ralentir temporairement le développement des systèmes les plus avancés. L’entreprise compare cette approche à certains accords historiques de contrôle des armements, où plusieurs puissances acceptent volontairement des limites communes afin de réduire les risques collectifs.

Une telle proposition se heurte toutefois à d’importantes difficultés.

Contrairement aux technologies nucléaires ou militaires traditionnelles, le développement de l’IA peut être réalisé dans des infrastructures privées, réparties dans plusieurs pays et souvent difficiles à surveiller de manière indépendante.

Pour être efficace, un accord mondial devrait impliquer les principaux acteurs du secteur ainsi que les grandes puissances technologiques, notamment les États-Unis et la Chine. Or, dans un contexte de compétition économique et géopolitique intense, parvenir à un consensus apparaît particulièrement complexe.

Une proposition qui divise l’industrie

Les appels au ralentissement ne font pas l’unanimité. De nombreux acteurs du secteur considèrent qu’une pause pourrait freiner l’innovation, retarder des bénéfices économiques majeurs et modifier les équilibres concurrentiels mondiaux.

D’autres soulignent une contradiction potentielle : les entreprises qui demandent davantage de prudence sont parfois celles qui développent elles-mêmes les modèles les plus avancés.

Cette critique revient régulièrement dans le débat sur la sécurité de l’IA. Certains observateurs y voient un véritable souci de prévention. D’autres y perçoivent également une dimension stratégique dans la communication des grands laboratoires.

Entre innovation et sécurité, un équilibre encore à inventer

Malgré ces critiques, Anthropic maintient que le débat ne doit pas opposer progrès technologique et sécurité. L’entreprise plaide pour un développement parallèle des capacités et des mécanismes de contrôle : recherche sur l’alignement, transparence accrue, évaluations indépendantes des modèles et coopération internationale.

Cette position reflète une évolution plus large de l’industrie. À mesure que les modèles deviennent plus puissants, la question centrale n’est plus uniquement ce qu’ils peuvent accomplir, mais la vitesse à laquelle ils devraient être autorisés à progresser.

Un tournant pour l’intelligence artificielle

Le débat autour de l’auto-amélioration récursive marque une nouvelle étape dans l’histoire de l’IA. Pendant des années, les discussions se sont concentrées sur les performances : comprendre, générer, analyser, créer. Désormais, une autre interrogation prend de l’ampleur : comment gouverner des systèmes dont les capacités pourraient évoluer plus rapidement que les structures chargées de les encadrer ?

Qu’elle se matérialise dans cinq ans, dix ans ou davantage, la perspective d’une IA capable de participer à sa propre amélioration pousse déjà chercheurs, gouvernements et industriels à repenser les règles du jeu. Et pour la première fois, la question de la vitesse du progrès devient presque aussi importante que le progrès lui-même.

Lire plus

Intelligence Artificielle

Google lance Gemma 4 12B : un modèle IA local pensé pour les PC grand public

par Yohann Poiron le 5 juin 2026

Alors que l’explosion de l’IA générative fait grimper les besoins en mémoire et le coût des infrastructures, Google adopte une approche différente avec Gemma 4 12B. Cette nouvelle déclinaison de sa famille de modèles open source vise un objectif simple : rendre l’IA avancée accessible sur des machines bien plus modestes.

Avec seulement 16 Go de mémoire nécessaires pour fonctionner localement, Gemma 4 12B pourrait devenir l’un des modèles les plus intéressants pour les développeurs, chercheurs et passionnés souhaitant exécuter une IA performante sans dépendre du cloud.

Un modèle intermédiaire qui manquait à la gamme Gemma

Lorsque Google a dévoilé la famille Gemma 4 au printemps 2026, l’offre se divisait en deux catégories distinctes : des modèles légers optimisés pour le mobile et des variantes beaucoup plus ambitieuses destinées aux stations de travail et serveurs IA.

Entre les deux, un vide existait.

Gemma 4 12B vient précisément combler cet espace. Avec ses 12 milliards de paramètres, il se positionne comme une alternative capable d’exécuter des tâches complexes sans exiger une infrastructure coûteuse. Selon Google, le modèle peut fonctionner sur un ordinateur équipé de 16 Go de RAM ou de VRAM, soit environ deux fois moins de mémoire que la version Gemma 4 26B MoE.

Des performances proches des modèles plus imposants

La promesse la plus intéressante concerne le rapport entre taille et performances. D’après Google, Gemma 4 12B se rapproche fortement du comportement du modèle 26B dans de nombreux benchmarks, notamment sur le raisonnement multi-étapes, les workflows agentiques, la compréhension contextuelle et certaines tâches de génération de code.

Pour atteindre ce niveau d’efficacité, Google introduit par défaut la technologie Multi-Token Prediction (MTP).

Cette méthode exploite les cycles de calcul disponibles pour prédire plusieurs jetons à l’avance, améliorant simultanément la vitesse de génération, la fluidité des réponses et l’efficacité énergétique.

Une approche particulièrement pertinente pour les machines locales où chaque ressource compte.

Une nouvelle architecture multimodale plus légère

L’autre innovation majeure concerne la gestion des contenus multimédias. Comme les autres modèles Gemma 4, la version 12B accepte du texte, des images et de l’audio. Mais, Google a profondément revu son architecture.

Traditionnellement, les modèles multimodaux utilisent des encodeurs spécialisés pour convertir les images ou les sons avant de les transmettre au modèle principal. Cette méthode augmente la consommation mémoire et la latence.

Gemma 4 12B adopte une approche plus directe :

les images passent par un module d’intégration simplifié
l’audio est projeté directement dans l’espace vectoriel du modèle sans encodeur intermédiaire

Résultat : moins de calculs, moins de mémoire utilisée et une exécution plus rapide sur du matériel grand public.

Une stratégie qui répond à l’évolution du marché

Le lancement de Gemma 4 12B intervient dans un contexte où les modèles deviennent toujours plus gourmands. Les grands laboratoires multiplient les architectures dépassant plusieurs centaines de milliards de paramètres, tandis que le coût de la mémoire et des accélérateurs IA continue d’augmenter.

Google semble vouloir occuper un autre terrain : celui de l’IA locale accessible.

Cette stratégie rejoint plusieurs tendances émergentes :

le traitement des données directement sur l’appareil
la confidentialité renforcée
la réduction des coûts liés au cloud
le développement d’agents personnels exécutés localement

À mesure que les PC IA équipés de NPU se démocratisent, des modèles comme Gemma 4 12B pourraient devenir une référence pour les applications embarquées et les assistants fonctionnant sans connexion permanente à un centre de données.

Une IA locale de plus en plus crédible

Gemma 4 12B n’est pas le modèle le plus puissant de Google, mais il pourrait être l’un des plus stratégiques. En combinant performances avancées, multimodalité native et exigences matérielles raisonnables, Google répond à une demande croissante : disposer d’une IA capable de fonctionner directement sur un ordinateur personnel.

À l’heure où l’industrie investit des dizaines de milliards dans les centres de données, Gemma 4 12B rappelle qu’une partie de l’avenir de l’intelligence artificielle pourrait aussi se jouer sur les machines déjà présentes sur nos bureaux.

Lire plus

Intelligence Artificielle

ChatGPT améliore sa mémoire avec « Dreaming » : OpenAI veut enfin lui donner une mémoire vivante

par Yohann Poiron le 5 juin 2026

Depuis son lancement en 2024, la mémoire de ChatGPT représentait l’une des fonctionnalités les plus prometteuses de l’assistant d’OpenAI. Mais, dans les faits, elle souffrait d’un problème majeur : elle avait du mal à évoluer avec le temps.

OpenAI annonce désormais une refonte en profondeur de cette capacité avec un nouveau système baptisé « Dreaming », conçu pour permettre à ChatGPT de mettre à jour automatiquement ce qu’il sait de ses utilisateurs et d’utiliser ce contexte de manière beaucoup plus intelligente.

Une mémoire qui ne dépend plus uniquement des demandes explicites

Jusqu’à présent, ChatGPT enregistrait principalement des informations lorsque l’utilisateur lui demandait explicitement de s’en souvenir.

Cette approche fonctionnait pour les préférences permanentes, mais montrait rapidement ses limites dans la vie réelle. Un voyage prévu, un changement de régime alimentaire ou une nouvelle habitude pouvaient devenir obsolètes sans que l’IA ne le comprenne réellement.

Avec Dreaming, OpenAI change de philosophie.

Le système analyse désormais l’historique des conversations en arrière-plan afin d’identifier automatiquement les informations pertinentes. Il est également capable d’intégrer la notion de temporalité. Concrètement, si vous avez indiqué le mois dernier que vous partiez à Singapour, ChatGPT ne supposera plus automatiquement que vous vous y trouvez encore plusieurs semaines plus tard.

Une personnalisation beaucoup plus naturelle

L’objectif est aussi d’améliorer la cohérence des réponses. Si vous avez déjà indiqué que vous êtes végétarien, que vous préférez les restaurants calmes, que vous voyagez fréquemment, ou que vous travaillez dans un secteur spécifique, ChatGPT pourra réutiliser ces informations plus naturellement dans les futures conversations, sans que vous ayez besoin de les répéter.

Cette évolution rapproche davantage l’assistant d’un véritable compagnon numérique capable de construire progressivement une compréhension contextuelle de son utilisateur.

Une nouvelle page dédiée à la mémoire

OpenAI introduit également une interface permettant de visualiser et gérer plus facilement les souvenirs enregistrés. Les utilisateurs pourront consulter les informations mémorisées, corriger les erreurs, supprimer certains éléments et ajouter manuellement de nouveaux détails.

Cette transparence devient essentielle à mesure que l’IA conserve davantage de contexte personnel.

Une optimisation qui ouvre la porte aux utilisateurs gratuits

L’une des annonces les plus importantes concerne le déploiement. Selon OpenAI, des optimisations récentes ont permis de réduire d’environ 5x la puissance de calcul nécessaire pour faire fonctionner cette mémoire avancée.

Cette amélioration permet un déploiement immédiat pour les abonnés Plus et Pro aux États-Unis, une extension progressive à d’autres pays et une arrivée prochaine sur les offres Free et Go.

OpenAI indique également avoir doublé la capacité mémoire disponible pour les utilisateurs Plus et Pro.

Vers une IA qui apprend réellement à connaître son utilisateur

La mémoire représente probablement l’un des chantiers les plus stratégiques pour les assistants IA. Les modèles actuels sont devenus excellents pour répondre à une question isolée, mais restent souvent faibles lorsqu’il s’agit de maintenir une compréhension cohérente d’une personne sur plusieurs mois.

Avec Dreaming, OpenAI tente de résoudre ce problème fondamental : transformer ChatGPT d’un outil conversationnel performant en un assistant capable de construire une relation contextuelle durable.

La réussite de cette approche dépendra toutefois d’un équilibre délicat entre personnalisation et contrôle des données. Une mémoire plus intelligente est utile uniquement si elle reste précise, transparente et facile à corriger.

Si OpenAI parvient à tenir cette promesse, Dreaming pourrait devenir une évolution bien plus importante que n’importe quel nouveau modèle de langage.

Lire plus

Intelligence Artificielle

Alibaba lance Qwen3.7-Plus : un modèle IA multimodal plus abordable, mais moins ouvert

par Yohann Poiron le 4 juin 2026

Alibaba poursuit l’expansion de sa famille Qwen avec Qwen3.7-Plus, un nouveau modèle d’intelligence artificielle qui marque un tournant stratégique pour le géant chinois. Plus performant en multimodal, jusqu’à 60 % moins cher que Qwen3.7-Max sur certains usages, il abandonne toutefois l’un des piliers qui avait contribué au succès de la gamme : l’open source.

Une évolution qui pourrait séduire les entreprises à la recherche d’un bon rapport performance/prix, tout en suscitant des interrogations chez les développeurs qui avaient adopté l’écosystème Qwen précisément pour son ouverture.

Un modèle multimodal conçu pour les agents IA

Contrairement à Qwen3.7-Max, principalement orienté texte, Qwen3.7-Plus est capable de traiter plusieurs types de contenus simultanément. Le modèle peut notamment analyser des images et captures d’écran, comprendre des interfaces logicielles, interpréter des vidéos, générer du code et exécuter des tâches agentiques complexes.

Alibaba cible clairement les nouveaux usages liés aux agents autonomes, à l’automatisation des workflows et aux environnements de développement assistés par IA.

👏👏 Introducing Qwen3.7-Plus — a multimodal agent model that unifies vision and language into one versatile agent foundation.

✅ Multimodal interactive hybrid agent: unified GUI & CLI operation across visual and text tasks
✅ Versatile coding agent & productivity assistant with… pic.twitter.com/T3YTDnkE1D

— Qwen (@Alibaba_Qwen) June 1, 2026

Un million de tokens de contexte

L’une des caractéristiques techniques les plus impressionnantes est sa fenêtre de contexte de 1 million de tokens. Le modèle peut également consacrer jusqu’à 256 000 tokens à son raisonnement interne, lui permettant de maintenir une logique cohérente lors de tâches longues ou complexes.

Alibaba introduit également la fonction preserve_thinking, qui permet de conserver les blocs de raisonnement d’une conversation à l’autre.

Dans les faits, cette approche rejoint des mécanismes déjà proposés par Anthropic avec Extended Thinking et OpenAI avec ses mécanismes de raisonnement persistants.

L’objectif est identique : éviter qu’un agent IA perde le fil lors d’exécutions longues impliquant plusieurs outils et étapes.

Des performances solides, sans battre les leaders

Les premiers benchmarks positionnent Qwen3.7-Plus comme un modèle très compétitif, notamment sur :

Les tâches agentiques
La compréhension d’interfaces
L’exécution de commandes système
Les workflows de développement

Cependant, Alibaba reconnaît implicitement que le modèle reste globalement en dessous des références du marché comme Claude Opus d’Anthropic et GPT d’OpenAI.

Le positionnement est donc différent : proposer une intelligence suffisamment avancée pour les usages professionnels quotidiens à un coût nettement inférieur.

Un avantage économique majeur

L’un des arguments les plus agressifs de Qwen3.7-Plus est son tarif. Alibaba annonce 0,40 dollar par million de tokens en entrée, et 1,60 dollar par million de tokens en sortie. Ce qui le place parmi les modèles multimodaux les plus compétitifs du marché.

L’entreprise ajoute également un mécanisme de cache qui réduit fortement les coûts lorsque les mêmes données sont réutilisées dans plusieurs cycles d’exécution.

Pour les entreprises qui exécutent des milliers d’actions automatisées chaque jour, cette optimisation peut représenter des économies significatives.

Le grand changement : la fin de l’ouverture

C’est probablement le point qui fera le plus débat. Alors que de nombreux modèles Qwen précédents étaient distribués sous des licences ouvertes, Qwen3.7-Plus est uniquement accessible via les API propriétaires d’Alibaba Cloud.

Conséquences :

Impossible de télécharger les poids du modèle
Impossible de l’héberger en local
Dépendance aux infrastructures cloud d’Alibaba
Contraintes potentielles de conformité et de souveraineté des données

Pour les secteurs fortement réglementés, cette évolution pourrait limiter l’adoption du modèle malgré ses qualités techniques.

Alibaba change de stratégie pour rivaliser avec OpenAI et Anthropic

Qwen s’est imposé comme l’une des familles de modèles open source les plus influentes du marché. Avec Qwen3.7-Plus, Alibaba semble adopter une stratégie plus proche de celle d’OpenAI ou d’Anthropic.

L’objectif n’est plus seulement de diffuser des modèles performants, mais de construire une activité cloud rentable autour de l’IA. Le pari est logique : les entreprises recherchent désormais davantage des solutions prêtes à l’emploi que des modèles à déployer elles-mêmes.

Reste que cette transition risque de décevoir une partie de la communauté qui avait contribué au succès international de Qwen précisément parce qu’il représentait une alternative ouverte aux géants américains.

Une chose est certaine : la bataille de l’IA ne se joue plus uniquement sur les performances. Elle se joue désormais sur le coût, l’écosystème et le degré de contrôle que les entreprises souhaitent conserver sur leurs données.

Lire plus

Intelligence Artificielle

Gemini : Google rend ses nouveaux modes de raisonnement accessibles à tous

par Yohann Poiron le 4 juin 2026

Google accélère encore autour de Gemini. Après leur arrivée progressive autour de la Google I/O 2026, les nouveaux niveaux de raisonnement de Gemini sont désormais disponibles plus largement sur le web, Android et iOS.

✅ Papercut fixed: Thinking Levels are now available on Gemini across Web, iOS, and Android. pic.twitter.com/aF02kkUekW

— Josh Woodward (@joshwoodward) June 3, 2026

Deux modes : Standard et Extended

Les utilisateurs peuvent choisir entre deux niveaux :

Standard, pensé pour les demandes courantes, plus rapides et moins coûteuses en ressources.
Extended, conçu pour les questions complexes, les raisonnements longs, le code ou les analyses plus poussées.

Ces options sont disponibles sur Gemini 3.5 Flash et Gemini 3.5 Flash Light, y compris pour les utilisateurs gratuits.

Gratuit, mais pas illimité

Le mode Extended consomme davantage de tokens. En pratique, il peut donc épuiser plus rapidement les quotas des utilisateurs gratuits. Pour les usages intensifs, Google pousse toujours vers ses offres payantes, notamment AI Ultra, qui donne accès aux fonctions les plus avancées comme Deep Think.

Deep Think reste réservé aux abonnés

Le niveau supérieur, Deep Think, reste associé aux abonnements premium. Google le présente comme une fonction de raisonnement avancé destinée aux problèmes complexes en science, ingénierie, mathématiques ou développement logiciel.

Avec ces nouveaux modes, Google rend Gemini plus flexible. L’utilisateur peut choisir entre vitesse et profondeur, selon la tâche.

Mais, cette ouverture a ses limites : plus un modèle « réfléchit », plus il consomme de ressources. La vraie bataille ne porte donc plus seulement sur la puissance des modèles, mais sur leur coût d’usage, leur efficacité énergétique et leur disponibilité pour le grand public.

Lire plus

Intelligence Artificielle

Qu’est-ce que Claude AI ? L’assistant d’Anthropic et l’IA responsable en 2026

par Yohann Poiron le 3 juin 2026

Claude est l’assistant IA développé par Anthropic, entreprise fondée par d’anciens chercheurs d’OpenAI dont Dario et Daniela Amodei. En 2026, Claude s’est imposé comme l’un des modèles les plus avancés du marché, particulièrement reconnu pour ses capacités en codage, en raisonnement et en sécurité. La famille Claude 4.x, avec en tête Claude Opus 4.8, représente aujourd’hui le sommet de ce que l’entreprise a produit.

Qu’est-ce que Claude AI ?

Claude est un assistant IA conversationnel conçu pour être utile, inoffensif et honnête — la trinité fondatrice d’Anthropic. Contrairement à d’autres modèles qui maximisent les performances brutes, Anthropic place la sécurité au cœur de son développement via sa méthode Constitutional AI, un cadre où le modèle est entraîné à suivre un ensemble de principes explicites.

Claude est disponible sur claude.ai, via l’API Anthropic, Amazon Bedrock, Google Cloud Vertex AI, et via un écosystème d’outils dédiés : Claude Code, Claude Cowork, Claude pour Excel, Claude pour PowerPoint et Claude pour Chrome.

Les modèles Claude en 2026

Claude Opus 4.8 : le modèle phare (mai 2026)

Claude Opus 4.8, lancé le 28 mai 2026, est le modèle public le plus avancé d’Anthropic. Il succède à Opus 4.7 seulement 41 jours après ce dernier, un rythme inhabituel pour l’entreprise. Au-delà des gains de performance en code, en raisonnement et sur les tâches agentiques, Anthropic met l’accent sur la fiabilité : selon l’entreprise, Opus 4.8 serait environ quatre fois moins susceptible de laisser passer des défauts de code que la version précédente.

La grande nouveauté de cette version est le contrôle manuel de l’effort de raisonnement : l’utilisateur peut désormais choisir le niveau de réflexion appliqué par Claude (Low, Medium, High, Extra, Max) avant de générer une réponse. Opus 4.8 dispose d’une fenêtre de contexte d’un million de tokens et introduit, en aperçu de recherche, la fonction Dynamic Workflows, qui permet à Claude Code de mobiliser des centaines de sous-agents en parallèle pour des tâches de grande ampleur.

Claude Opus 4.7 et 4.6 : les jalons précédents

Claude Opus 4.7 (avril 2026) avait introduit une logique d’auto-vérification — le modèle peut développer un système puis créer lui-même un protocole pour en tester la cohérence — ainsi qu’une montée en résolution visuelle. Avant lui, Claude Opus 4.6 (février 2026) avait lancé les « Agent Teams », un mode où plusieurs agents se répartissent une mission en sous-tâches, et avait inauguré le contexte d’un million de tokens pour la classe Opus.

Claude Sonnet 4.6 et Haiku 4.5 : équilibre et rapidité

La gamme Claude repose sur trois tailles complémentaires :

Claude Opus 4.8 : le modèle le plus puissant, leader sur le codage complexe et les projets de plusieurs jours. Fenêtre de contexte d’1 million de tokens.
Claude Sonnet 4.6 (février 2026) : le modèle polyvalent, excellent pour les agents du monde réel, la cybersécurité et les workflows en entreprise. Recommandé pour la majorité des usages.
Claude Haiku 4.5 (octobre 2025) : le modèle rapide et économique, idéal pour les applications à volume élevé et les expériences en temps réel.

À noter qu’Anthropic ne synchronise pas les numéros de version entre Opus, Sonnet et Haiku : un nouveau modèle Opus ne signifie pas un nouveau Sonnet ou Haiku au même numéro. Anthropic développe par ailleurs un modèle plus avancé, baptisé Mythos, gardé en accès restreint en raison notamment de ses capacités en cybersécurité.

Le raisonnement hybride, marque de fabrique de Claude

Depuis Claude 3.7 Sonnet (février 2025), Anthropic a popularisé une approche inédite : un mode de raisonnement étendu (Extended Thinking) intégré directement dans un modèle polyvalent, plutôt qu’un modèle de raisonnement séparé. Cette logique se retrouve aujourd’hui dans toute la gamme 4.x, avec le contrôle de l’effort introduit par Opus 4.8.

Claude Code : l’agent de développement

Claude Code est l’outil en ligne de commande d’Anthropic pour déléguer des tâches de codage directement depuis le terminal. Lancé en février 2025, il est largement considéré en 2026 comme l’un des meilleurs assistants de codage IA du marché lorsqu’il est associé à Opus 4.8. Sa croissance a été spectaculaire : Dario Amodei a évoqué une progression de l’ordre de 80x sur l’usage de l’outil.

En 2026, Claude Code s’est enrichi de :

une version web et une application mobile ;
Claude Code Security pour l’audit de sécurité des bases de code ;
Claude Cowork, une version graphique pour les non-développeurs ;
des intégrations dans Excel, PowerPoint et Chrome ;
la fonction Dynamic Workflows (aperçu de recherche) avec Opus 4.8.

Pour ceux qui hésitent entre les principaux agents de code, nous avons publié un comparatif dédié : Claude Code vs ChatGPT Codex.

Tarifs et accès en 2026

L’offre Claude s’articule autour de plusieurs forfaits (tarifs indicatifs en dollars, susceptibles de varier en euros et selon la TVA) :

Gratuit : accès à Claude (Sonnet) sur claude.ai avec des limites d’usage.
Pro (environ 20 $/mois, 17 $/mois en facturation annuelle) : accès étendu à tous les modèles, Claude Code, Cowork, mode Research, Projects illimités, et intégrations Excel, PowerPoint et Chrome incluses.
Max : deux niveaux, Max 5x (environ 100 $/mois) et Max 20x (environ 200 $/mois), pour un usage intensif. Mêmes modèles et fonctionnalités que Pro, mais avec respectivement 5 fois et 20 fois plus de capacité d’usage et un accès prioritaire aux nouveautés.
Team et Enterprise : SSO, confidentialité des données (exclues de l’entraînement), contrôles d’administration, fenêtre de contexte étendue pour Enterprise.
API : facturée à l’usage. Pour Opus 4.8, à partir de 5 $/M tokens en entrée et 25 $/M tokens en sortie ; Sonnet 4.6 reste à 3 $/15 $ par million de tokens.

Note : Pro, Max, Code et Cowork partagent les mêmes modèles et la même qualité de réponse. La différence entre les forfaits porte sur le volume et la vitesse d’usage, pas sur l’intelligence du modèle. Vérifiez la page officielle d’Anthropic pour les tarifs à jour en euros.

Points forts de Claude en 2026

Codage de pointe : Opus 4.8 figure parmi les meilleurs modèles pour les projets complexes de plusieurs jours.
Sécurité et alignement : approche Constitutional AI, accent sur l’honnêteté et la détection d’erreurs.
Confidentialité entreprise : données exclues de l’entraînement sur les offres Team et Enterprise, options de conformité.
Fenêtre de contexte d’1 M tokens : pour l’analyse de documents et de codebases volumineux.
Agents autonomes : Claude peut planifier et exécuter des projets longs, avec les Agent Teams et Dynamic Workflows.

Claude face à ses concurrents

Le marché des IA conversationnelles est désormais mature et concurrentiel :

ChatGPT (OpenAI) : la référence grand public, dotée du meilleur écosystème (Atlas, Sora, Codex). Claude conserve souvent l’avantage sur le codage complexe.
Gemini (Google) : imbattable sur l’intégration à l’écosystème Google (Android, Search, Workspace), mais Claude reste souvent préféré des développeurs.
DeepSeek : alternative open source bien moins chère, mais jugée moins fiable sur les données sensibles.

Sur les benchmarks récents, Anthropic revendique pour Opus 4.8 une avance sur GPT-5.5 et Gemini 3.1 Pro dans la plupart des domaines, à l’exception notable du codage agentique en terminal, où le modèle d’OpenAI conserve l’avantage. Aucune solution n’est universellement supérieure : le choix dépend de vos usages et de votre rapport à la confidentialité.

FAQ : tout ce que vous voulez savoir sur Claude AI

Qu’est-ce que Claude AI ?

Claude est un assistant IA conversationnel développé par Anthropic, conçu autour des principes « utile, inoffensif et honnête » via la méthode Constitutional AI. En 2026, il est particulièrement reconnu pour le codage, le raisonnement et la sécurité, avec en tête le modèle Claude Opus 4.8.

Quel est le dernier modèle de Claude ?

À la date de publication, le modèle le plus avancé est Claude Opus 4.8, lancé le 28 mai 2026. Il s’accompagne de Claude Sonnet 4.6 (février 2026) pour les usages polyvalents et de Claude Haiku 4.5 (octobre 2025) pour les tâches rapides.

Claude est-il gratuit ?

Oui, un forfait gratuit donne accès à Claude sur claude.ai avec des limites d’usage. Les fonctionnalités avancées (tous les modèles, Claude Code, Cowork, mode Research, intégrations) nécessitent un abonnement Pro (environ 20 $/mois) ou Max (à partir de 100 $/mois).

Claude est-il le meilleur pour le code ?

Claude, associé à Claude Code et au modèle Opus 4.8, figure parmi les meilleures solutions pour le développement logiciel, notamment sur les projets complexes de plusieurs jours. Sur certaines tâches de codage agentique en terminal, le modèle d’OpenAI conserve toutefois un avantage selon les benchmarks.

Quelle est la différence entre Claude et ChatGPT ?

Les deux sont des assistants IA généralistes. ChatGPT (OpenAI) offre le plus large écosystème grand public. Claude (Anthropic) se distingue par son approche de la sécurité (Constitutional AI), sa qualité de raisonnement et ses performances en codage. Beaucoup d’utilisateurs avancés combinent les deux selon les tâches.

Claude respecte-t-il la confidentialité des données ?

Sur les offres Team et Enterprise, les conversations sont exclues de l’entraînement des modèles, avec des options de conformité et de contrôle d’administration. Anthropic met en avant la sécurité et l’alignement comme axes centraux de son approche.

Conclusion

En 2026, Claude s’est imposé comme le choix de référence pour les développeurs et les entreprises qui recherchent un raisonnement avancé, une sécurité maximale et une gestion de projets complexes. Avec Claude Code, Cowork et la famille Claude 4.x menée par Opus 4.8, Anthropic a su se différencier durablement d’OpenAI et de Google — non pas en cherchant à être l’IA la plus universelle, mais l’IA la plus fiable.

A lire aussi

Lire plus

Intelligence Artificielle

Qu’est-ce que ChatGPT ? L’IA qui écoute, parle, voit et agit (2026)

par Yohann Poiron le 3 juin 2026

Depuis son lancement en novembre 2022, ChatGPT a connu une évolution fulgurante. Ce qui était à l’origine un simple chatbot conversationnel basé sur du texte est devenu, en 2026, un véritable assistant personnel multimodal et agentique : il peut écouter, parler, voir, comprendre des images, naviguer sur le web et exécuter des tâches à votre place.

En quelques années, ChatGPT est passé du statut de curiosité technologique à celui d’outil de travail quotidien pour des centaines de millions de personnes. Avec l’arrivée de GPT-5.5, du navigateur ChatGPT Atlas et de l’Agent Mode, OpenAI ne propose plus seulement une IA qui répond, mais une IA qui agit. Mais concrètement, qu’est-ce que ChatGPT aujourd’hui, et que pouvez-vous en faire ? Suivez le guide.

Qu’est-ce que ChatGPT ?

ChatGPT est un assistant IA conversationnel développé par OpenAI, capable de produire du texte lorsqu’on lui fournit une question ou un prompt. Il excelle dans le traitement du langage naturel (NLP), ce qui lui permet de converser de manière fluide, comme le ferait un humain. Lancé en novembre 2022, il a été amélioré à travers de nombreuses générations de modèles.

Contrairement aux chatbots traditionnels, souvent limités à des scénarios prédéfinis, ChatGPT répond de manière contextuelle et flexible. Il peut :

comprendre vos questions et générer des réponses cohérentes ;
traduire, reformuler, résumer ;
écrire des textes, du code, des histoires ;
analyser des images, des documents et des données ;
vous répondre à l’oral via le mode vocal avancé ;
et depuis fin 2025, naviguer sur le web et exécuter des actions à votre place.

En 2026, ChatGPT repose principalement sur la famille de modèles GPT-5.5, la génération la plus avancée d’OpenAI à date, qui améliore la compréhension du contexte long, le raisonnement et réduit fortement les hallucinations.

L’évolution des modèles : de GPT-4o à GPT-5.5

De GPT-4o à GPT-5 (2024-2025)

En mai 2024, OpenAI a lancé GPT-4o (« o » pour omni), premier modèle réellement multimodal capable de traiter texte, image et audio. En 2025, plusieurs itérations ont suivi : GPT-4.1, GPT-4.5 (nom de code Orion), puis le grand saut avec GPT-5 en août 2025, présenté comme une intelligence unifiée capable de choisir automatiquement le bon niveau de raisonnement selon la tâche.

À noter : le populaire GPT-4o a été retiré de ChatGPT en février 2026, malgré une mobilisation d’utilisateurs attachés à sa personnalité. Cette décision illustre le rythme rapide auquel OpenAI fait évoluer son catalogue de modèles.

La série GPT-5.x (fin 2025 – 2026)

Après GPT-5, OpenAI a accéléré sa cadence de publication avec une succession de modèles intermédiaires :

GPT-5.1 (novembre 2025) : introduction de personnalités personnalisables et d’un ton par défaut plus chaleureux.
GPT-5.2 (décembre 2025) : modèle orienté travail de la connaissance (tableurs, présentations, code), publié dans un contexte de forte concurrence avec Gemini 3.
GPT-5.3-Codex (février 2026) puis GPT-5.4 (mars 2026) : avancées en raisonnement, code et workflows agentiques.
GPT-5.5 (avril 2026) : le modèle le plus avancé à date, décliné en GPT-5.5 Instant (le modèle par défaut de ChatGPT depuis mai 2026), GPT-5.5 Thinking et GPT-5.5 Pro.

GPT-5.5 : le modèle phare de 2026

GPT-5.5 marque une nouvelle étape. OpenAI revendique des progrès significatifs en raisonnement, en code et en compréhension de contexte long, avec une réduction marquée des hallucinations dans les domaines sensibles comme le droit, la médecine et la finance.

Les variantes disponibles dans ChatGPT :

GPT-5.5 Instant : version par défaut, rapide, qui peut consulter vos conversations passées, fichiers et e-mails liés pour des réponses plus personnalisées.
GPT-5.5 Thinking : raisonnement étendu pour les questions complexes (réservé aux abonnés payants).
GPT-5.5 Pro : capacités maximales, réservé aux abonnements Pro, Business et Enterprise.

Une version spécialisée pour le code, GPT-5.5 pour Codex, complète la gamme. Les modèles les plus puissants (Thinking, Pro) ne sont pas accessibles aux utilisateurs du forfait gratuit.

Comment fonctionne ChatGPT ?

La base de ChatGPT reste une architecture Transformer, entraînée sur d’immenses corpus de données (pages web, livres, articles, discussions). Après une phase de pré-entraînement, OpenAI affine la qualité des réponses via une combinaison d’apprentissage supervisé et de RLHF (reinforcement learning from human feedback).

Les modèles récents ajoutent une fenêtre de contexte étendue (jusqu’à 1 million de tokens sur les offres haut de gamme), un traitement multimodal natif et des capacités de raisonnement renforcées par des étapes intermédiaires explicites, dans la lignée des anciens modèles de raisonnement « o1 ».

Ce que ChatGPT permet de faire en 2026

Un assistant omnimodal

ChatGPT couvre aujourd’hui un large éventail d’usages : rédaction, génération de code, raisonnement complexe, vulgarisation, analyse de documents et bien plus. Avec GPT-5.5, il traite simultanément texte, code, données, images et audio, en adaptant automatiquement sa puissance selon le contexte.

Mode vocal avancé

Le mode vocal avancé permet des conversations parlées fluides et naturelles, avec gestion des interruptions et des pauses. Il est intégré à l’application mobile et au web, ainsi qu’au navigateur Atlas.

Deep Research

Deep Research permet de lancer des recherches web autonomes avec synthèse documentée. Le nombre de recherches mensuelles dépend de l’abonnement (10 par mois pour Plus, jusqu’à 250 pour Pro à 200 $). L’ancien mode Deep Research « legacy » a été retiré en mars 2026 au profit de l’expérience actuelle.

Sora, Canvas, Tasks et Custom GPTs

ChatGPT intègre Sora pour la génération vidéo, Canvas pour l’édition collaborative de texte et de code, Tasks pour programmer des actions récurrentes, et les Custom GPTs pour créer des assistants spécialisés. Ces fonctionnalités sont réservées aux abonnés payants (Plus et au-delà).

ChatGPT devient agentique : Agent Mode et navigateur Atlas

L’évolution la plus marquante de ChatGPT en 2026 n’est pas un modèle, c’est un changement de nature. ChatGPT passe de l’IA qui répond à l’IA qui agit. OpenAI évoque même la construction d’une « superapp » réunissant ChatGPT, Codex et un navigateur IA dans un seul environnement.

Agent Mode

L’Agent Mode permet à ChatGPT d’exécuter des tâches de bout en bout : rechercher, comparer, remplir des formulaires, préparer un panier d’achats, planifier un repas et ajouter les ingrédients à une liste de courses. OpenAI insiste sur le contrôle utilisateur : ChatGPT demande confirmation avant les actions importantes, et l’utilisateur peut interrompre ou reprendre la main à tout moment. Cette fonctionnalité est réservée aux abonnés Plus, Pro et Business.

ChatGPT Atlas : le navigateur d’OpenAI

Lancé fin 2025 sur macOS, ChatGPT Atlas est un navigateur web doté d’une barre latérale ChatGPT persistante qui accompagne chaque page que vous ouvrez. Il peut résumer, traduire, comparer et raisonner sur le contenu affiché, sans avoir à copier-coller. Atlas dispose d’une mémoire de navigation (que l’utilisateur contrôle), de suggestions contextuelles et de l’Agent Mode intégré.

Atlas est disponible pour les forfaits Free, Go, Plus et Pro sur macOS. Les versions Windows, iOS et Android sont annoncées mais pas encore largement déployées à la date de publication de cet article. Sa puissance soulève toutefois des questions de confidentialité, le navigateur combinant historique de navigation, conversations et fichiers connectés.

Prix et abonnements ChatGPT en 2026

L’offre ChatGPT s’est considérablement étoffée. OpenAI propose désormais plusieurs niveaux d’abonnement, du gratuit à l’entreprise. Voici la situation à jour (tarifs indicatifs en dollars, susceptibles de varier selon la région et la TVA) :

Free (0 $) : accès au modèle par défaut (GPT-5.5 Instant depuis mai 2026) avec des limites strictes. Aux États-Unis, le forfait gratuit affiche désormais des publicités depuis février 2026. Pas d’accès aux fonctionnalités avancées (Deep Research, Sora, Agent Mode, Custom GPTs).
Go (environ 8 $/mois) : davantage de messages, d’envois de fichiers et de génération d’images, mémoire plus longue. Inclut les Projects, Tasks et Custom GPTs. Affiche aussi des publicités aux États-Unis et n’inclut pas les fonctionnalités avancées ni l’accès à GPT-5.5.
Plus (environ 20 $/mois) : l’offre la plus polyvalente. Accès à GPT-5.5, Deep Research (10 recherches/mois), Sora, Codex, Agent Mode, Canvas et mode vocal avancé. Sans publicité.
Pro : deux niveaux depuis avril 2026. Pro à 100 $/mois (5x les limites de Plus, orienté codeurs intensifs) et Pro à 200 $/mois (20x les limites, contexte 1 M tokens, 250 recherches Deep Research/mois, GPT-5.5 Pro).
Business et Enterprise : à partir d’environ 25 $/utilisateur/mois pour Business (espaces dédiés, contrôles d’équipe, conformité), tarif sur devis pour Enterprise.

Note importante : l’API OpenAI est facturée séparément (à l’usage, par tokens) et n’est jamais incluse dans les abonnements ChatGPT. Les prix peuvent différer en euros et selon la disponibilité régionale ; vérifiez la page officielle d’OpenAI avant de souscrire.

GPT-OSS : l’ouverture vers l’open source

En parallèle de ses modèles propriétaires, OpenAI a dévoilé GPT-OSS (Open Source Series), une gamme de modèles open source dérivés de ses travaux. Plus légers (20B et 120B de paramètres), ils peuvent être téléchargés, modifiés et hébergés librement par les développeurs et entreprises, ce qui permet d’adapter l’IA à des domaines spécifiques tout en maîtrisant coûts et confidentialité.

Confidentialité et limites

Publicités sur les offres gratuites

Un changement notable en 2026 : l’arrivée de la publicité sur les forfaits Free et Go aux États-Unis (depuis février 2026, avec une régie publicitaire en self-service depuis mai 2026). OpenAI affirme que les publicités sont clairement identifiées et n’influencent pas les réponses de ChatGPT. Ce déploiement concerne pour l’instant le marché américain ; sa généralisation à d’autres pays n’est pas confirmée. OpenAI explore par ailleurs depuis fin 2025 l’intégration de publicités directement dans les réponses.

Hallucinations et fiabilité

Malgré des progrès importants, ChatGPT peut toujours produire des informations incorrectes ou inventées (hallucinations). OpenAI revendique une réduction marquée de ces erreurs avec GPT-5.5, notamment sur les sujets sensibles, mais la vérification des informations importantes reste indispensable, surtout en contexte professionnel, juridique ou médical.

Données personnelles et agents

Les fonctionnalités agentiques (Agent Mode, Atlas) soulèvent des questions de confidentialité spécifiques, puisque l’IA peut agir sur des sites et accéder à des informations sensibles. OpenAI a intégré des garde-fous : demande de confirmation avant les actions importantes, impossibilité d’exécuter du code ou d’installer des extensions en mode agent, contrôle utilisateur sur la mémoire de navigation. Comme toujours, il convient de rester prudent et de réserver les workflows sensibles à une supervision manuelle.

ChatGPT face à Gemini et Claude

Le marché des IA conversationnelles est désormais mature et concurrentiel. ChatGPT (OpenAI) reste la référence grand public, fort de sa polyvalence et de son écosystème (Atlas, Sora, Codex, Custom GPTs). Gemini (Google) bénéficie d’une intégration profonde dans Android, Search, Gmail et l’écosystème Google. Claude (Anthropic) est souvent salué pour la qualité de sa rédaction, son raisonnement et ses outils de développement.

Aucune de ces solutions n’est universellement supérieure : le choix dépend de vos usages, de votre écosystème et de votre rapport à la confidentialité des données. Beaucoup d’utilisateurs avancés combinent plusieurs outils selon les tâches.

Faut-il utiliser ChatGPT ?

Pour un usage occasionnel – rédaction, traduction, idées, questions du quotidien – le forfait gratuit suffit souvent, malgré ses limites et la présence de publicités aux États-Unis. Pour un usage régulier et professionnel, le forfait Plus à 20 $/mois reste le meilleur rapport qualité-prix : il débloque l’essentiel des fonctionnalités avancées. Les forfaits Pro ne se justifient que pour les utilisateurs très intensifs ou les développeurs ayant besoin de limites élevées et de GPT-5.5 Pro.

Ce qui est certain, c’est que ChatGPT n’est plus seulement un chatbot. Avec l’Agent Mode et Atlas, il devient un outil capable d’agir sur le web et d’exécuter des tâches complètes – une transformation qui redéfinit ce qu’on peut attendre d’un assistant IA.

FAQ : tout ce que vous voulez savoir sur ChatGPT

Qu’est-ce que ChatGPT ?

ChatGPT est un assistant IA conversationnel développé par OpenAI, capable de comprendre le langage naturel et de générer du texte, du code, des images et des réponses contextuelles. En 2026, il repose sur la famille de modèles GPT-5.5 et intègre des capacités multimodales et agentiques.

ChatGPT est-il gratuit ?

Oui, il existe un forfait gratuit, mais avec des limites de messages strictes et, aux États-Unis, des publicités depuis février 2026. Les fonctionnalités avancées (Deep Research, Sora, Agent Mode, Custom GPTs) et l’accès au modèle GPT-5.5 nécessitent un abonnement payant à partir du forfait Plus (environ 20 $/mois).

Quelle est la différence entre ChatGPT et Gemini ?

Les deux sont des assistants IA généralistes. ChatGPT (OpenAI) se distingue par sa polyvalence et son écosystème propre (navigateur Atlas, Sora, Codex). Gemini (Google) bénéficie d’une intégration profonde dans Android, Google Search, Gmail et les autres services Google. Le choix dépend surtout de votre écosystème et de vos usages.

Quel est le dernier modèle de ChatGPT ?

À la date de publication, le modèle le plus avancé est GPT-5.5, lancé en avril 2026. GPT-5.5 Instant est devenu le modèle par défaut de ChatGPT en mai 2026, avec des variantes Thinking et Pro pour les tâches complexes.

ChatGPT peut-il naviguer sur le web et agir à ma place ?

Oui. Avec l’Agent Mode et le navigateur ChatGPT Atlas, ChatGPT peut naviguer sur des sites, remplir des formulaires, comparer des informations et exécuter des tâches de bout en bout, sous votre contrôle. Ces fonctionnalités sont réservées aux abonnés payants (Plus, Pro, Business).

ChatGPT est-il fiable ?

ChatGPT est performant mais peut produire des informations inexactes (hallucinations). OpenAI revendique une réduction de ces erreurs avec GPT-5.5, notamment sur les sujets sensibles (droit, médecine, finance), mais la vérification des informations importantes reste recommandée.

ChatGPT peut-il générer des images et des vidéos ?

Oui. ChatGPT génère des images directement et intègre Sora pour la génération vidéo. Ces fonctionnalités sont réservées aux abonnés payants.

Y a-t-il des publicités dans ChatGPT ?

Depuis février 2026, les forfaits gratuits et Go affichent des publicités aux États-Unis. OpenAI indique qu’elles sont clairement identifiées et n’influencent pas les réponses. Les forfaits Plus et supérieurs restent sans publicité. Le déploiement hors des États-Unis n’est pas confirmé à ce jour.

Ce qu’il faut retenir en 2026

ChatGPT a définitivement quitté le statut de simple chatbot. En 2026, c’est une plateforme d’assistance omnimodale et agentique, reposant sur GPT-5.5, capable non seulement de répondre mais aussi d’agir sur le web via l’Agent Mode et le navigateur Atlas.

L’offre s’est diversifiée, du gratuit (avec publicités aux États-Unis) au Pro à 200 $/mois, et la concurrence avec Gemini et Claude pousse OpenAI à innover à un rythme soutenu. Pour la majorité des utilisateurs, le forfait Plus reste le point d’équilibre idéal entre coût et capacités. Et la grande question des prochains mois sera celle de la confiance : jusqu’où déléguer à une IA qui agit en notre nom ?

Lire plus

Intelligence Artificielle

Qu’est-ce que Google Gemini ? La couche IA de Google en 2026

par Yohann Poiron le 3 juin 2026

Depuis son lancement en février 2023, Google Gemini a profondément changé de nature. Ce qui était présenté comme le successeur de Bard — un chatbot concurrent de ChatGPT — est devenu en l’espace de deux ans quelque chose de beaucoup plus ambitieux : la couche d’intelligence artificielle qui irrigue l’ensemble des produits Google. Search, Android, Workspace, YouTube, Chrome — Gemini est désormais partout, et avec les annonces de Google I/O 2026, cette transformation s’accélère encore.

L’édition 2026 de la conférence Google I/O a marqué une rupture nette. Google n’a pas présenté Gemini comme un assistant. Il l’a présenté comme un agent : un système qui n’attend plus que vous lui posiez une question, mais qui travaille pour vous, en arrière-plan, de manière proactive. Ce guide complet fait le point sur ce qu’est réellement Google Gemini en 2026, ce qu’il peut faire, ce qu’il coûte — et ce qu’il ne peut pas encore faire.

Qu’est-ce que Google Gemini ?

Google Gemini est la famille de modèles d’intelligence artificielle développée par Google DeepMind. Ces modèles sont dits multimodaux : ils peuvent traiter du texte, des images, de l’audio, de la vidéo et du code, seuls ou combinés. Gemini est à la fois le nom des modèles sous-jacents et celui de l’écosystème de produits qui les exploite.

Au sens large, Gemini désigne aujourd’hui trois réalités distinctes :

Les modèles Gemini : les modèles IA développés par Google DeepMind, disponibles via l’API Gemini pour les développeurs et dans Google AI Studio.
L’application Gemini : l’interface de conversation accessible sur Android, iOS et le web, équivalent de ChatGPT ou Claude pour le grand public.
Gemini intégré aux produits Google : la présence de l’IA Gemini dans Google Search, Gmail, Docs, Android, YouTube, Chrome et d’autres surfaces Google.

C’est cette troisième dimension qui prend de plus en plus de place, et qui distingue fondamentalement Gemini de ses concurrents.

De Bard à Gemini 3.5 : une montée en puissance rapide

Les débuts : Bard et Gemini 1.x (2023–2024)

Google a lancé Bard en février 2023 en réponse directe au succès de ChatGPT, s’appuyant d’abord sur le modèle LaMDA puis PaLM 2. Les premières démonstrations publiques ont été marquées par des erreurs factuelles, ce qui a terni l’image du produit à son lancement.

En décembre 2023, Google rebaptise et réorganise son offre autour de la famille Gemini 1.0, déclinée en trois tailles : Nano (sur appareil), Pro et Ultra. En 2024, Gemini 1.5 Pro introduit une fenêtre de contexte d’un million de tokens — un record à l’époque. Bard est officiellement renommé Gemini en février 2024.

Gemini 2.x : raisonnement et premiers agents (fin 2024 – 2025)

La série Gemini 2.0 marque le début des fonctionnalités agentiques. Gemini 2.0 Flash devient le modèle par défaut de l’application. Google introduit la notion d’agents IA capables d’exécuter des tâches multi-étapes dans le monde réel.

Avec Gemini 2.5 — lancé en juin 2025 et composé des modèles Pro, Flash et Flash-Lite — Google positionne ses modèles parmi les meilleurs sur les benchmarks de raisonnement complexe. Ces modèles sont dits hybrid reasoning : ils peuvent « réfléchir » avant de répondre, avec une fenêtre de contexte allant jusqu’à 1 million de tokens. Deep Think, le mode de réflexion étendue, est introduit pour les abonnés Ultra.

Gemini 3.x : la génération agentique (2025–2026)

La série Gemini 3 est lancée en octobre 2025, positionnée comme la réponse directe à GPT-5. Gemini 3 Flash devient le modèle par défaut de l’application. Gemini 3.1 Pro, annoncé début 2026, est conçu pour les tâches complexes nécessitant un raisonnement avancé, avec une disponibilité globale dans l’app Gemini.

À Google I/O 2026, Google franchit une nouvelle étape avec Gemini 3.5 Flash, déployé le 19 mai 2026 dans l’application Gemini, dans Google Search (AI Mode) et via l’API. Ce modèle combine capacités frontières et exécution de tâches agentiques, en surpassant Gemini 3.1 Pro sur les benchmarks de code, d’agents et de multimodalité, tout en étant quatre fois plus rapide que les autres modèles frontières. Gemini 3.5 Pro, version plus puissante, est attendu pour juin 2026.

Ce qui change avec Google I/O 2026

Google I/O 2026 n’a pas été une conférence sur un nouveau modèle de langage. C’est un événement qui a redéfini ce que signifie être un assistant IA. Le message central : Gemini devient un agent, pas seulement un assistant.

« Spark représente un grand changement pour Gemini, le transformant d’un assistant qui peut répondre à vos questions en un partenaire actif qui fait du vrai travail pour vous, sous votre direction. » — Google, Google I/O 2026

Cette évolution se traduit concrètement par plusieurs annonces majeures :

Le lancement de Gemini Spark, agent personnel disponible 24h/24
L’introduction de Gemini Omni, nouveau modèle orienté création vidéo et multimédia
Une refonte complète de l’interface de l’application Gemini (Neural Expressive)
Le déploiement de Gemini Intelligence sur Android, annoncé le 12 mai 2026
L’intégration de Gemini dans YouTube, Gmail, Google Keep, Google Docs, Shopping
Une révision du modèle tarifaire avec AI Ultra à partir de 100 $/mois et un passage à un modèle de consommation par calcul

Les modèles Gemini en 2026 : de Flash à Omni

Gemini 3.5 Flash : vitesse et capacités agentiques

Gemini 3.5 Flash est le modèle phare annoncé à Google I/O 2026. Il est conçu pour être à la fois rapide et capable d’exécuter des tâches agentiques complexes. Il est le modèle par défaut de l’application Gemini et d’AI Mode dans Google Search à l’échelle mondiale depuis le 19 mai 2026, et disponible pour les développeurs via l’API Gemini.

Gemini 3.5 Pro : pour les cas complexes

Gemini 3.5 Pro est actuellement en phase de test interne chez Google. Sa disponibilité publique est prévue pour juin 2026. Il est présenté comme plus capable que Flash pour les tâches à haute complexité, mais les détails techniques complets n’ont pas encore été publiés.

Gemini Omni : la création multimédia par IA

Gemini Omni est une nouvelle série de modèles annoncée à Google I/O 2026. Il accepte des entrées de type image, audio, vidéo et texte, et produit de la vidéo ancrée dans des connaissances réelles, facilement éditable. Gemini Omni Flash est disponible depuis le 19 mai 2026 pour les abonnés Google AI Plus, Pro et Ultra via l’application Gemini, Google Flow (en bêta Android), Flow Music (disponible sur iOS) et YouTube Shorts. C’est un positionnement direct sur le marché des outils vidéo génératifs.

L’application Gemini : une refonte en profondeur

Neural Expressive : un nouveau langage visuel

L’interface de l’application Gemini a été entièrement repensée sous le nom Neural Expressive. Cette refonte apporte des animations fluides, des couleurs plus vives, du retour haptique et une nouvelle typographie. La zone de saisie adopte une forme de pilule avec un menu « + » unique sur la gauche. Le tiroir de navigation devient une interface plein écran. Cette mise à jour est déployée depuis le 19 mai 2026 sur Android, iOS et le web.

Gemini Live : la conversation vocale intégrée

Gemini Live ne s’ouvre plus en plein écran. Il est désormais intégré directement dans l’interface principale, permettant de passer de l’écrit à la voix sans changer de mode. Le système de microphone a été revu pour mieux gérer les pauses naturelles et le débit de parole libre. Les réponses deviennent aussi plus visuelles : images en ligne, vidéos narrées, chronologies interactives.

Daily Brief : votre journée organisée chaque matin

Daily Brief est un nouveau résumé personnalisé de la journée à venir. En analysant Gmail, Calendar et Tasks, il priorise vos tâches et suggère des prochaines étapes. Ce service est disponible depuis le 19 mai 2026 pour les abonnés Google AI Plus, Pro et Ultra aux États-Unis. Son déploiement international n’a pas encore été annoncé à la date de publication de cet article.

Gemini Spark : votre agent personnel 24h/24

Gemini Spark est la nouveauté la plus structurante de Google I/O 2026. Google le décrit comme un agent personnel qui agit pour vous afin de vous aider à naviguer dans votre vie numérique. Il fonctionne en cloud, ce qui signifie qu’il peut continuer à travailler même lorsque votre appareil est éteint.

Spark est intégré à Gmail, Docs, Slides et d’autres outils Google Workspace dans un premier temps, avant de s’étendre à des applications tierces via le protocole MCP (Model Context Protocol) au cours de l’été 2026. Les exemples d’usages présentés par Google incluent la surveillance de factures récurrentes, la synthèse de notes de réunion ou la génération automatique de documents à partir d’e-mails.

Disponibilité : Gemini Spark est disponible en bêta pour les abonnés Google AI Ultra aux États-Unis à partir de la semaine du 26 mai 2026. Son déploiement hors États-Unis et pour les autres niveaux d’abonnement n’a pas encore été précisé.

Gemini dans Google Search : la recherche devient agentique

Google Search est l’un des produits les plus transformés par Gemini. Depuis 2025, le mode AI Mode permet d’obtenir des réponses synthétisées et de poser des questions de suivi. À Google I/O 2026, cette intégration franchit un cap supplémentaire.

AI Mode est désormais alimenté par Gemini 3.5 Flash depuis le 19 mai 2026. La nouvelle zone de recherche intelligente s’adapte à la longueur de votre saisie, en anticipant votre intention au-delà de la simple saisie automatique.

Google a également annoncé des agents d’information qui fonctionnent en permanence pour surveiller l’actualité sur les sujets qui vous intéressent (finance, sport, blogs, réseaux sociaux). Ces agents sont prévus pour l’été 2026 pour les abonnés Google AI Pro et Ultra aux États-Unis. Search pourra aussi bientôt générer des tableaux de bord et des trackers personnalisés (« mini-apps ») pour des tâches continues, pour les abonnés AI Pro et Ultra aux États-Unis.

Gemini sur Android : l’IA proactive sur votre téléphone

Gemini Intelligence : Android entre dans l’ère agentique

Annoncée à l’Android Show le 12 mai 2026, une semaine avant Google I/O, Gemini Intelligence est la vision de Google pour un Android qui ne se contente plus d’ouvrir des applications sur commande, mais qui anticipe vos besoins et agit pour vous.

Gemini Intelligence couvre cinq grands axes :

Automatisation multi-étapes : Gemini peut enchaîner des actions dans plusieurs applications (commander un repas, réserver un cours, remplir un panier depuis une liste visible à l’écran).
Navigation web intelligente dans Chrome : résumés de pages, comparaisons, remplissage automatique de formulaires complexes.
Rambler dans Gboard : transforme vos messages vocaux naturels en texte soigné, en supprimant les tics de langage.
Création de widgets personnalisés : créez des widgets Android en langage naturel.
Contexte visuel : Gemini peut utiliser le contenu affiché à l’écran ou une photo prise en temps réel pour déclencher des actions dans d’autres applications.

Disponibilité : Gemini Intelligence se déploie en vagues à partir de l’été 2026, en commençant par les Samsung Galaxy S26 et Google Pixel 10. Le déploiement s’étendra ensuite aux montres, voitures, lunettes connectées et ordinateurs portables. La disponibilité varie selon l’appareil, la région, la langue et le niveau d’abonnement. La France n’a pas encore été confirmée pour les premières vagues.

Android Halo : suivre votre agent en temps réel

Android Halo est une nouvelle interface discrète en haut de l’écran qui permet de suivre en temps réel l’activité de Gemini Spark et des autres agents IA, sans quitter l’application en cours. Cette fonctionnalité est prévue pour la fin de l’année 2026.

Gemini remplace Google Assistant

Sur les appareils Android récents, Gemini remplace progressivement Google Assistant. Cette transition est en cours et s’accélère avec Gemini Intelligence. Google Assistant reste disponible sur certains appareils anciens et surfaces spécifiques.

Gemini pour créer : images, vidéo, musique, documents

Images : Imagen et Google Pics

La génération d’images via Gemini s’appuie sur le modèle Imagen, accessible dans l’application Gemini pour les abonnés payants. À Google I/O 2026, Google a annoncé Google Pics, une nouvelle application dédiée à la génération et à la conception d’images par IA.

Vidéo : Gemini Omni et Google Flow

Gemini Omni Flash est le modèle de référence pour la création vidéo. Il est disponible via l’application Google Flow (en bêta sur Android, iOS à venir) et Flow Music (disponible sur iOS, Android à venir), ainsi que dans YouTube Shorts via la fonction Remix, pour les abonnés AI Plus, Pro et Ultra depuis le 19 mai 2026.

Documents et notes : Docs Live, Gmail Live et Google Keep

Docs Live permet de créer et modifier des documents en conversation vocale ou textuelle sur Android et iOS. Gmail Live permet des recherches conversationnelles dans vos e-mails. Un mode IA dans Google Keep transforme des pensées libres en notes structurées. Ces fonctionnalités sont prévues pour l’été 2026 avec les abonnements AI Pro et Ultra, d’abord aux États-Unis en anglais.

Shopping : le panier universel

Universal Cart est un panier d’achats IA intégré à l’application Gemini, YouTube et Gmail. Il centralise les articles de différents détaillants, surveille les promotions, compare les prix et détecte les incompatibilités entre produits. Il arrive aux États-Unis dans Search et l’application Gemini au cours de l’été 2026.

Gemini comme agent personnel

L’évolution la plus significative de Google I/O 2026 n’est pas un modèle particulier, c’est un changement de paradigme. Gemini passe de l’aide ponctuelle à l’action continue. Avec Gemini Spark, il est possible de déléguer des tâches récurrentes, de créer des workflows automatisés et de définir des déclencheurs pour que Gemini agisse sans sollicitation à chaque fois.

Google insiste sur le fait que Gemini n’agit qu’avec votre accord explicite et s’arrête une fois la tâche terminée. L’utilisateur reste décisionnaire final, notamment pour les achats. Les activités des agents sont tracées dans le tableau de bord de confidentialité Android, incluant quels assistants ont été actifs et quelles applications ils ont utilisées dans les dernières 24 heures.

Gemini pour les développeurs

Gemini est accessible aux développeurs via l’API Gemini, disponible dans Google AI Studio et Vertex AI. Gemini 3.5 Flash est disponible dans l’API depuis le 19 mai 2026 ; Gemini 3.5 Pro suivra en juin 2026. Les développeurs peuvent également intégrer Gemini Omni Flash pour des usages créatifs et multimédia.

Google a présenté Antigravity 2.0, un système de codage agentique avancé capable d’orchestrer des dizaines de sous-agents en parallèle pour des tâches de développement complexes. Le protocole MCP (Model Context Protocol) permettra cet été d’intégrer Gemini Spark à des applications tierces au-delà de l’écosystème Google.

Google AI Studio permet désormais aussi de créer des applications Android directement avec Gemini, depuis la session Google I/O 2026.

Prix et abonnements Google AI en 2026

Le modèle tarifaire de Gemini a évolué significativement lors de Google I/O 2026. L’application Gemini passe d’un système de limites quotidiennes fixes à un modèle basé sur la consommation de calcul (compute-used), qui tient compte de la complexité de la requête, des fonctionnalités utilisées et de la longueur de la conversation. Les limites se réinitialisent toutes les cinq heures jusqu’à atteindre le plafond hebdomadaire.

Gratuit : accès à Gemini 3.5 Flash, fonctionnalités de base, limites de calcul plus restrictives.
Google AI Plus : accès à Daily Brief, Gemini Omni, certaines fonctionnalités Workspace. Tarif en euros non confirmé suite à Google I/O 2026.
Google AI Pro : accès à AI Mode avancé dans Search, Gmail Live, Docs Live, agents d’information. Tarif en euros non confirmé à la date de publication.
Google AI Ultra : à partir de 100 $/mois (refonte tarifaire du 19 mai 2026 — l’ancien plan à 250 $ est remplacé par un plan équivalent à 200 $). Accès à Gemini Spark, limites d’utilisation 5× supérieures à AI Pro. Destiné aux développeurs, créateurs et utilisateurs intensifs.

Note : Les tarifs indiqués en dollars correspondent aux annonces américaines de Google I/O 2026. Les tarifs en euros pour la France n’ont pas été officiellement confirmés à la date de publication. Vérifiez la page officielle de Google avant souscription.

Disponibilité : ce qui est accessible et ce qui ne l’est pas encore

Un point important à comprendre sur Gemini en 2026 est le décalage entre les annonces et la disponibilité réelle.

Disponible mondialement (incluant la France) :

Application Gemini avec Gemini 3.5 Flash (Android, iOS, web)
Interface Neural Expressive
Gemini Live intégré
Gemini Omni Flash (abonnés AI Plus, Pro, Ultra)
Deep Research avec Gemini 2.5 Flash (gratuit)
API Gemini 3.5 Flash pour les développeurs

Disponible aux États-Unis uniquement (au 3 juin 2026) :

Daily Brief (AI Plus, Pro, Ultra)
Agents d’information dans Search (prévus été 2026, AI Pro et Ultra)
Gmail Live (prévu été 2026, AI Pro et Ultra)
Gemini Spark (bêta Ultra, déployé semaine du 26 mai 2026)
Universal Cart (prévu été 2026)
Mini-apps dans Search (prochains mois, AI Pro et Ultra)

En cours de déploiement progressif :

Gemini Intelligence sur Android (été 2026, Galaxy S26 et Pixel 10 en premier)
Android Halo (fin 2026)
Gemini 3.5 Pro (juin 2026)
Docs Live et Google Keep IA (été 2026, AI Pro et Ultra)
Intégration MCP tiers pour Gemini Spark (été 2026)

Confidentialité et limites

Contrôle de vos données

Personal Intelligence, la fonctionnalité qui connecte Gemini à vos applications Google (Gmail, Photos, YouTube, Search), est désactivée par défaut. Vous choisissez de l’activer, vous décidez quelles applications connecter, et vous pouvez la désactiver à tout moment. Cette bêta est actuellement réservée aux abonnés AI Pro et Ultra aux États-Unis ; elle n’est pas disponible pour les comptes Google Workspace.

Hallucinations et fiabilité

Comme tous les grands modèles de langage, Gemini peut produire des informations incorrectes ou inventées — phénomène connu sous le terme d’hallucination. Cette limite s’applique particulièrement aux données récentes, aux faits précis et aux chiffres. Il est recommandé de vérifier les informations importantes générées par Gemini dans un contexte professionnel ou académique.

Dépendance à l’écosystème Google

La plupart des fonctionnalités les plus avancées de Gemini fonctionnent mieux, voire uniquement, dans l’écosystème Google : Android, Chrome, Gmail, Google Docs, YouTube. Les utilisateurs d’iPhone, de Microsoft 365 ou d’autres environnements bénéficient d’une expérience plus limitée, même si Google travaille à élargir les intégrations (notamment via MCP).

Barrières linguistiques et géographiques

Toutes les fonctionnalités Gemini ne sont pas disponibles en français ni en France. Les nouvelles fonctionnalités sont souvent lancées en anglais aux États-Unis, puis déployées progressivement dans d’autres langues et régions. Consultez la page de notes de version officielle de Gemini pour connaître les disponibilités à jour.

Faut-il utiliser Google Gemini ?

La question n’est peut-être plus tout à fait la bonne. Pour les utilisateurs d’Android et des services Google, Gemini fait déjà partie de l’expérience quotidienne, qu’on le veuille ou non.

Pour les utilisateurs occasionnels, la version gratuite de l’application Gemini offre un accès à un modèle de qualité frontière pour la rédaction, la recherche, la traduction et la programmation. Pour ceux qui utilisent intensément Google Workspace, l’abonnement AI Pro apporte une vraie valeur ajoutée. Pour les développeurs et créateurs, AI Ultra et l’API Gemini ouvrent des possibilités bien plus larges.

En revanche, si vous privilégiez la diversité des outils, la souveraineté des données ou une expérience multiplateforme, des alternatives comme ChatGPT ou Claude peuvent mieux convenir selon les usages. Le marché des IA génératives est suffisamment mature en 2026 pour qu’aucune solution ne soit universellement supérieure sur tous les critères.

Ce qui est certain, c’est que Gemini occupe une position structurelle unique : aucun autre assistant IA n’est aussi profondément intégré à un écosystème aussi utilisé mondialement. C’est à la fois sa force principale et sa principale limite pour qui cherche à ne pas dépendre d’un seul acteur.

FAQ : tout ce que vous voulez savoir sur Google Gemini

Qu’est-ce que Google Gemini ?

Google Gemini est la famille de modèles d’intelligence artificielle développée par Google DeepMind. C’est à la fois un ensemble de modèles de langage multimodaux (texte, image, audio, vidéo, code) et l’écosystème de produits qui les exploite : l’application Gemini, l’intégration dans Google Search, Android, Gmail, YouTube et d’autres services Google.

Gemini remplace-t-il Google Assistant ?

Progressivement, oui. Google déploie Gemini en remplacement de Google Assistant sur Android et dans d’autres produits. Cette transition est en cours et s’accélère avec Gemini Intelligence. Google Assistant reste disponible sur certains appareils anciens et surfaces spécifiques.

Gemini est-il gratuit ?

Une version gratuite existe et donne accès à Gemini 3.5 Flash pour des usages courants. Les fonctionnalités avancées — Gemini Spark, Daily Brief, Deep Research étendu, création vidéo avec Gemini Omni, intégrations Workspace — nécessitent un abonnement Google AI Plus, Pro ou Ultra.

Quelle est la différence entre Gemini et ChatGPT ?

Les deux sont des assistants IA généralistes. La différence principale réside dans l’intégration : Gemini est profondément intégré aux services Google (Search, Android, Gmail, YouTube), ce qui lui confère un avantage structurel dans cet écosystème. ChatGPT, développé par OpenAI, offre une intégration plus large à des outils tiers et une expérience souvent jugée plus mature sur certaines tâches créatives. Les performances varient selon les versions et les tâches.

Gemini fonctionne-t-il sur Android ?

Oui. L’application Gemini est disponible sur Android et remplace progressivement Google Assistant. En 2026, Google a annoncé Gemini Intelligence, une couche IA proactive intégrée directement dans Android permettant l’automatisation de tâches multi-applications, la navigation web intelligente dans Chrome et la création de widgets en langage naturel. Le déploiement commence à l’été 2026 sur les Galaxy S26 et Pixel 10.

Gemini peut-il créer des images et des vidéos ?

Oui. Gemini peut générer des images via le modèle Imagen, accessible dans l’application pour les abonnés payants. Pour la vidéo, Gemini Omni Flash permet de générer et d’éditer de la vidéo à partir de texte, d’images ou d’autres médias. Cette fonctionnalité est disponible pour les abonnés AI Plus, Pro et Ultra via l’application Google Flow et YouTube Shorts.

Gemini est-il fiable ?

Gemini est performant, mais comme tous les systèmes de ce type, il peut produire des informations inexactes ou inventées. Il convient de vérifier les informations importantes, notamment les faits précis, les chiffres et les données récentes. Pour la recherche approfondie, Deep Research intègre des sources web vérifiables, ce qui améliore la traçabilité des informations.

Que change Google I/O 2026 pour Gemini ?

Google I/O 2026 a marqué le passage de Gemini d’un assistant conversationnel à un agent actif. Les principales nouveautés sont : Gemini 3.5 Flash (déployé le 19 mai), Gemini Spark (agent personnel 24h/24), Gemini Omni (génération vidéo), la refonte de l’interface Neural Expressive, Daily Brief, les agents d’information dans Search, et la révision du modèle tarifaire avec AI Ultra à partir de 100 $/mois.

Ce qu’il faut retenir en 2026

Google Gemini n’est plus un produit distinct : c’est l’intelligence artificielle qui structure l’ensemble de la stratégie Google. Avec plus de 900 millions d’utilisateurs mensuels annoncés à Google I/O 2026, Gemini est devenu en deux ans l’une des IA les plus déployées au monde. Sa force ne tient pas à un modèle particulier, mais à son intégration : il est présent là où les utilisateurs passent déjà leur temps — Google Search, Android, Gmail, YouTube, Chrome.

Les annonces de 2026 franchissent une nouvelle étape en faisant de Gemini un agent qui agit, pas seulement un assistant qui répond.

C’est un pari ambitieux sur la proactivité et la délégation de tâches, dont la réussite dépendra autant de la confiance des utilisateurs que des performances techniques. Et dont le déploiement réel, notamment hors États-Unis, reste encore à démontrer.

Lire plus

Intelligence Artificielle

Microsoft ACS : un standard open source pour mieux contrôler les agents IA

par Yohann Poiron le 3 juin 2026

À mesure que les agents IA deviennent plus autonomes, une question devient centrale pour les entreprises : comment s’assurer qu’ils agissent toujours dans les limites prévues ? Avec l’Agent Control Specification, ou ACS, Microsoft veut apporter une réponse structurée à ce nouveau défi de gouvernance.

Présenté à la Build 2026 comme un standard open source, ACS permet aux équipes de développement, de sécurité et de conformité de définir précisément ce qu’un agent peut faire, ce qu’il doit éviter, quand une validation humaine est nécessaire et quelles preuves doivent être conservées.

Microsoft ACS : Des règles de contrôle portables

Aujourd’hui, les garde-fous des agents IA reposent souvent sur des prompts système, du code personnalisé ou des filtres ajoutés au cas par cas. Cela fonctionne, mais crée des contrôles fragmentés, difficiles à auditer et rarement réutilisables.

ACS propose une couche commune de gouvernance. Les règles peuvent être regroupées dans des fichiers de politiques, capables de suivre l’agent d’un environnement à l’autre.

Des vérifications à chaque étape du workflow

Microsoft prévoit plusieurs points d’interception dans le parcours d’un agent :

Avant la réception d’une entrée utilisateur
Avant l’appel à un outil externe
Après le retour d’un outil
Avant la réponse finale

À chaque étape, une politique peut autoriser l’action, la bloquer, masquer des données sensibles ou demander une approbation humaine.

Un SDK compatible avec les grands frameworks IA

ACS sera proposé sous forme de SDK avec des plugins pour LangChain, OpenAI Agents SDK, Anthropic Agents SDK, AutoGen, CrewAI, Semantic Kernel, Microsoft.Extensions.AI, MCP tools et d’autres environnements.

Cette compatibilité large montre l’ambition de Microsoft : faire d’ACS une couche de contrôle transversale, au-delà de son propre écosystème.

L’agent IA a besoin d’un permis de conduire

Avec ACS, Microsoft ne cherche pas seulement à rendre les agents plus puissants. Il veut les rendre gouvernables. C’est une étape essentielle pour leur adoption en entreprise. Un agent capable d’agir dans plusieurs applications peut devenir extrêmement utile, mais aussi dangereux s’il sélectionne le mauvais outil, expose des données sensibles ou déclenche une action non validée.

ACS pourrait donc devenir pour les agents IA ce que les politiques de sécurité sont devenues pour le cloud : une infrastructure invisible, mais indispensable.

Lire plus

Sony imagine une manette PlayStation modulaire avec écran détachable : un brevet dévoile un concept inédit

Attention à cette arnaque : de faux e-mails de sécurité X cherchent à voler votre mot de passe

Apple poursuit d’anciens employés liés à OpenAI… mais évite soigneusement de citer Jony Ive

Xbox relance sa stratégie d’exclusivités : Microsoft confirme le retour des jeux réservés à ses consoles

Test de la HUAWEI Watch Fit 5 Pro : l’Apple Watch de ceux qui ne veulent pas d’Apple Watch

Test de la HUAWEI Watch GT Runner 2 : La montre qui veut détrôner Garmin

Test du DJI ROMO P : DJI réussit-il son premier robot aspirateur haut de gamme ?

Test de NotebookLM : L’application de Google est-elle le copilot IA rêvé ?

Hisense A10 : le smartphone E Ink dévoile de nouvelles caractéristiques avant son lancement

Samsung lance la Galaxy Card : une carte bancaire pour renforcer son écosystème aux États-Unis

Galaxy Z Fold 8 : de nouvelles photos en conditions réelles confirment le design compact du futur pliable de Samsung

Adobe teste AI Playground dans Project Indigo : une nouvelle expérience photo dopée à l’IA sur iPhone

Google travaillerait sur Frozen v2, une puce IA dédiée à Gemini gravée directement dans le silicium

Alibaba présente Qwen3.8-Max Preview, son nouveau modèle d’IA de 2 400 milliards de paramètres

ASML accélère la production de ses machines EUV pour répondre à la demande mondiale en IA

OpenAI renforce la sécurité de ChatGPT pour les adolescents avec de nouveaux contrôles parentaux et un mode d’étude

Samsung Display lance un écran OLED tandem pour PC avec une luminosité record de 1 600 nits

Samsung GAIA : une nouvelle architecture IA pourrait transformer les futures puces Exynos

DJI Osmo 360 II : les premières fuites révèlent une batterie plus grande et le NFC

Google travaillerait sur Frozen v2, une puce IA dédiée à Gemini gravée directement dans le silicium

Google AI Studio simplifie le déploiement des applications avec des URL personnalisées

Claude Code ajoute un navigateur intégré pour consulter la documentation sans quitter l’IDE

Google Agents CLI : l’outil qui transforme Claude Code et Codex en experts des agents IA

Meta Pocket : créez des mini-jeux avec l’IA simplement en les décrivant

Comment réserver votre nom de profil WhatsApp ?

Claude Cowork : Le guide complet pour automatiser votre quotidien en 2026

Intel Core Ultra vs Apple Silicon : Quelle philosophie choisir pour votre prochain bureau compact ?

Comment arrêter le suivi des e-mails dans Gmail ?

Intelligence Artificielle

Google travaillerait sur Frozen v2, une puce IA dédiée à Gemini gravée directement dans le silicium

Alibaba présente Qwen3.8-Max Preview, son nouveau modèle d’IA de 2 400 milliards de paramètres

ASML accélère la production de ses machines EUV pour répondre à la demande mondiale en IA

OpenAI renforce la sécurité de ChatGPT pour les adolescents avec de nouveaux contrôles parentaux et un mode d’étude

ChatGPT améliore enfin sa recherche : retrouver une conversation, un document ou une image devient beaucoup plus simple

Gemini Pro accumule les retards : Google peine à suivre OpenAI et Anthropic sur l’IA dédiée au code