Pendant des années, la question centrale autour de l’intelligence artificielle était simple : que peut-elle faire ? Aujourd’hui, une autre interrogation devient tout aussi importante : que devrait-elle être autorisée à faire ?
Avec l’arrivée du mode verrouillé, OpenAI apporte une réponse claire. Cette nouvelle fonctionnalité de sécurité, désormais disponible pour tous les utilisateurs de ChatGPT, réduit volontairement certaines capacités avancées de l’assistant afin de mieux protéger les données sensibles contre les attaques modernes ciblant les systèmes d’IA.
Une approche qui illustre l’évolution du marché : l’enjeu n’est plus seulement de rendre l’IA plus puissante, mais aussi plus sûre.
Une réponse aux attaques par injection de prompt
Le mode verrouillé a été conçu pour limiter les risques liés aux attaques dites de prompt injection. Contrairement aux cyberattaques classiques qui ciblent directement un logiciel ou une infrastructure, ces attaques exploitent les contenus eux-mêmes. Des instructions malveillantes peuvent être dissimulées dans une page web, un document, un e-mail ou une feuille de calcul afin de manipuler le comportement d’un modèle d’intelligence artificielle.
Si l’IA suit ces instructions cachées, elle peut potentiellement divulguer des informations sensibles ou effectuer des actions non souhaitées.

OpenAI reconnaît qu’aucun système ne peut aujourd’hui détecter parfaitement toutes les formes de prompt injection. L’objectif du mode verrouillé est donc différent : réduire drastiquement les possibilités d’exfiltration de données lorsqu’une attaque parvient malgré tout à contourner les protections existantes.
Un ChatGPT beaucoup plus isolé
Une fois activé, le mode verrouillé transforme profondément le fonctionnement de ChatGPT.
L’assistant perd notamment plusieurs de ses fonctions les plus avancées :
- Navigation web en temps réel désactivée
- Recherche approfondie (Deep Research) indisponible
- Agent Mode désactivé
- Téléchargement de fichiers bloqué
- Connexions réseau générées via Canvas interdites
- Récupération d’images depuis Internet désactivée
En pratique, ChatGPT devient une IA beaucoup plus autonome et moins connectée à l’extérieur. L’objectif est simple : limiter le nombre de points d’entrée et de sortie potentiels par lesquels des informations confidentielles pourraient circuler.
Une fonctionnalité pensée pour les utilisateurs sensibles
OpenAI ne cache pas que cette fonctionnalité ne concerne pas la majorité des utilisateurs. À bien des égards, le mode verrouillé rappelle le mode du même nom introduit par Apple sur iPhone pour protéger les personnes exposées à des cyberattaques particulièrement sophistiquées.
Le principe est identique : sacrifier une partie du confort d’utilisation afin de maximiser la sécurité.
Pour un utilisateur classique, perdre l’accès à la navigation web ou aux fonctions d’agent intelligent représente une limitation importante. Pour une entreprise manipulant des données confidentielles, des documents stratégiques ou des informations réglementées, ce compromis peut au contraire devenir très attractif.

L’IA entre dans une nouvelle phase de maturité
Cette annonce dépasse largement le cadre d’une simple fonctionnalité. Elle révèle une transformation profonde du secteur de l’intelligence artificielle. Jusqu’à présent, les grands acteurs technologiques rivalisaient principalement pour rendre leurs assistants toujours plus capables, plus autonomes et plus connectés.
Aujourd’hui, la question évolue.
À mesure que les IA gagnent accès aux applications, aux systèmes internes, aux bases documentaires et aux services professionnels, les entreprises commencent à se demander jusqu’où cette autonomie doit réellement aller.
OpenAI choisit ici une approche pragmatique : laisser l’utilisateur décider.
Un nouvel enjeu pour l’industrie de l’IA
Les logiciels traditionnels sont conçus pour protéger les utilisateurs contre des programmes malveillants. Les systèmes d’IA doivent désormais relever un défi inédit : se protéger contre des informations malveillantes.
Cette différence est fondamentale.
Une attaque peut être cachée dans une simple phrase, un document apparemment anodin ou une page web parfaitement légitime. C’est précisément cette difficulté qui pousse OpenAI à considérer la prompt injection comme un problème de recherche encore non résolu.
Le mode verrouillé ne prétend pas éliminer ce risque. Il cherche à en limiter les conséquences.
Un aperçu du futur de la sécurité IA
Pour les entreprises, la fonctionnalité devient encore plus stratégique. Les administrateurs peuvent définir des rôles spécifiques, contrôler les applications autorisées, limiter les intégrations externes et encadrer précisément les actions que les utilisateurs peuvent effectuer.
Cette granularité annonce probablement la prochaine étape de l’intelligence artificielle en entreprise : des systèmes puissants, mais modulables, capables d’adapter leur niveau d’autonomie selon le contexte.
La meilleure IA n’est pas toujours celle qui fait tout
Depuis deux ans, l’industrie s’est concentrée sur les démonstrations spectaculaires : agents autonomes, assistants capables de réserver des voyages, générer du code ou piloter des applications. Le mode verrouillé rappelle une vérité plus discrète, mais essentielle. La valeur d’une IA ne se mesure pas uniquement à ce qu’elle est capable de faire, mais aussi à sa capacité à respecter les limites qu’on lui impose.
À mesure que les assistants intelligents deviennent de véritables acteurs du quotidien numérique, la possibilité de réduire volontairement leurs pouvoirs pourrait s’avérer aussi importante que les nouvelles capacités elles-mêmes.
Parfois, l’intelligence la plus utile n’est pas celle qui agit partout. C’est celle qui sait quand ne pas agir.



