OpenAI vient d’officialiser GPT-5.4, nouvelle itération de son modèle phare, avec une promesse claire : moins de « chat », plus d’action.

Au programme : meilleurs scores en raisonnement et en code, mais surtout une capacité plus directe à interagir avec un ordinateur (captures d’écran, navigateur, clavier/souris) pour exécuter des workflows multi-étapes — le genre de tâches qui exigeait encore un humain au milieu du circuit.

La nouveauté qui change la nature du produit : le « computer use » natif

Là où les précédentes versions excellaient à décrire quoi faire, GPT-5.4 est présenté comme plus apte à le faire : lire une interface via screenshot, naviguer dans un navigateur, et enchaîner des actions sur des apps/outils pour terminer une tâche (recherche, formulaires, organisation, automatisation). C’est la brique qui rapproche le modèle d’un agent plutôt que d’un assistant conversationnel.

OpenAI affirme que GPT-5.4 est son modèle le plus fiable à ce jour, avec des affirmations individuelles ~33 % moins susceptibles d’être fausses que GPT-5.2, et des réponses complètes moins susceptibles de contenir des erreurs. C’est un point stratégique : si l’IA doit agir, elle doit d’abord se tromper moins.

GPT-5.4 Thinking : une couche « raisonnement » avec pilotage en cours de route

En parallèle, OpenAI introduit GPT-5.4 Thinking dans ChatGPT : un mode pensé pour les problèmes plus difficiles, qui affiche un aperçu structuré de l’approche (un plan/outline) et permet à l’utilisateur de corriger le tir pendant l’exécution sans repartir de zéro. Autrement dit, on passe d’un modèle qui répond, à un modèle qui travaille sous supervision légère.

Pour les développeurs : un modèle « frontier » plus orienté workflows

Côté dev, OpenAI positionne GPT-5.4 comme une synthèse des progrès récents en coding et en « workflows agentique », avec une intégration renforcée dans l’API et des outils comme Codex (où les tâches longues et parallélisées prennent tout leur sens).

Déploiement : web + Android d’abord, iOS « bientôt »

D’après les annonces relayées, GPT-5.4 et GPT-5.4 Thinking arrivent sur ChatGPT (web et Android), avec une disponibilité iOS annoncée « prochainement ». Une variante GPT-5.4 Pro est aussi mise en avant pour les usages « maximum performance », côté entreprises/éducation et via l’API.

Le message implicite est puissant : OpenAI ne cherche plus seulement à gagner des benchmarks, mais à transformer ChatGPT en couche d’exécution au-dessus de vos outils (web, docs, tableurs, services). Le « computer use » est un pari produit : si l’IA sait lire l’interface comme un humain, elle peut travailler dans presque n’importe quel logiciel — sans intégration sur mesure.

Reste l’enjeu évident : plus un agent peut agir, plus la question de la sécurité (permissions, confirmations, traçabilité) devient centrale. OpenAI publie d’ailleurs une system card dédiée au mode Thinking, signe que la boîte veut cadrer ce saut d’autonomie avec un discours de gouvernance.