OpenAI a officiellement rejoint la course aux agents autonomes avec le lancement de Operator en janvier 2025. Cet agent d’intelligence artificielle est conçu pour effectuer des tâches de manière autonome et vise à rivaliser avec des solutions comme Computer Use de Claude ou les agents Copilot de Microsoft.

Cependant, il est encore en phase de recherche et de prévisualisation, ce qui signifie qu’il pourrait évoluer avant d’être accessible à un plus large public.

Qu’est-ce que Operator ?

Operator est un agent capable de prendre des décisions et d’agir de manière autonome en fonction des informations disponibles. Contrairement aux programmes classiques, il ne se contente pas d’exécuter des commandes prédéfinies, mais analyse les conditfffions en temps réel et ajuste ses actions en conséquence.

Cet agent peut gérer des tâches complexes et multi-étapes, comme :

Prendre des notes et générer un résumé d’une réunion d’affaires.

Réserver un voyage complet, incluant vol, hôtel et location de voiture en fonction des emplois du temps familiaux.

Rechercher un sujet complexe et compiler automatiquement un rapport détaillé.

Là où Operator se distingue des autres agents, c’est dans son mode de fonctionnement. Contrairement à Claude ou Copilot, qui opèrent via une interface API ou un chat intégré, Operator exécute ses tâches dans un navigateur Web distant hébergé sur les serveurs d’OpenAI. Cela signifie que l’ordinateur de l’utilisateur n’est pas directement impliqué dans le processus et peut être utilisé normalement pendant qu’Operator travaille.

Quand et comment Operator a-t-il été lancé ?

OpenAI a dévoilé Operator le 23 janvier 2025, mais l’accès est très restreint pour l’instant. Seuls les abonnés Pro à 200 dollars/mois aux États-Unis peuvent l’essayer via le site operator.chatgpt.com.

OpenAI prévoit toutefois d’étendre son accès aux abonnés Plus, Team et Enterprise, ainsi que de l’intégrer directement dans ChatGPT à l’avenir.

Comment fonctionne Operator AI ?

Lorsque l’utilisateur active Operator depuis l’écran d’accueil de ChatGPT, une fenêtre de navigateur s’ouvre dans laquelle l’agent exécute ses tâches. L’IA fournit un suivi en temps réel de ses actions et l’utilisateur peut intervenir à tout moment pour reprendre la main.

Operator demande l’autorisation avant d’accomplir certaines tâches critiques, comme :

Se connecter à un site protégé (l’utilisateur doit entrer ses identifiants).

Effectuer un paiement en ligne.

Confirmer une réservation ou tout autre engagement nécessitant une validation.

L’agent interagit avec les sites web de deux manières :

Visuellement, en analysant les captures d’écran. Tactilement, en simulant les clics de souris et les frappes au clavier.

Que peut faire Operator AI aujourd’hui ?

Actuellement, Operator est limité aux tâches en ligne, comme :

Acheter des billets de concert.

Commander un repas sur DoorDash.

Remplir un panier d’achats sur Instacart.

Réserver un hôtel, un vol ou un restaurant.

Faire du shopping en ligne automatiquement.

Selon OpenAI, l’agent est conçu pour améliorer l’automatisation des tâches numériques quotidiennes et simplifier la navigation sur le Web.

Quelle est sa performance par rapport aux autres agents IA ?

OpenAI a comparé Operator aux autres modèles d’agents autonomes et affirme qu’il surpasse la concurrence dans plusieurs benchmarks :

Test OSWorld : Operator AI a obtenu 38,1 % de réussite contre 22 % pour Claude’s Computer Use API. (Les humains atteignent en moyenne 72 %).

Test WebVoyager : Operator a surpassé Google DeepMind Mariner avec un score de 87 % contre 83,5 %.

Test de navigation sur le web : Operator a largement devancé Claude’s Computer Use (56 %).

Cependant, les premiers retours des utilisateurs sont mitigés. Kevin Roose du New York Times a écrit : « Operator était souvent plus une contrainte qu’une aide. La plupart du temps, j’allais plus vite moi-même. Même quand ça fonctionnait, il demandait tellement de confirmations que j’avais l’impression de superviser l’employé le plus anxieux du monde ».

Comment essayer Operator AI ?

Pour tester Operator, il faut :

Résider aux États-Unis S’abonner à OpenAI Pro (200 dollars/mois). Accéder au site operator.chatgpt.com. Activer Operator depuis l’interface ChatGPT.

L’accès est pour l’instant limité aux États-Unis, mais OpenAI prévoit d’étendre progressivement l’expérience à d’autres régions et types d’abonnement.

Operator AI est-il le futur des assistants numériques ?

Operator AI marque une avancée majeure dans le développement des agents autonomes, mais il semble encore immature pour un usage grand public. L’idée de déléguer des tâches complexes à une IA est séduisante, mais les nombreuses confirmations demandées peuvent rapidement devenir frustrantes.

Cependant, si OpenAI améliore l’ergonomie et l’efficacité de l’agent, Operator pourrait bien devenir un assistant virtuel incontournable, capable de gérer des tâches numériques sans supervision constante.

Reste à voir si OpenAI réussira à convaincre les utilisateurs que son IA peut réellement leur faire gagner du temps… et pas l’inverse !