fermer
Intelligence Artificielle

Google DeepMind lance SIMA 2, l’agent ia capable de raisonner et de planifier dans les jeux vidéo

Google DeepMind lance SIMA 2, l'agent ia capable de raisonner et de planifier dans les jeux vidéo
Google DeepMind lance SIMA 2, l'agent ia capable de raisonner et de planifier dans les jeux vidéo

Un an après avoir présenté le premier SIMA — un agent capable de suivre plus de 600 instructions simples à travers plusieurs mondes virtuels — Google DeepMind revient avec une version nettement plus ambitieuse.

SIMA 2 marque un virage décisif : il ne s’agit plus seulement d’obéir à des commandes comme « tourne à gauche » ou « ouvre la carte », mais d’un véritable agent capable de raisonner, planifier, comprendre un objectif global et même progresser par lui-même.

Du simple exécuteur au raisonneur capable d’expliquer ses actions

DeepMind a injecté Gemini au cœur de SIMA 2, et cela change tout. L’agent n’analyse plus seulement des commandes : il interprète des intentions, explique ses propres choix, et peut décrire étape par étape la façon dont il compte atteindre un objectif. L’entraînement repose à la fois sur des vidéos humaines annotées — comme pour la première génération — mais aussi sur des labels générés automatiquement par Gemini.

UsqTitVvxI5r3 oOUWFvWbJl9Wy 1Z8z scaled

SIMA 2 comprend mieux les longues chaînes d’actions, accepte des dessins ou croquis comme instructions, répond en plusieurs langues, et peut même réagir à des indications en emoji. C’est un agent beaucoup plus souple, capable d’interactions quasi humaines.

Il s’adapte à des jeux qu’il n’a jamais vus

Là où SIMA 1 restait très dépendant des environnements sur lesquels il avait été entraîné, SIMA 2 montre une vraie capacité de généralisation.

L’agent est parvenu à suivre des instructions complexes dans ASKA, un jeu de survie viking, ou dans MineDojo — un environnement de recherche inspiré de Minecraft — alors même qu’il n’avait jamais été spécifiquement entraîné sur ces jeux.

Mieux encore, SIMA 2 transfère ses connaissances d’un monde à l’autre : ce qu’il a appris sur l’extraction de ressources dans un jeu peut lui servir pour « récolter » dans un autre. Une première étape vers des compétences réellement transversales.

Avec Genie 3, SIMA explore aussi des mondes générés à la volée

DeepMind pousse l’expérience plus loin en couplant SIMA 2 à Genie 3, son générateur de mondes 3D en temps réel. L’agent peut ainsi entrer dans un environnement créé sur la base d’une simple image ou d’un prompt textuel et y naviguer comme s’il s’agissait d’un vrai jeu.

Cette capacité d’adaptation à des univers totalement nouveaux est précisément ce que recherchent les chercheurs en « embodied AI ».

Une IA qui apprend seule en jouant

L’une des nouveautés les plus intéressantes est la capacité de SIMA 2 à progresser sans aide humaine. Après une phase initiale supervisée, l’agent génère lui-même ses données d’entraînement en explorant les environnements, en tentant des actions, en échouant, puis en réessayant.

DeepMind parle ici d’un cycle vertueux : chaque version de SIMA s’appuie sur les expériences collectées par la précédente. Cela permet d’augmenter graduellement la difficulté des tâches et d’élargir les scénarios sans mobiliser plus d’annotateurs humains.

Les prémices d’une IA générale incarnée

Ce que SIMA 2 apprend dans les jeux — se déplacer, planifier, utiliser un outil, coordonner des actions — n’a rien d’anecdotique pour Google.

Ce sont précisément les briques fondamentales d’une intelligence incarnée capable, à terme, d’interagir avec le monde réel. DeepMind ne s’en cache pas : SIMA 2 est un laboratoire vivant pour les futurs robots autonomes, assistants intelligents et systèmes capables de comprendre l’espace, le mouvement et les objets.

Mais tout n’est pas encore réglé : l’agent reste limité sur les tâches très longues, la précision fine des actions, la compréhension visuelle complexe et la mémoire à long terme.

Un déploiement très limité et sous surveillance

SIMA 2 est pour l’instant réservé à quelques chercheurs et studios de jeux. DeepMind insiste sur un point : toute capacité d’auto-amélioration reste supervisée et surveillée de près. Les équipes cherchent d’ailleurs des retours interdisciplinaires pour encadrer ce type d’IA de manière responsable.

SIMA 2 n’est pas encore un agent général, mais il représente clairement l’une des avancées les plus concrètes vers des systèmes capables non seulement d’obéir, mais de comprendre, d’explorer… et de s’améliorer seuls.

Tags : DeepmindGoogle DeepMindSIMA 2
Yohann Poiron

The author Yohann Poiron

J’ai fondé le BlogNT en 2010. Autodidacte en matière de développement de sites en PHP, j’ai toujours poussé ma curiosité sur les sujets et les actualités du Web. Je suis actuellement engagé en tant qu’architecte interopérabilité.