SIMA 2 une IA pour les mondes 3D qui joue aux jeux vidéos

·

·

SIMA 2 apporte un chemin vers l'IA générale dans les mondes 3D
Résumer cet article avec :

Google DeepMind a dévoilé jeudi SIMA 2, un agent d’IA conçu pour naviguer et raisonner dans des mondes virtuels 3D, marquant un bond vers l’intelligence artificielle générale. Successeur de SIMA 1 lancé en mars 2024, ce système double les performances de son prédécesseur en atteignant 65 % de taux d’achèvement des tâches, s’approchant ainsi du niveau d’un joueur humain. Cette avancée, annoncée le 13 novembre 2025, ouvre des perspectives pour la robotique en simulant des interactions incarnées.

À retenir

  • Google DeepMind lance SIMA 2, un agent IA pour mondes virtuels 3D, le 13 novembre 2025.
  • Alimenté par le modèle Gemini, il interprète instructions texte, voix ou images et explique ses étapes.
  • Performance doublée à 65 % de réussite contre 31 % pour SIMA 1.
  • Capable de généralisation inter-jeux et d’apprentissage autonome via self-directed play.
  • Testé dans ASKA et MineDojo, avec implications pour la robotique et l’AGI.
  • Disponible en research preview limitée pour développeurs et universitaires.

Au-delà d’un simple outil de jeu, SIMA 2 incarne une innovation clé dans la course à l’AGI, l’intelligence artificielle générale capable de s’adapter à tout environnement comme un humain. Lancé par Google DeepMind au moment où les agents IA passent de l’exécution basique à la planification autonome, ce projet répond à un enjeu majeur pour les chercheurs et développeurs : tester des compétences transférables du virtuel au réel. Pour les acteurs de l’IA en Europe, où la souveraineté numérique est un enjeu croissant, SIMA 2 souligne l’importance d’agents open à la collaboration, tout en posant des questions sur la sécurité des systèmes incarnés. Son impact se mesure déjà dans la démocratisation des outils d’entraînement pour la robotique, rendant accessible une expertise autrefois confinée aux labs géants.

L’innovation de SIMA 2 : un agent multiworld plus intelligent

DeepMind positionne SIMA 2 comme un pas décisif vers des agents IA polyvalents, en s’appuyant sur des environnements virtuels pour simuler des interactions complexes.

L’annonce et le contexte vers l’AGI

Le 13 novembre 2025, Google DeepMind a présenté SIMA 2, ou Scalable Instructable Multiworld Agent 2, en successeur direct de SIMA 1 apparu en mars 2024. Cet agent d’IA généraliste cible les mondes virtuels 3D, allant au-delà des scripts simples pour devenir un compagnon de jeu interactif. L’objectif affiché est clair : approcher l’intelligence artificielle générale (AGI), où l’IA raisonnerait et s’adapterait comme un humain dans des contextes variés.

DeepMind décrit SIMA 2 comme un embodied agent, c’est-à-dire un système incarné qui observe et agit via des interfaces visuelles, mimant les perceptions humaines. Contrairement aux modèles purement textuels, il opère dans des espaces 3D dynamiques, posant les bases pour des applications en navigation et robotique. La recherche, diffusée en preview limitée aux développeurs et universitaires, invite à une collaboration ouverte pour raffiner ces capacités.

SIMA 2 dans un monde virtuel 3D

Les capacités fondamentales : raisonnement et collaboration

SIMA 2 excelle dans l’interprétation d’objectifs de haut niveau, transformant une instruction vague en plan d’action détaillé. Il peut recevoir des directives par texte, voix ou images, puis expliquer verbalement les étapes prévues, favorisant une interaction fluide avec un utilisateur. Dans un jeu comme ASKA, un titre de survie viking, l’agent identifie des ressources et priorise des tâches sans guidance préalable.

Sa force réside dans la collaboration : SIMA 2 ajuste ses actions en temps réel face à des inputs humains, comme un coéquipier virtuel. Testé aussi sur MineDojo, une version recherche de Minecraft, il démontre une adaptation à des environnements inédits générés par Genie 3, outil de DeepMind lancé en août 2025. Cette polyvalence marque un virage vers des agents multiworld, capables de sauter d’un univers à l’autre sans réentraînement massif.

Les développeurs soulignent déjà son potentiel pour des simulations éducatives ou thérapeutiques, où l’IA guide sans dominer. Pourtant, cette interactivité exige une vigilance sur les biais hérités des données d’entraînement.

Architecture et impacts : du virtuel vers le monde réel

En intégrant des avancées en apprentissage autonome, SIMA 2 ne se contente pas d’exécuter ; il évolue, avec des implications profondes pour l’efficacité des systèmes IA en robotique.

L’intégration de Gemini comme moteur de raisonnement

Au cœur de SIMA 2 bat le modèle Gemini de Google, transformé en reasoning engine pour infuser du raisonnement à l’agent. Contrairement à SIMA 1, limité à des instructions basiques, cette version élève l’IA au rang de penseur indépendant. Gemini analyse les visuels 3D en temps réel, reliant observations à des actions logiques, comme extraire du minerai dans un jeu.

Cette architecture hybride, mêlant grands modèles de langage (LLM) à des boucles de perception-action, accélère la généralisation. L’agent transfère des compétences : le concept de « minage » appris dans un titre s’applique à la « récolte » dans un autre. DeepMind met en avant cette généralisation inter-jeux comme un benchmark pour l’AGI, testable dans des mondes créés à la volée par Genie 3.

Interface et capacités de SIMA 2

Mécanismes d’apprentissage autonome et performance

SIMA 2 passe d’un suiveur d’instructions à un système en jeu auto-dirigé, générant ses propres tâches via essai-erreur. Après des démonstrations humaines initiales, il boucle sur lui-même : il tente une action, évalue via Gemini-based feedback, et enrichit ses données. Ce processus, nourri de trajectoires auto-générées, renforce l’apprentissage autonome sans intervention constante.

Les résultats chiffrent l’impact : taux d’achèvement de 65 %, doublant les 31 % de SIMA 1, et jugé « nettement plus proche d’un joueur humain ». Joe Marino, chercheur senior chez DeepMind, qualifie cela de

étape de changement et d’amélioration des capacités

pour un agent plus général dans des environnements inédits. Dans MineDojo, il planifie des séquences multi-étapes, comme construire un abri, avec une précision accrue.

Enjeux pour la robotique et limites identifiées

Comme embodied agent, SIMA 2 sert de banc d’essai pour la robotique : ses compétences en navigation 3D migrent vers des robots physiques, gérant observation et action en boucle. DeepMind voit dans ces mondes virtuels un « terrain d’essai crucial » pour l’intelligence générale, transferable à des tâches réelles comme l’exploration ou l’assistance. En Europe, où les régulations sur l’IA embodied se durcissent, cela pousse à des standards de sécurité pour éviter les dysfonctionnements imprévus.

Cependant, les limites tempèrent l’enthousiasme : SIMA 2 peine sur les tâches très longues et multi-étapes, avec une fenêtre de mémoire limitée qui altère la cohérence sur la durée. L’interprétation visuelle pose des défis, typiques des IA 3D, et le passage au réel exigerait de maîtriser la physique imprévisible, les contraintes sécuritaires et les environnements chaotiques. Marino admet que ces faiblesses soulignent la distance restante vers une AGI robuste, invitant à une recherche prudente.

DeepMind prévoit d’étendre ces tests, potentiellement intégrant SIMA 2 à des plateformes open-source pour accélérer l’innovation collaborative.


Sur le même Thème :

Laisser un commentaire