Richard Socher, un nom connu de l’IA, a sorti Recursive Superintelligence de l’ombre avec une levée de 552 millions d’euros. La startup, installée à San Francisco et Londres, veut construire une IA capable de mener seule ses propres recherches et améliorations. L’enjeu, c’est de dépasser la saturation actuelle des modèles et de livrer des produits concrets d’ici mi-2026.
À retenir
- Recursive Superintelligence a levé 552 millions d’euros quatre mois après sa création, valorisée à 3,95 milliards d’euros.
- L’objectif est d’automatiser entièrement l’idéation, l’implémentation et la validation des progrès en IA.
- Première version d’un système d’entraînement autonome prévue pour mi-2026.
- Concept clé : « open-endedness », qui permet aux systèmes de découvrir de nouvelles tâches sans données humaines figées.
- Risque principal identifié : le « reward hacking », où l’IA atteint ses objectifs par des moyens imprévus.
Une arrivée discrète, mais très financée
Richard Socher a décidé de reprendre la main après plusieurs années passées chez Salesforce et Meta. Avec Recursive Superintelligence, il réunit d’anciens chercheurs d’OpenAI, de Google DeepMind et de Meta FAIR. Leur pari est simple : remplacer l’amélioration humaine progressive par une boucle entièrement automatisée.

Un financement éclair qui reflète les attentes du marché
La startup a atteint une valorisation de 3,95 milliards d’euros seulement quatre mois après son incorporation. Les tours de table ont été conduits par GV et Greycroft, avec la participation de Nvidia et d’AMD Ventures. Ce niveau d’argent montre clairement le pari du moment : les investisseurs financent d’abord le mécanisme d’auto-amélioration, pas encore un produit final immédiat.
Une équipe conçue pour la rapidité d’exécution
Tim Rocktäschel et Yuandong Tian complètent le trio fondateur. Leur présence apporte à la fois une solide maîtrise des modèles génératifs et une expérience concrète des infrastructures à grande échelle. L’entreprise dit vouloir livrer des résultats visibles en quelques trimestres, pas en plusieurs années.
Refermer la boucle de l’auto-amélioration
Jusqu’ici, les progrès des modèles reposaient sur des ajustements humains constants. Recursive Superintelligence veut casser cette dépendance en faisant en sorte que l’IA génère elle-même ses prochains axes de recherche, les code, les teste et valide les gains.
Automatiser la méthode scientifique
Le système doit maîtriser tout le cycle : proposer une idée, l’implémenter, mesurer les résultats et itérer sans intervention externe. L’idée est de contourner le ralentissement logarithmique observé quand on se contente d’ajouter du calcul et des données.
Cibler l’expertise de dizaines de milliers de spécialistes
La première étape consiste à entraîner un modèle équivalent aux connaissances cumulées de 50 000 médecins, mais appliqué à la recherche en IA. L’objectif est d’identifier vite les limites actuelles et d’y répondre sans attendre les retours humains.
Une nouvelle approche : l’open-endedness et le rainbow teaming
Plutôt que de poursuivre une simple augmentation des ressources, l’équipe mise sur des mécanismes inspirés de l’évolution biologique. Deux systèmes s’affrontent en continu pour découvrir de nouvelles stratégies et corriger leurs faiblesses respectives.

Le « rainbow teaming », un duel permanent
Un premier modèle attaque sans cesse le second pour faire apparaître des failles. Le système attaqué doit alors les corriger de manière autonome avant de repasser à l’offensive. Cette technique crée une innovation continue qui échappe aux benchmarks humains figés.
Franchir la « barrière de l’information »
Au-delà d’un certain seuil, la production humaine de connaissances ne suffit plus à intégrer les découvertes. Les algorithmes open-ended permettent à l’IA d’explorer des directions inattendues et de réécrire une partie de son propre code pour gagner en efficacité.
Sécurité et perspective commerciale
Richard Socher écarte les craintes d’une explosion incontrôlée en rappelant que les objectifs restent définis par les humains. La sécurité repose sur des tests automatisés continus plutôt que sur des garde-fous figés à l’avance.
Des risques techniques à surveiller
Le principal danger identifié reste le reward hacking : l’IA peut trouver des raccourcis inattendus pour maximiser ses récompenses. L’équipe prévoit d’intégrer des mécanismes de vérification permanents pour détecter ces comportements déviants.
Une livraison annoncée pour mi-2026
La première version publique d’un système d’entraînement autonome est prévue pour le milieu de l’année. Cette échéance oblige l’entreprise à montrer vite que la récursion produit des résultats exploitables, pas seulement des promesses théoriques.
















Laisser un commentaire
Vous devez vous connecter pour publier un commentaire.