MemPalace promet 100 % sur LongMemEval, mais l’audit nuance ces perfs

·

·

Ordinateur portable affichant l’interface de MemPalace sur GitHub sur un bureau sombre, symbolisant le record sur LongMemEval et les audits techniques qui l’ont remis en cause.
Résumer cet article avec :

Milla Jovovich, connue pour Resident Evil et Le Cinquième Élément, a surpris la communauté IA en publiant MemPalace sur GitHub début avril 2026. Co-créé avec Ben Sigman, PDG de la plateforme Bitcoin Libre, le projet local-first promet de corriger l’amnésie des modèles de langage en s’appuyant sur la méthode des loci, issue de l’Antiquité. Le dépôt a dépassé les 34 000 étoiles en 72 heures, mais les audits techniques ont vite nuancé le récit d’un « record mondial à 100 % ».


À retenir

  • MemPalace structure la mémoire en « Ailes » (projets/personnes), « Salles » (sujets) et « Tiroirs » (contenu), inspirée de la Method of Loci.
  • Le projet revendiquait 100 % sur LongMemEval, ramené à 96,6 % après audit ; ce score mesure surtout ChromaDB, pas l’architecture hiérarchique.
  • La compression AAAK, présentée comme sans perte et 30x, tronque en réalité les textes à 55 caractères et fait tomber la précision à 84,2 %.
  • Entièrement local-first : SQLite + ChromaDB, sans coût API et avec un traitement local.
  • Intégration via le MCP (Model Context Protocol) : les agents comme Claude Code récupèrent le contexte en 170 à 900 tokens seulement.
  • Le lancement a aussi été accompagné d’un memecoin controversé ; ses créateurs ont nié toute implication.

Milla Jovovich fait vaciller le monde de l’IA open source

Quand on cherche « Milla Jovovich », on s’attend à voir des affiches de films, pas un dépôt GitHub. Pourtant, en quelques jours d’avril 2026, l’actrice est devenue l’un des noms les plus commentés de l’IA ouverte.

Sa collaboration avec Ben Sigman, connu dans les milieux Bitcoin, a aussitôt suscité des soupçons. Ses échanges directs sur le dépôt, via l’outil Claude Code, où elle participe au débogage et défend ses choix architecturaux, ont toutefois convaincu une partie de la communauté. Le ton reste technique, précis, et centré sur la façon dont le projet est construit.

Milla Jovovich assise dans un bureau moderne, concentrée sur un ordinateur portable ouvert sur le dépôt GitHub de MemPalace et un éditeur de code.
La présence active de Milla Jovovich sur le dépôt GitHub de MemPalace a fait vaciller le monde de l’IA open source.

Résultat : un engouement viral. Le dépôt a recueilli 34 000 étoiles en trois jours sur GitHub. Le nom MemPalace s’est retrouvé partout, porté à la fois par la notoriété de l’actrice et par la promesse d’une réponse à l’amnésie des IA.

Du palais mental à l’architecture des LLM

Le principe de MemPalace n’est pas nouveau : il reprend la méthode de Loci, une technique mnémotechnique utilisée par les orateurs grecs et romains. Au lieu d’entasser les souvenirs dans un espace plat, on les place mentalement dans un bâtiment que l’on connaît bien. Plus on avance dans ce bâtiment, plus le contexte se précise.

MemPalace transpose cette logique. Les données ne sont plus jetées dans une base vectorielle classique. Elles sont organisées de façon hiérarchique :

  • Les Ailes correspondent à des projets ou à des personnes
  • Les Salles regroupent des sujets
  • Les Tiroirs contiennent les documents originaux et leurs résumés

Cette approche modifie le RAG traditionnel, souvent réduit à une simple recherche vectorielle « plate », en un système spatial et contextuel. L’IA ne fouille plus dans un grand ensemble de vecteurs : elle sait dans quelle pièce aller.

Le tout fonctionne en local sur la machine de l’utilisateur. SQLite gère les métadonnées relationnelles, ChromaDB assure la recherche vectorielle. Aucun appel à des API cloud. C’est de l’IA locale, avec un gain net en confidentialité et en coûts.

Le benchmark qui a fait trembler la communauté

Dès les premières heures, les créateurs ont annoncé un score parfait de 100 % sur LongMemEval, un benchmark utilisé pour évaluer la mémoire longue des modèles. L’information a circulé très vite sur X et Reddit.

L’euphorie a été brève.

Équipe de développeurs examinant sur plusieurs écrans les courbes de benchmark LongMemEval et le code de MemPalace dans un espace de coworking.
Le score annoncé de 100 % sur LongMemEval a été minutieusement décortiqué par la communauté, révélant hardcoding et limites de l’architecture de MemPalace.

Des développeurs ont rapidement mis en évidence du hardcoding : des expressions régulières spécifiques avaient été ajoutées pour répondre correctement aux questions précises du benchmark. Face aux critiques, l’équipe a retiré ces artifices et publié un score révisé de 96,6 % en « mode brut ».

Le problème allait plus loin. Les audits ont montré que ce score mesurait surtout les performances brutes de ChromaDB, et non l’apport réel de l’architecture « Palace ». Lorsque les filtres hiérarchiques étaient activés, les résultats chutaient. Pire : la fameuse AAAK Compression, présentée dans le README comme une méthode sans perte avec un ratio de compression de 30x, s’est révélée être un simple tronquage limitant les textes à 55 caractères. La précision réelle tombe alors à 84,2 % selon des tests indépendants.

Le graphe de connaissances intégré reste rudimentaire. Il manque notamment la détection fine des contradictions sémantiques et la résolution robuste des entités, deux fonctions désormais attendues dans les systèmes de mémoire avancés.

Ce que MemPalace apporte malgré tout

Derrière le bruit médiatique et le marketing, il reste une idée utile et un outil concret.

MemPalace permet aux développeurs de donner à leurs agents IA, via le MCP (Model Context Protocol), un contexte structuré pour un coût réduit en tokens, entre 170 et 900 selon la complexité. L’agent récupère ainsi d’emblée l’historique du projet, les décisions passées et les documents clés.

C’est utile pour Claude Code, Cursor et les nouveaux environnements d’agents autonomes. L’organisation hiérarchique limite les hallucinations quand le contexte est mal structuré.

Le projet illustre aussi la rencontre parfois brutale entre culture célébrité, memecoins et open source sérieuse. Un token du même nom a été lancé en parallèle, et plusieurs observateurs y ont vu un schéma de pump and dump. Les créateurs ont nié toute implication, mais l’image du projet reste entachée.

Une direction pour l’IA locale

MemPalace n’est pas encore l’outil abouti que son marketing initial laissait espérer. Il accumule les défauts classiques d’un projet jeune : documentation incomplète, benchmarks trop optimistes, compression trop agressive.

Mais l’idée d’une mémoire hiérarchique, associée à une exécution locale, répond à un besoin réel. Avec des agents IA qui doivent traiter toujours plus de contexte sans faire exploser les budgets tokens, structurer l’information comme nous le faisons avec nos souvenirs reste une piste sérieuse.

Reste à voir si l’équipe saura transformer l’engouement initial en produit mature, débarrassé des artifices et des promesses excessives. Le palais est construit. Il appartient maintenant aux développeurs et à la communauté de décider quels souvenirs ils veulent y ranger.


Sur le même Thème :

Trop d’infos IA ?

Inscrivez-vous à la newsletter pour recevoir un résumé hebdomadaire directement dans ta boite email (et rien d’autre)