Début avril 2026, Anthropic a placé son nouveau modèle Mythos en Limited Preview, invoquant une capacité inédite à découvrir et exploiter des vulnérabilités zero-day dans les logiciels mondiaux. Dario Amodei justifie cette retenue par la nécessité de mener d’abord le Project Glasswing, un programme de cyberdéfense offensive. Derrière l’argument sécuritaire se pose pourtant une question plus large : la start-up protège-t-elle l’internet ou verrouille-t-elle l’accès à un modèle de frontière devenu trop puissant pour être déployé sans risque commercial et juridique ?
À retenir
- Mythos, dévoilé début avril 2026, n’est disponible qu’en Limited Preview en raison de ses performances sur les zero-day exploits.
- Le modèle dépasse les seuils ASL-3 définis dans la Responsible Scaling Policy (RSP) d’Anthropic.
- Project Glasswing utilise ses capacités pour durcir les infrastructures critiques avant toute diffusion large.
- Critiques de Gary Marcus et de The Economist : un « safety-washing » masquerait un coût d’inférence prohibitif et une pénurie de puces B200.
- En 2026, les réglementations européennes et américaines renforcent la responsabilité civile des labs en cas de cyberattaque majeure.
- Le confinement des model weights (poids synaptiques) vise aussi à empêcher le jailbreaking et l’extraction par des concurrents ou États.
Quand un frontier model devient une arme à double tranchant
Anthropic n’a pas fait dans la demi-mesure. Au lieu du déploiement progressif habituel, Mythos a été immédiatement placé sous cloche. La raison avancée par Dario Amodei est directe : le modèle ne se contente plus de suggérer du code, il identifie des failles complexes — buffer overflows, erreurs logiques dans les noyaux, configurations dangereuses — avec une efficacité que peu d’experts humains atteignent.

Project Glasswing, le bouclier avant l’épée
Avant d’offrir Mythos au public, l’entreprise l’emploie en interne via le Project Glasswing. L’idée consiste à retourner ses capacités offensives contre ses propres cibles : scanners automatisés, simulation d’attaques sur des infrastructures critiques, renforcement proactif des systèmes. Anthropic affirme ainsi transformer un risque en outil de cyberdéfense. Concrètement, le modèle devient un pentester d’un nouveau genre, capable de trouver des vulnérabilités qu’aucun humain ne verrait en temps utile.
La Responsible Scaling Policy comme ligne rouge
Cette retenue s’inscrit dans la Responsible Scaling Policy (RSP) de l’entreprise. Lorsque les tests internes montrent que le modèle franchit le palier ASL-3 (AI Safety Level 3), des mesures strictes s’appliquent automatiquement. Tant que des garde-fous robustes ne filtrent pas les requêtes malveillantes sans sacrifier les performances, l’accès reste sévèrement restreint. C’est la première fois qu’Anthropic applique cette politique avec une telle rigidité sur un modèle de frontière.
Sécurité réelle ou habile stratégie de positionnement ?
Pourtant, plusieurs voix dissonantes s’élèvent : Gary Marcus, comme The Economist, y voit un cas classique de safety-washing. Derrière le discours alarmiste sur la cybersécurité se cacherait une réalité plus prosaïque : le coût d’inférence de Mythos serait tellement élevé que l’entreprise ne pourrait tout simplement pas le servir à grande échelle sans perdre d’argent.
La pénurie de puces et les limites matérielles
Les modèles de cette taille nécessitent des quantités massives de GPU H200 et B200. Or ces puces restent rares en 2026. En limitant l’accès, Anthropic crée une rareté qui renforce son image de laboratoire « responsable » tout en évitant d’exposer un modèle encore instable en conditions réelles de production. L’argument sécuritaire devient alors un récit commode pour masquer ces contraintes matérielles.
Protection juridique et verrouillage concurrentiel
Le contexte réglementaire de 2026 n’est pas anodin. Les décrets européens et américains sur la sécurité nationale rendent les éditeurs d’IA potentiellement responsables en cas d’attaque majeure facilitée par leur modèle. Si Mythos servait à orchestrer une cyberattaque contre des infrastructures critiques, Anthropic pourrait faire face à des poursuites civiles et pénales sans précédent. Limiter l’accès, c’est aussi limiter la surface de risque juridique.
Parallèlement, le confinement des model weights (poids synaptiques) protège la propriété intellectuelle. Les techniques de jailbreaking et d’extraction de poids par prompt injection se perfectionnent. En contrôlant précisément qui accède à Mythos et dans quelles conditions, Anthropic empêche que ses concurrents ou des acteurs étatiques ne reproduisent ses performances à moindre coût.
Le risque d’une ère des frontier models sous clé
Le cas Mythos dépasse la simple anecdote d’entreprise. Il annonce peut-être le début d’une phase où les modèles les plus performants ne seront plus jamais vraiment ouverts. Cette transition d’une logique de recherche relativement transparente vers des forteresses numériques pose une question fondamentale pour l’écosystème européen et français : comment rester dans la course quand les meilleurs modèles restent inaccessibles ?

Transparence scientifique sacrifiée
Les chercheurs académiques craignent un fossé technologique croissant. Sans accès, même limité, aux capacités réelles de ces modèles de frontière, la recherche publique et les start-up européennes risquent de travailler sur des versions déjà dépassées. L’innovation risque alors de se concentrer entre les mains de quelques labs américains disposant des moyens financiers et des relais politiques nécessaires pour gérer ces risques.
L’open source face au dilemme
L’écosystème open source, moteur historique de progrès en IA, se trouve fragilisé. Si les leaders du secteur choisissent systématiquement la voie du « sous clé » au nom de la sécurité, la dynamique collaborative qui a fait la force de l’IA ces dernières années pourrait se tarir. La question demeure : Anthropic protège-t-elle véritablement l’internet contre un risque existentiel, ou utilise-t-elle la peur pour consolider son avance technologique et commerciale ?
Pour l’instant, Mythos reste une promesse puissante maintenue derrière une vitre blindée. Le temps dira si cette vitre était nécessaire pour contenir un risque réel… ou simplement pour protéger Anthropic.

















Laisser un commentaire
Vous devez vous connecter pour publier un commentaire.