OpenAI a dévoilé cette semaine une mise à jour majeure de Codex, qui en fait un agent IA capable de contrôler votre ordinateur comme un développeur humain. Annoncée en avril 2026, cette évolution, dotée de Computer Use, de Persistent Memory et d’une meilleure efficacité en tokens, répond directement aux progrès de Claude Code chez Anthropic. Le rôle du développeur bascule : il devient orchestrateur d’agents plutôt que simple rédacteur de code.
À retenir
- Codex (porté par GPT-5.3-Codex) peut désormais voir l’écran, déplacer la souris et interagir avec n’importe quelle application desktop via Computer Use, même sans API.
- Exécution en arrière-plan et Parallel Execution permettent à plusieurs agents de travailler simultanément sans perturber l’utilisateur.
- Persistent Memory retient les préférences, les stacks techniques et les corrections passées, éliminant les répétitions d’instructions.
- Intégration native de GPT-Image-1.5 pour générer mockups et assets visuels directement dans le flux de développement.
- 77,3 % sur Terminal-Bench 2.0 contre une avance de Claude Code (72,5 %) sur SWE-bench Pro.
- Token Efficiency : Codex consomme 3 à 4 fois moins de tokens que Claude Code pour des tâches équivalentes.
- Les agents peuvent planifier et exécuter des tâches asynchrones sur plusieurs jours avec réveil autonome.
- Sécurité renforcée par des sandboxes kernel-level (Seatbelt sur macOS, Landlock).
Codex s’empare du poste de travail
OpenAI ne se contente plus de générer du code. Avec cette mise à jour d’avril 2026, l’agent peut littéralement utiliser votre ordinateur, du système à l’application métier.

Le Computer Use redéfinit l’interaction
Le véritable saut s’appelle Computer Use. Codex voit maintenant votre écran, déplace le curseur et tape du texte pour piloter n’importe quelle application, y compris celles dépourvues d’API. Sur macOS comme sur Windows, l’agent peut gérer un éditeur, un outil de design ou même un jeu comme un développeur expérimenté.
Cette capacité modifie en profondeur les usages. Fini les agents cantonnés aux seuls environnements disposant d’une interface de programmation : Codex ouvre votre IDE, lance un test, observe le résultat visuel et ajuste en conséquence. C’est comme donner les clés de votre bureau à un collègue compétent qui ne dort jamais.
Agents parallèles et exécution silencieuse
Autre nouveauté majeure : la Parallel Execution en arrière-plan. Plusieurs agents peuvent travailler simultanément sans bloquer votre propre activité. Pendant que vous répondez à des mails, un agent peut itérer sur une interface front-end tandis qu’un autre exécute une suite de tests d’intégration.
OpenAI insiste sur ce point : l’utilisateur reste maître du poste de travail. Les agents opèrent discrètement, comme des processus système, et ne monopolisent ni ressources ni attention au-delà du nécessaire.
Un navigateur intégré pour des instructions visuelles
Codex embarque désormais son propre navigateur. Les développeurs peuvent surligner une zone d’une page web, ajouter un commentaire visuel (« rends ce bouton plus moderne ») et l’agent comprend le contexte spatial. Cette interaction directe entre vision et action accélère les itérations de design et réduit les allers-retours avec l’équipe produit.
Mémoire, vision et écosystème : Codex devient un vrai collaborateur
La valeur d’un bon développeur repose autant sur sa mémoire que sur sa capacité à coder. OpenAI applique clairement cette logique à son agent.
Une mémoire persistante qui apprend de vous
La Persistent Memory constitue l’une des avancées les plus sous-estimées. Codex retient désormais vos préférences, les piles technologiques que vous utilisez régulièrement, le style de code que vous appréciez et même les corrections que vous apportez fréquemment.
Plus besoin de rappeler à chaque nouveau fil de discussion que vous utilisez React 19, Tailwind et que vous détestez les ternaires imbriqués. L’agent s’adapte et progresse avec vous. Cette continuité transforme une succession de prompts isolés en relation de travail suivie.
GPT-Image-1.5 intégré au flux de développement
L’intégration native de GPT-Image-1.5 permet de générer directement des mockups, des éléments d’interface ou des assets de jeu sans quitter l’environnement de développement. Un développeur peut demander un modèle 3D stylisé pour un jeu, l’obtenir rapidement, puis solliciter un autre agent pour l’intégrer dans Unity.
Cette fluidité entre texte, code et image réduit les frictions entre designers et développeurs. La frontière entre les deux métiers devient plus poreuse.
90 plugins et le protocole MCP
L’écosystème s’enrichit avec 90 nouveaux plugins connectant Codex à JIRA, GitLab, Slack, Microsoft 365 et de nombreux autres outils. Le support du Model Context Protocol (MCP) permet une collecte de contexte beaucoup plus large, y compris sur des serveurs internes ou des bases de code privées.
Concrètement, Codex peut désormais ouvrir un ticket, commenter une merge request, mettre à jour une documentation et notifier l’équipe sans intervention humaine. Une partie du travail de coordination bascule ainsi vers les agents.
Claude Code dans le viseur : la contre-offensive d’OpenAI
Cette mise à jour n’est pas seulement technique. Elle est aussi stratégique : Anthropic avait pris un net avantage avec Claude Code, et OpenAI organise sa riposte.

Un duel inégal sur les benchmarks
Les chiffres sont nets. Claude Code (Opus 4.6) conserve une avance sur SWE-bench Pro avec 72,5 % de réussite contre 56,8 % pour Codex. En revanche, ce dernier domine sur Terminal-Bench 2.0 avec 77,3 %, ce qui traduit une supériorité dans l’exécution réelle de commandes système et l’autonomie au terminal.
Cette spécialisation n’est pas anodine. Elle montre qu’OpenAI cible les usages concrets plutôt que les seuls scores académiques.
Token efficiency : l’arme économique décisive
L’avantage le plus tangible pour les équipes concerne la consommation de tokens. Codex utilise entre trois et quatre fois moins de tokens que Claude Code pour des tâches identiques. Dans un contexte où les coûts d’inférence peuvent rapidement déraper, cet écart se traduit par des économies directes.
Pour une startup ou une scale-up française qui facture en euros, la différence peut atteindre plusieurs milliers d’euros par mois dès que l’usage devient intensif. Le choix de l’agent devient alors autant budgétaire que technique.
Cloud Sandbox contre approche locale
Alors que Claude Code privilégie une exécution locale centrée sur le terminal, Codex adopte une architecture hybride cloud-desktop. Les Cloud Sandbox sont isolées au niveau du noyau, avec Seatbelt sur macOS et Landlock sur les systèmes Linux. Cette approche combine la puissance du cloud et la sécurité d’un bac à sable strictement contrôlé.
Le développeur devient chef d’orchestre
La conséquence la plus profonde de cette évolution concerne moins la technologie que le métier lui-même. Le développeur voit sa fonction déplacée vers la coordination et la décision.
Des tâches qui s’étendent sur plusieurs jours
Codex peut désormais planifier, exécuter et superviser des projets sur plusieurs jours ou semaines. L’agent se réveille de manière autonome, vérifie l’état d’avancement, corrige les erreurs et poursuit sa mission sans que vous ayez besoin de le relancer.
OpenAI utilise déjà en interne ces agents pour déboguer des pipelines de données avant même que les ingénieurs n’arrivent au bureau. Le gain de temps sur les opérations répétitives est notable.
L’émergence des agents de domaine
On voit apparaître des agents spécialisés par métier : agent frontend, agent infrastructure, agent sécurité, agent performance. Chacun maîtrise son périmètre avec une profondeur nouvelle. Le développeur humain passe alors du rôle d’exécutant à celui d’architecte et de superviseur.
Le SDLC (Software Development Life Cycle) se transforme. La phase d’implémentation devient largement automatisée, libérant du temps pour la conception, la stratégie produit et la revue critique des solutions proposées par les agents.
Gouvernance et sécurité des agents autonomes
Cette autonomie accrue pose des questions de gouvernance. OpenAI a renforcé ses mécanismes de sécurité : les sandboxes empêchent tout dépassement de droits et limitent strictement ce qu’un agent peut lire ou modifier.
Les entreprises devront cependant définir des règles claires : jusqu’où peut aller un agent ? Quelles décisions nécessitent une validation humaine ? Quelles traces doit-on conserver ? La maturité organisationnelle pèsera autant que la maturité technologique.
Cette mise à jour de Codex marque une nouvelle étape dans la course à l’Agentic AI. OpenAI ne cherche plus seulement à générer du code plus vite : l’éditeur veut déléguer une partie substantielle du travail répétitif pour repositionner les développeurs sur ce qu’ils font de mieux, à savoir prendre des décisions, concevoir des architectures et résoudre des problèmes complexes.
La balle est désormais dans le camp d’Anthropic. Et les développeurs, eux, observent ce match avec un mélange d’excitation et de questions sur leur propre avenir.















