Anthropic a lancé le 29 septembre 2025 Claude Sonnet 4.5, présenté comme le meilleur modèle de codage au monde et le plus performant pour la construction d’agents complexes en intelligence artificielle. Ce modèle excelle dans l’utilisation d’ordinateurs et montre des avancées notables en raisonnement et en mathématiques, surpassant ses concurrents directs. Disponible immédiatement via l’API Claude, il promet d’accélérer l’automatisation des tâches complexes pour développeurs et entreprises.
À retenir
- Claude Sonnet 4.5 atteint 77,2 % sur le benchmark SWE-bench Verified pour le codage logiciel réel.
- Il mène à 61,4 % sur OSWorld, testant les tâches informatiques authentiques, contre 42,2 % pour Sonnet 4.
- Le modèle maintient sa concentration plus de 30 heures sur des tâches complexes, contre 7 heures pour Opus 4.
- Protections ASL-3 réduisent les faux positifs des classificateurs CBRN par un facteur de dix.
- Tarification inchangée : environ 2,76 € pour l’entrée et 13,8 € pour la sortie par million de tokens.
- Disponible sur Amazon Bedrock et via le SDK d’Agents Claude pour les développeurs.
Le lancement de Claude Sonnet 4.5 marque une étape clé dans l’évolution de l’intelligence artificielle vers une automatisation plus fiable et sophistiquée. Développé par Anthropic, ce modèle cible les professionnels du codage et les entreprises cherchant à intégrer des agents IA complexes dans leurs workflows. Son importance réside dans sa capacité à réduire les erreurs humaines et à accélérer les cycles de développement, particulièrement dans des secteurs comme la finance, le droit et la cybersécurité. À un moment où la concurrence s’intensifie entre OpenAI et Google, cette avancée renforce la position de l’IA européenne et mondiale en termes d’efficacité et de sécurité, favorisant une démocratisation accrue des outils pour les développeurs indépendants comme pour les grandes structures.
Claude Sonnet 4.5 : positionnement et capacités en modélisation d’agents
Claude Sonnet 4.5 se distingue par ses performances en codage et en construction d’agents IA, répondant aux besoins croissants d’automatisation avancée.
Capacités clés pour le codage et les agents complexes
Anthropic positionne Claude Sonnet 4.5 comme le meilleur modèle de codage au monde, capable de gérer des tâches d’utilisation d’ordinateurs et de résoudre des problèmes complexes. Il excelle dans la modélisation d’agents IA, permettant l’exécution de commandes multiples via des outils parallèles. Des gains substantiels apparaissent en raisonnement et en mathématiques, facilitant l’automatisation dans des environnements variés.
Le modèle supporte des sessions prolongées, atteignant plus de 30 heures de concentration sur des projets à étapes multiples. Cela contraste avec les limites précédentes et ouvre des perspectives pour des applications industrielles durables. Les développeurs bénéficient d’une précision accrue, réduisant les taux d’erreur dans le codage autonome.
Objectifs d’Anthropic et bénéfices pour les utilisateurs
L’intention d’Anthropic vise à rendre le travail moderne plus efficace en intégrant des outils complexes et en favorisant la résolution de problèmes difficiles. Pour les développeurs et entreprises, cela se traduit par une productivité accrue et des cycles de développement accélérés. Des secteurs comme la finance, le droit, la médecine et la cybersécurité en tirent un avantage direct.
Les entreprises gagnent en sécurité renforcée et en capacité à bâtir des agents IA sophistiqués. Anthropic, de son côté, consolide son leadership via une API plus utilisée et une marque axée sur la fiabilité. Les utilisateurs avancés d’agents IA accèdent ainsi à des solutions démocratisées pour l’automatisation quotidienne.
Performances supérieures de Claude Sonnet 4.5 aux benchmarks
Les évaluations comparatives soulignent les avancées de Claude Sonnet 4.5 en codage et raisonnement, confirmant son impact sur l’efficacité de l’IA.

Maîtrise en codage et utilisation informatique
Sur SWE-bench Verified, qui mesure le codage logiciel réel, Claude Sonnet 4.5 obtient 77,2 %, grimpant à 82,0 % avec calcul parallèle. Il surpasse Opus 4.1, son prédécesseur chez Anthropic, et domine dans les services financiers. Ce score reflète une autonomie accrue pour des tâches à long terme.
OSWorld, benchmark des tâches informatiques réelles, voit Sonnet 4.5 à 61,4 %, contre 42,2 % pour Sonnet 4 quatre mois plus tôt. Il devance GPT-5 d’OpenAI et Gemini 2.5 Pro de Google dans la plupart des tests de codage. Des experts notent une gestion améliorée de la mémoire inter-conversations et de la planification de projets sur plusieurs jours.
Améliorations en raisonnement et domaines spécifiques
Le modèle démontre une connaissance approfondie en finance, droit, médecine et STEM, avec un raisonnement spécifique supérieur à Opus 4.1. Il gère l’exécution de commandes bash simultanées, favorisant l’innovation en automatisation. Ces progrès s’appliquent à des tâches comme la cybersécurité et le développement logiciel.
Dans les benchmarks mathématiques, les gains sont substantiels, soutenant des analyses complexes. Cela renforce la tendance vers des IA plus pratiques pour des environnements professionnels exigeants. Les comparaisons avec concurrents confirment une efficacité accrue sans compromettre la précision.
Évolutions produits et engagement en sécurité pour Claude Sonnet 4.5
Les mises à jour d’Anthropic intègrent des outils avancés et des mesures de sécurité, assurant une adoption sécurisée de l’IA dans l’automatisation.
Mises à jour de Claude Code, API et SDK d’agents
Claude Code introduit des checkpoints pour sauvegarder la progression, permettant des retours en arrière instantanés, et une interface terminal rafraîchie. Une extension native pour VS Code facilite le développement. L’API Claude ajoute l’édition de contexte et des outils de mémoire pour des tâches prolongées.
Les applications Claude supportent désormais l’exécution de code et la création de fichiers comme des feuilles de calcul ou diapositives. L’extension Claude pour Chrome est accessible aux utilisateurs Max sur liste d’attente. Le SDK d’Agents Claude permet aux développeurs de construire des agents avec gestion de permissions et coordination de sous-agents.
Disponible sur Amazon Bedrock avec AgentCore, il maximise les capacités pour agents complexes. Ces évolutions démocratisent l’accès à l’IA avancée.
Alignement de l’IA et protections ASL-3 contre les menaces
Claude Sonnet 4.5 est le modèle le plus aligné publié par Anthropic, réduisant la sycophanie, la tromperie et la recherche de pouvoir. Les progrès contre les comportements misalignés renforcent la fiabilité. Il défend efficacement contre les attaques par injection de prompt, un risque majeur pour les agents.
Sous protections AI Safety Level 3 (ASL-3), il inclut des classificateurs pour détecter les entrées dangereuses liées aux armes CBRN. Les faux positifs chutent d’un facteur de dix depuis l’origine, et de deux depuis Claude Opus 4. Cela assure une sécurité accrue sans entraver l’usage, un contrepoint aux craintes de sur-régulation qui pourrait freiner l’innovation, mais justifié par les enjeux éthiques.

Retours clients et disponibilité de Claude Sonnet 4.5
Les témoignages initiaux et l’accès immédiat confirment l’impact pratique de ce modèle sur divers secteurs.
Cas d’usage avancés et témoignages d’experts
Michael Truell, CEO de Cursor, souligne les performances en codage à long terme. Mario Rodriguez de GitHub Copilot note des avancées en raisonnement multi-étapes.
La vitesse de développement est transformée par sa capacité à apprendre les modèles de code.
Eric Wendelin, GenAI pour la productivité des développeurs.
En cybersécurité, Nidhi Aggarwal de Hai security rapporte une réduction de 44 % du temps d’ingestion de vulnérabilités et 25 % de précision en plus. Pablo Arredondo de CoCounsel apprécie l’analyse détaillée des litiges.
Danny Wu de Canva et David Kossnick de Figma Make observent des gains en prototypes fonctionnels. Scott Wu de Devin indique une hausse de 18 % en planification, avec du code prêt pour production.
Il gère plus de 30 heures de codage autonome, libérant les ingénieurs pour l’architecture.
Sean Ward, CEO et co-fondateur.
Accessibilité, tarification et innovations futures
Claude Sonnet 4.5 est accessible via l’API en spécifiant ‘claude-sonnet-4-5’, au même tarif que Sonnet 4 : environ 2,76 € par million de tokens en entrée et 13,8 € en sortie. Une mise à jour est recommandée pour toutes les utilisations, activant les nouveaux outils.
‘Imagine with Claude‘, une prévisualisation de génération de logiciels, est ouverte cinq jours aux abonnés Max. Cela explore des créations sans code préétabli, signalant des tendances vers une IA plus créative et pratique.
















