Qwen3-Max-Thinking mets la Chine en tête du raisonnement IA

·

·

La Chine place Qwen3-Max-Thinking au cœur du raisonnement IA
Résumer cet article avec :

Alibaba Cloud a lancé début novembre 2025 Qwen3-Max-Thinking, un modèle d’IA qui atteint des scores parfaits sur des benchmarks mathématiques internationaux, égalant les performances revendiquées par GPT-5 Pro d’OpenAI. Ce large language model (LLM) chinois marque un tournant dans la compétition mondiale en IA, surpassant également des rivaux américains dans une simulation de trading de crypto-monnaies. Ces avancées soulignent l’ascension rapide de la Chine dans le domaine du raisonnement et des agents IA.

À retenir

  • Qwen3-Max-Thinking obtient 100 % de précision sur l’AIME 2025 et le HMMT.
  • Le modèle de base Qwen3-Max génère 22,3 % de rendement en trading crypto sur deux semaines.
  • Plus de 1 trillion de paramètres et architecture MoE pour une efficacité accrue.
  • Investissement d’Alibaba : 53,4 milliards de dollars (environ 46 milliards d’euros) sur trois ans en IA.
  • Premier modèle chinois à score parfait sur ces compétitions mathématiques.
  • Accès via API Alibaba Cloud et chatbot web Qwen.

Au moment où les géants américains comme OpenAI, Anthropic et Google DeepMind dominent encore le paysage de l’IA générative, l’irruption de Qwen3-Max-Thinking d’Alibaba redéfinit les rapports de force. Dévoilé début novembre 2025, ce modèle illustre l’innovation chinoise en matière de raisonnement avancé et d’applications pratiques, comme le trading automatisé. Pour les entreprises européennes et françaises cherchant des solutions IA souveraines et efficaces, ces performances interrogent la dépendance aux technologies américaines, tout en posant des questions sur la vérification indépendante des résultats. L’enjeu est clair : accélérer la démocratisation des agents IA performants, au-delà des frontières géopolitiques.

Qwen3-Max-Thinking excelle en raisonnement mathématique

Alibaba positionne Qwen3-Max-Thinking comme un challenger direct aux leaders mondiaux en IA, grâce à des prouesses sur des benchmarks exigeants.

Scores parfaits sur AIME et HMMT 2025

L’American Invitational Mathematics Examination (AIME) 2025 teste les compétences en résolution de problèmes complexes d’arithmétique, d’algèbre et de théorie des nombres. Qwen3-Max-Thinking y a obtenu un score parfait de 100 %, sans recours à des outils externes ni à Internet. De même, sur le Harvard-MIT Mathematics Tournament (HMMT), le modèle a résolu toutes les épreuves avec la même précision absolue.

Ces compétitions, réservées aux talents mathématiques de haut niveau, évaluent des probabilités et des démonstrations logiques poussées. L’équipe Qwen chez Alibaba a qualifié cela comme une première pour un modèle chinois de raisonnement. Le mécanisme « Thinking » active un raisonnement pas à pas, modulant un budget de calcul pour optimiser latence et coûts, sans compromettre les résultats.

Qwen3-Max-Thinking - illustration 1

Égalité revendiquée avec GPT-5 Pro

Qwen3-Max-Thinking égale les performances auto-déclarées de GPT-5 Pro d’OpenAI sur ces mêmes tests. Alibaba affirme que son modèle surpasse les limites actuelles des LLM en raisonnement pur. Cette parité marque un basculement : la Chine, via Alibaba, entre dans le triumvirat du raisonnement IA aux côtés des États-Unis.

Pourtant, des observateurs appellent à la prudence. Les scores proviennent d’une auto-évaluation sans audit tiers indépendant. Des détails manquent sur les protocoles, comme l’absence de contamination des données d’entraînement par les problèmes de 2025.

Succès en trading crypto : une application concrète des agents IA

Au-delà des benchmarks académiques, Qwen3-Max démontre son efficacité dans des scénarios réels, renforçant son attractivité pour l’automatisation financière.

Victoire dans l’Alpha Arena Challenge

Organisé par la société de recherche américaine Nof1, l’Alpha Arena Challenge simule du trading en conditions live sur la bourse décentralisée Hyperliquid. Qwen3-Max, sans ses capacités « Thinking », a géré un portefeuille initial de 10 000 dollars (environ 8 600 euros). Sur deux semaines, il a généré un rendement de 22,3 % via des contrats perpétuels de crypto-monnaies.

Le modèle a pris des décisions autonomes en environnement volatil, analysant marchés et exécutant trades sans intervention humaine. Seuls deux modèles chinois, Qwen3-Max et DeepSeek V3.1 Chat (avec 4,9 % de gain), ont fini positifs parmi six concurrents. Cette performance met en lumière les aptitudes d’agent IA de Qwen pour des applications d’affaires critiques.

Échec relatif des modèles américains

Les quatre systèmes américains testés ont tous enregistré des pertes. GPT-5 d’OpenAI a subi la pire dégringolade, avec une perte de 62,7 %. Claude Opus 4 d’Anthropic, Grok 4 de xAI et un modèle de Google DeepMind ont suivi, avec des baisses comprises entre 10 et 30 %.

Malgré l’utilisation de raisonnement étape par étape chez certains rivaux, Qwen3-Max les a surpassés par sa simplicité et sa robustesse. Cette contre-performance américaine souligne les limites des LLM occidentaux en prise de décision temps réel. Pour les investisseurs européens, cela ouvre des perspectives sur des agents IA plus fiables pour l’automatisation des marchés.

Qwen3-Max-Thinking - illustration 2

Architecture innovante et stratégie chinoise en IA

Alibaba mise sur une intégration verticale pour propulser Qwen3 dans l’écosystème global de l’IA générative, avec des atouts techniques qui défient les standards.

Spécificités techniques du LLM Qwen3-Max

Avec plus de 1 trillion de paramètres, Qwen3-Max est le plus imposant des modèles Alibaba, pré-entraîné sur 36 trillions de jetons. Son architecture Mixture of Experts (MoE) optimise l’entraînement via une perte de charge globale par lot, boostant l’efficacité Model FLOPs Utilization (MFU) de 30 % par rapport à Qwen2.5-Max-Base.

Le variant Instruct se classe troisième sur LMArena, devant GPT-5-Chat. Il atteint un score State-Of-The-Art (SOTA) de 74,8 % sur Tau2-Bench, benchmark des appels d’outils pour agents IA. Le « Thinking » module le raisonnement pour réduire la latence, idéal pour des déploiements en production.

L’écosystème Qwen3 inclut des modèles spécialisés comme Qwen 3-Coder pour le développement logiciel et Qwen 3-Omni pour le multimodal. Cette diversité renforce l’intégration via l’API Alibaba Cloud.

Engagements massifs d’Alibaba en infrastructure

Début 2025, Alibaba a annoncé un investissement de 380 milliards de yuans (53,4 milliards de dollars, soit environ 46 milliards d’euros) sur trois ans en infrastructure IA, axée sur les GPU. Cette stratégie soutient l’entraînement de modèles massifs comme Qwen3-Max.

En favorisant l’intégration verticale, Alibaba vise à concurrencer les leaders américains sur leur terrain. Qwen3-Max-Thinking est accessible dès à présent via le chatbot web Qwen et l’API Cloud, démocratisant ces avancées pour les développeurs mondiaux.

Des critiques persistent toutefois sur la transparence. Sans vérifications indépendantes, ces performances, bien que prometteuses, méritent une validation externe pour inspirer confiance en Europe, où la souveraineté numérique prime.


Sur le même Thème :

Laisser un commentaire