Les puces Huawei Ascend, nouvel atout de la Chine pour l’IA

·

·

Ingénieur chinois tenant une puce Huawei Ascend dans un laboratoire de semi-conducteurs, symbolisant la souveraineté IA chinoise face aux GPU Nvidia H100
Résumer cet article avec :

Le 910C d’Huawei, lancé en 2024, prétend rivaliser avec le GPU Nvidia H100 malgré un processus de fabrication plus ancien. Son architecture chiplet, couplée à 128 Go de HBM3, permet à ByteDance et à Alibaba d’accélérer leurs modèles d’IA sans dépendre de la technologie américaine. Dans un climat de tensions géopolitiques, ces avancées traduisent une volonté affirmée de souveraineté technologique chinoise.


À retenir

  • Le Ascend 910C atteint 60 % de l’efficacité d’inférence du Nvidia H100.
  • Huawei cible 600 000 unités en 2026, doublant la production 2025.
  • La loi anti‑sanctions chinoise priorise les puces IA domestiques aux entreprises d’État.
  • Le nouveau Ascend 950PR introduit la mémoire HiBL 1.0 et le 950DT promet des performances de décodage comparables à Blackwell.
  • La stratégie de clustering de 384 puces permet de compenser le retard technologique.

À l’heure où la guerre des puces entre les États-Unis et la Chine s’intensifie, Huawei s’efforce d’affirmer l’autonomie de son éc osystème d’IA. Le 910C, bien que conçu sur un processus 7 nm N+2 de SMIC, exploite un design double puce pour atteindre 800 TFLOPS en FP16 et une bande passante de 3,2 To/s. Ces chiffres, validés par les tests de DeepSeek début 2025, placent ses performances proches de la référence Nvidia H100, tout en ouvrant la voie à une production nationale à grande échelle.

Le 910C, moteur de la souveraineté technologique

L’Ascend 910C est présenté comme l’élément central de la stratégie de Huawei pour réduire la dépendance aux fournisseurs étrangers, notamment ASML. Au-delà de l’enjeu industriel, la puce est devenue un instrument politique, utilisé par Pékin pour sécuriser les capacités d’IA face aux contrôles d’exportation américains.

Comparaison avec le H100

Le Nvidia H100 exploite un procédé de 4 nm, un avantage en densité et en efficacité énergétique. Néanmoins, le 910C, grâce à son architecture chiplet et à ses 128 Go de HBM3, atteint environ 60 % de l’efficacité d’inférence. Huawei assure que, dans certains scénarios d’entraînement, le 910C peut s’aligner sur le H100, un argument clé pour les entreprises chinoises qui veulent rester compétitives tout en se conformant aux restrictions américaines.

Centre de données chinois avec serveurs équipés de puces Huawei Ascend 910C, illustrant la souveraineté technologique face au GPU Nvidia H100
Les baies de serveurs équipées de puces Ascend 910C mettent en lumière le rôle central de Huawei dans la quête de souveraineté technologique chinoise.

Adoption par les géants du Web

ByteDance, Baidu, Alibaba et China Mobile ont déjà reçu des échantillons ou passé des commandes massives. ByteDance a signé un contrat de 5,6 milliards de dollars pour les cycles 2026‑2027, engageant plusieurs centaines de milliers de puces. Cette montée en charge confirme la confiance des leaders du numérique chinois dans la fiabilité, le rapport performances‑prix et la stabilité d’approvisionnement du 910C.

Résilience face aux sanctions américaines

Les restrictions sur la lithographie EUV d’ASML ont contraint Huawei à produire via le DUV, entraînant un retard estimé à trois générations technologiques. Pour compenser ce désavantage, Huawei a développé un clustering CloudMatrix 384, reliant 384 puces 910C pour approcher les performances des supercalculateurs occidentaux. Cette approche consomme davantage d’énergie et d’espace, mais elle offre une alternative locale crédible aux GPU interdits d’exportation.

Montée en puissance et stratégie de production

La production du 910C est devenue un levier de souveraineté économique autant que de puissance technologique. Elle sert à verrouiller le marché intérieur, à soutenir les champions nationaux du cloud et à préparer des offres d’exportation vers des pays également visés par les sanctions américaines.

Objectifs de production 2026

Huawei vise 600 000 unités de 910C en 2026, soit un doublement de la capacité prévue pour 2025. L’ensemble de la gamme Ascend doit atteindre 1,6 million de dies d’ici la même année, afin de couvrir les besoins des géants du cloud, des opérateurs télécoms et des centres de données publics.

Optimisation des rendements

Le taux de rendement est passé de 20 % en septembre 2024 à environ 40 % début 2025. L’objectif est d’atteindre les 60 %, le standard industriel, d’ici fin 2025 ou 2026. Cette progression réduit le coût unitaire, augmente la disponibilité locale et rend moins attractives les puces Nvidia, déjà limitées par les sanctions et les quotas à l’export.

Contrôle du marché intérieur

Actuellement, Huawei contrôle plus de 75 % du marché chinois des puces d’IA haut de gamme. En saturant l’offre auprès des grands groupes publics et privés, la firme restreint les marges de manœuvre des fournisseurs alternatifs et renforce la dépendance aux solutions souveraines Ascend, y compris pour les grands modèles de langage nationaux.

Feuille de route future : Ascend 950PR et 950DT

Huawei ne se limite pas au 910C et prépare déjà la prochaine génération. Le groupe veut combler l’écart avec les GPU occidentaux tout en conservant une chaîne de valeur majoritairement chinoise, de la mémoire aux logiciels d’optimisation.

Laboratoire de R&D en Chine travaillant sur les puces Huawei Ascend 950PR et 950DT, représentant la feuille de route future de l’IA chinoise
Les travaux de R&D autour des Ascend 950PR et 950DT éclairent la feuille de route future de Huawei pour les puces d’IA.

La mémoire HiBL 1.0 et le 950PR

Le premier trimestre 2026 a vu l’introduction du Ascend 950PR, optimisé pour l’inférence à haut débit dans les centres de données. Il intègre la mémoire HiBL 1.0, développée avec CXMT, ce qui augmente la bande passante et réduit la latence. Cette solution maison vise à limiter la dépendance à la mémoire HBM étrangère, devenue stratégique dans la course à l’IA générative.

Le modèle 950DT et la concurrence avec Blackwell

Attendu vers fin 2026, le 950DT (« Decoding and Training ») utilisera la mémoire HiZQ 2.0, annoncée à 4 To/s, pour concurrencer les architectures Blackwell B200 de Nvidia. Les premières démonstrations internes évoquent des gains de 20 % en débit d’inférence sur les grands modèles de langage, avec une consommation énergétique mieux maîtrisée.

Passage à 3 nm et Gate‑All‑Around

Des travaux de recherche ciblent une migration vers le processus 3 nm d’ici 2026, en s’appuyant sur des transistors Gate‑All‑Around (GAA) pour améliorer l’efficacité énergétique et la densité. Ce scénario suppose toutefois des avancées rapides de la filière chinoise de lithographie et un accès sécurisé aux matériaux critiques, encore fortement contrôlés à l’international.

Écosystème logiciel : CANN et MindSpore

Huawei continue de promouvoir son CANN (Compute Architecture for Neural Networks) et la plateforme MindSpore. Ces outils cherchent à offrir une alternative crédible à CUDA, avec des bibliothèques optimisées et des dépôts PyTorch adaptés aux Ascend. L’enjeu est de réduire le coût de migration pour les développeurs et d’ancrer durablement l’écosystème logiciel chinois autour des puces maison.

La fragilité d’une stratégie semi‑autonome

Malgré les avancées, les sanctions restent un frein majeur. L’administration américaine a déclaré en mai 2025 que l’utilisation des puces Ascend 910B/C/D partout dans le monde viole ses contrôles d’exportation, car elles intègrent des technologies d’origine américaine. En réaction, Pékin a menacé d’appliquer sa loi anti‑sanctions étrangères et d’accorder la priorité aux entreprises d’État, ce qui pourrait restreindre encore davantage l’accès des acteurs privés à certaines ressources.

Dans ce contexte, le clustering de 384 puces, bien qu’efficace, demeure un compromis par rapport à un véritable eGPU à 4 nm, plus compact et économe. Cette dynamique rappelle que la souveraineté technologique ne tient pas seulement à la capacité de fabrication, mais aussi à la maîtrise de l’ensemble de la chaîne d’approvisionnement, des équipements de production aux outils logiciels. La Chine progresse rapidement sur ces différents maillons, sans toutefois les contrôler encore totalement.


Sur le même Thème :

Laisser un commentaire