DeepSeek vise 45 milliards de dollars de valorisation

·

·

Bureaux modernes de DeepSeek dans une grande ville chinoise avec skyline lumineuse et écrans financiers suggérant une valorisation record dans l’IA.
Résumer cet article avec :

Le laboratoire chinois DeepSeek négocie son premier tour de table externe. L’opération pourrait le valoriser à 45 milliards de dollars en mai 2026. Le montant a doublé en quelques semaines, porté par l’intérêt suscité par ses modèles économes en calcul. La discussion intervient alors que la Chine veut réduire sa dépendance aux puces américaines.


À retenir

  • DeepSeek vise une valorisation de 45 milliards de dollars en mai 2026 pour son premier tour externe.
  • Le « Big Fund » (China Integrated Circuit Industry Investment Fund) pourrait mener l’opération aux côtés de Tencent et Alibaba.
  • Le modèle DeepSeek-V3 a coûté 5,5 millions de dollars, soit 1/18 du coût estimé de GPT-4.
  • La série V4 lancée le 24 avril 2026 propose une fenêtre de contexte d’un million de tokens avec une architecture MoE très économe.
  • DeepSeek, incubée par High-Flyer Quant, a développé des modèles optimisés pour les puces Huawei Ascend afin de contourner les sanctions sur Nvidia.

Une levée de fonds qui change les équilibres de l’IA chinoise

Le fondateur Liang Wenfeng, qui détient encore près de 90 % du capital, s’apprête à ouvrir DeepSeek à des investisseurs extérieurs pour la première fois. L’entreprise, fondée en 2023, change ainsi de cap.

Un objectif passé de 20 à 45 milliards en quelques semaines

La valorisation recherchée est passée de 20 à 45 milliards de dollars en quelques semaines. Cette hausse reflète l’intérêt suscité par les modèles de DeepSeek et la confiance des acteurs chinois dans leur potentiel commercial.

Réunion au sommet dans une salle de conseil en Chine entre dirigeants de DeepSeek et grands investisseurs autour d’ordinateurs affichant des graphiques.
La levée de fonds prévue pour 2026 marque un tournant stratégique pour l’IA chinoise et pour DeepSeek.

Le « Big Fund » comme chef de file

Le China Integrated Circuit Industry Investment Fund, dit Big Fund, est pressenti pour mener l’opération. Ce serait sa première entrée connue au capital d’un développeur de grands modèles de langage.

Tencent, Alibaba et Liang Wenfeng au rendez-vous

Tencent et Alibaba figurent parmi les participants attendus. Liang Wenfeng envisage aussi un apport personnel pour limiter la dilution et réserver des parts aux talents, afin de freiner les débauchages.

L’efficacité algorithmique au centre du modèle

DeepSeek a montré dès janvier 2025 qu’un modèle de pointe pouvait être entraîné avec bien moins de budget et de puces que chez les grands laboratoires américains. La série V4 prolonge cette approche.

DeepSeek-V3 : un coût divisé par dix-huit

L’entraînement de DeepSeek-V3 a coûté 5,5 millions de dollars. C’est environ 18 fois moins que le coût estimé de GPT-4.

La série V4 et ses caractéristiques

Lancés le 24 avril 2026, DeepSeek-V4-Pro (1,6 billion de paramètres) et V4-Flash (284 milliards) offrent une fenêtre de contexte d’un million de tokens. L’architecture Mixture-of-Experts n’active que 37 milliards de paramètres par tâche, ce qui réduit les coûts d’inférence.

MoE et MLA : des choix techniques payants

L’association de Multi-head Latent Attention et de Mixture-of-Experts réduit la mémoire et la charge de calcul. Sur des tâches équivalentes, ces modèles coûtent jusqu’à vingt fois moins cher à l’usage que ceux d’OpenAI.

Des origines financières à l’autonomie technologique

DeepSeek s’appuie sur l’héritage de High-Flyer Quant, le fonds quantitatif qui l’a incubée. Cette base lui a donné des moyens propres au moment de son lancement.

Ingénieurs chinois examinant des serveurs équipés de puces Huawei Ascend derrière une salle de trading quantitative moderne.
L’héritage financier de High-Flyer Quant et l’optimisation pour les puces Huawei Ascend renforcent l’autonomie technologique de DeepSeek.

High-Flyer Quant, un soutien financier

Avec une performance annuelle de 57 %, High-Flyer a généré des liquidités qui ont financé les premières années de recherche de DeepSeek. Cette autonomie a permis des choix techniques plus risqués et une stratégie plus libre.

Adapter l’IA aux contraintes matérielles chinoises

Face aux restrictions américaines sur les GPU Nvidia, DeepSeek a optimisé ses modèles pour les puces Huawei Ascend. L’entreprise a aussi utilisé ses stocks antérieurs de puces étrangères pour l’entraînement, ce qui lui permet de contourner une partie des limites matérielles.

Vers une chaîne IA plus autonome

Cette approche renforce une chaîne technologique chinoise moins dépendante des exportations américaines. Elle facilite aussi des déploiements plus simples et moins coûteux pour les entreprises et les administrations locales.


Sur le même Thème :

Laisser un commentaire

Trop d’infos IA ?

Inscrivez-vous à la newsletter pour recevoir un résumé hebdomadaire directement dans ta boite email (et rien d’autre)