Modular lève 250 millions pour détrôner CUDA de Nvidia

·

·

L'infrastructure IA unifiée attire les investissements mondiaux
Résumer cet article avec :

Modular, une startup spécialisée dans l’infrastructure pour l’intelligence artificielle, a levé 250 millions de dollars lors de son tour de financement série C, atteignant une valorisation de 1,6 milliard de dollars. Ce financement, mené par le fonds US Innovative Technology de Thomas Tull et DFJ Growth, porte le total des capitaux levés à 380 millions de dollars depuis la fondation de l’entreprise en 2022. Cette opération marque une étape clé dans la quête d’une couche de calcul unifiée pour l’IA, visant à contrer la fragmentation actuelle du marché.


À retenir

  • Modular lève 250 millions de dollars (environ 212 millions d’euros) en série C, pour une valorisation de 1,6 milliard de dollars (1,357 milliard d’euros).
  • La plateforme unifie le calcul IA sur divers matériels, remplaçant les runtimes comme CUDA et ROCm.
  • Gains de performance de 20 à 50 % par rapport à des concurrents comme vLLM et SGLang sur architectures NVIDIA B200 et AMD MI355.
  • Réductions de coûts jusqu’à 80 % et de latence jusqu’à 70 % pour les partenaires, avec une taille de service MAX 90 % plus petite.
  • Partenaires incluent AMD, NVIDIA, AWS, Oracle et des startups comme Inworld.
  • Plus de 130 employés, avec expansion prévue en Amérique du Nord et en Europe.

Dans un écosystème IA dominé par des standards propriétaires comme CUDA de NVIDIA, qui détient 92 % du marché du calcul accéléré, Modular émerge comme une alternative innovante. Cette levée de fonds intervient à un moment critique, alors que la demande pour des solutions d’IA scalable explose, freinée par la fragmentation des matériels et logiciels. Pour les développeurs, entreprises et fournisseurs de cloud en Europe et aux États-Unis, la plateforme de Modular promet une démocratisation de l’accès à l’IA performante, en favorisant la portabilité et l’efficacité. Son impact potentiel s’étend à la réduction des coûts d’infrastructure, essentielle pour accélérer les avancées vers la superintelligence, tout en soutenant la souveraineté technologique face aux monopoles.

Modular sécurise un financement majeur pour accélérer son développement

Ce tour de table série C représente une validation significative du potentiel de Modular dans le paysage de l’infrastructure IA.

Un tour de financement stratégique mené par des poids lourds

Le fonds US Innovative Technology de Thomas Tull, cofondateur de Universal Studios, a dirigé cette levée de 250 millions de dollars, aux côtés de DFJ Growth. Tous les investisseurs existants, dont GV (Google Ventures), General Catalyst et Greylock Ventures, ont participé. Ce soutien reflète la confiance dans la vision de Modular depuis sa création en 2022. L’entreprise, basée dans la baie de San Francisco, compte désormais plus de 130 employés.

Valorisation triplée et comparaison avec les tours précédents

La valorisation post-money atteint 1,6 milliard de dollars, soit près de trois fois celle du tour précédent. Le capital total levé s’élève à 380 millions de dollars en moins de deux ans. Cette croissance fulgurante surpasse celle de nombreuses startups IA émergentes. Elle positionne Modular comme un acteur clé dans un marché évalué à des centaines de milliards de dollars.

Illustration de l'infrastructure IA unifiée de Modular

La plateforme Modular : une couche de calcul unifiée pour l’IA

Modular développe un hyperviseur pour l’IA, une couche logicielle qui abstrait la complexité des matériels diversifiés comme les CPU, GPU et ASIC, pour une exécution cohérente des charges de travail.

Solution à la fragmentation du calcul IA

La fragmentation actuelle, due à des runtimes propriétaires comme CUDA de NVIDIA et ROCm d’AMD, limite la portabilité des applications IA. Modular remplace ces outils par une couche bas niveau unifiée. Cela permet aux logiciels de s’exécuter sur NVIDIA, AMD et le silicium personnalisé d’Apple sans modifications. Les entreprises et développeurs gagnent en résilience et en réduction des coûts d’infrastructure.

Composants clés : Mammoth, MAX et Mojo pour performance et flexibilité

Mammoth est un planificateur de contrôle natif Kubernetes pour le déploiement distribué d’IA à grande échelle. MAX, un framework de service pour l’IA générative, intègre des optimisations comme le décodage spéculatif et offre une compatibilité avec l’API OpenAI. Mojo, langage de programmation système, combine la simplicité de Python avec les performances de C/C++ et la sécurité de Rust. Ces outils forment la première pile d’inférence IA de qualité entreprise, adaptée aux environnements cloud et edge.

Performances révolutionnaires et impact sur l’écosystème IA

Les benchmarks de la version 25.6 de Modular démontrent des avancées concrètes en efficacité, challengeant les standards dominants du marché.

Gains de performance et réductions de coûts mesurables

Sur les architectures NVIDIA B200 et AMD MI355, Modular offre 20 à 50 % de gains par rapport aux dernières versions de vLLM et SGLang. La taille du service MAX est inférieure à 700 Mo, soit 90 % plus compacte que vLLM, diminuant les besoins en infrastructure. Inworld a rapporté une réduction de 60 % des coûts et une accélération de 70 % pour la génération audio en temps réel. Qwerky AI a vu une performance GPU 50 % plus rapide. Globalement, Modular délivre jusqu’à 70 % de réduction de latence et 80 % de coûts pour ses clients.

Partenariats stratégiques face à la dominance de CUDA

Modular défie le monopole de CUDA, qui verrouille 92 % du marché, en assurant la compatibilité multiplateforme. Des partenaires comme AMD, NVIDIA, AWS, Oracle, Lambda Labs et TensorWave adoptent la plateforme. Inworld, SF Compute et Jane Street intègrent Modular pour leurs recherches et déploiements. Le PDG Chris Lattner insiste sur la démocratisation de l’accès à l’IA, rendant les avancées accessibles sans dépendance à un seul fournisseur. Cependant, la transition depuis CUDA nécessite des adaptations initiales, un défi pour les équipes existantes.

Visuel partenaires et écosystème autour de Modular

Perspectives d’avenir : expansion et vision pour la superintelligence

Avec ce financement, Modular accélère son évolution vers une infrastructure IA globale et fiable.

Évolution technique et support étendu

Les fonds serviront à développer la plateforme pour les charges de travail IA avancées, en natif cloud et edge. Le support s’étendra aux plateformes cloud majeures et aux environnements périphériques. Modular vise à unifier le calcul sur CPU, GPU, ASIC et silicium personnalisé. Cela accélérera les applications vers la superintelligence, en maximisant performance et efficacité.

Recrutement et présence internationale

L’entreprise prévoit d’embaucher en Amérique du Nord et en Europe. Elle maintient une empreinte mondiale avec des équipes au Royaume-Uni. Le siège reste en baie de San Francisco. Ces renforts soutiendront l’innovation en IA souveraine pour l’Europe.

Vision unifiée pour développeurs et fabricants

Modular ambitionne une infrastructure IA unique pour tous les acteurs. Les développeurs bénéficieront de la portabilité, les entreprises de coûts réduits, et les fabricants de matériel d’une adoption accrue. Cette approche favorise une tendance à la multiplateforme, essentielle pour l’écosystème européen face aux géants américains.


Sur le même Thème :