Le 9 janvier 2026, MiniMax a signé une entrée en bourse spectaculaire au Hong Kong Stock Exchange, marquant une nouvelle phase d’industrialisation de l’IA chinoise. En à peine quatre ans, la startup fondée à Shanghai par Yan Junjie, ex-cadre de SenseTime, est passée du statut de “licorne” à celui d’acteur multimodal “full-stack”, capable de vendre à la fois des modèles de langage (LLM) et des applications vidéo, audio et grand public. Derrière l’effet d’annonce, son pari est clair : gagner par l’efficacité (coût, vitesse, automatisation interne) et par le “très long contexte”, tout en pilotant une expansion mondiale désormais freinée par les sujets de conformité et de droits d’auteur.
À retenir
- Fondation : MiniMax est créée en décembre 2021 à Shanghai par Yan Junjie (ex-vice-président de SenseTime) et Zhou Yucong.
- Financement et valorisation : 600 M$ levés en mars 2024 (≈ 516 M€) pour une valorisation de 2,5 Md$ (≈ 2,15 Md€), puis 300 M$ en juillet 2025 (≈ 258 M€) pour atteindre 4 Md$ (≈ 3,44 Md€).
- IPO : entrée en bourse le 9 janvier 2026 à Hong Kong, avec un bond de 109% le premier jour et une capitalisation de 12,8 Md$ (≈ 11,01 Md€).
- Technos clés : Lightning Attention, Mixture-of-Experts (MoE), architecture NCR (Noise-Aware Compute Redistribution).
- Échelle : MoE à 456 milliards de paramètres (dont 45,9 milliards activés par token) ; fenêtres de contexte jusqu’à 4 millions de tokens en inférence.
- Produits : Hailuo AI (vidéo), Talkie/Xingye (compagnons virtuels), Speech 2.6 (voix), Music (instrumental), orientation agent-centric.
- Coût : MiniMax revendique des tokens parfois jusqu’à 20× moins chers que certains concurrents sur des tâches comparables.
- Vigilance : expansion internationale sous tension, avec des poursuites aux États-Unis liées aux droits d’auteur sur des contenus générés.
De Shanghai à Hong Kong, la vitesse comme signature
MiniMax s’est construite comme une entreprise de produit, mais avec un tempo de société d’infrastructure : lever vite, itérer vite, déployer vite. Ce rythme façon start-up d’exécution nourrit autant sa valorisation que son image auprès des investisseurs.
Une filiation SenseTime, et l’étiquette “Six Tigres de l’IA”
La genèse compte, surtout sur un marché où la crédibilité technique conditionne l’accès au capital, aux talents et aux partenaires. MiniMax naît en décembre 2021 à Shanghai, portée par Yan Junjie (ancien vice-président de SenseTime) et Zhou Yucong, tous deux issus de la grande IA chinoise.
Très tôt, l’entreprise intègre le récit des “Six Tigres de l’IA” chinois : un groupe de jeunes pousses présentées comme les candidates naturelles à l’Intelligence artificielle générale (AGI), ou au moins à des systèmes plus généraux, plus autonomes et plus multimodaux. Concrètement, cette étiquette sert de raccourci : elle signifie “ambition plate-forme” plutôt que “fonctionnalité isolée”. MiniMax ne vend pas seulement des features, elle vend une trajectoire à long terme.

Alibaba, Tencent… et la bataille de l’infrastructure IA
Cette trajectoire s’alimente, très concrètement, en cash et en capacité de calcul. En mars 2024, MiniMax boucle une levée de fonds de 600 millions de dollars (≈ 516 millions d’euros) menée par Alibaba, qui valorise la startup à 2,5 milliards de dollars (≈ 2,15 milliards d’euros). D’autres noms s’installent au capital : Tencent, HongShan (Sequoia China), Hillhouse Investment, IDG Capital.
Ce casting illustre un déplacement de pouvoir : les géants tech ne se contentent plus “d’observer” l’IA, ils l’absorbent. Ils cherchent à sécuriser des modèles, des talents et des usages, comme on sécurise une ressource stratégique. Contrôler les modèles, c’est verrouiller une partie des chaînes de valeur numériques.
L’IPO de janvier 2026, moment de bascule
En juillet 2025, MiniMax ajoute 300 millions de dollars (≈ 258 millions d’euros) via une extension de série B, et sa valorisation grimpe à 4 milliards de dollars (≈ 3,44 milliards d’euros). Puis arrive l’événement qui change le statut : l’introduction en bourse au Hong Kong Stock Exchange, le 9 janvier 2026. L’action bondit de 109% dès le premier jour, avec une capitalisation atteignant 12,8 milliards de dollars (≈ 11,01 milliards d’euros).
La Bourse ne “récompense” pas une démo de laboratoire. Elle parie sur une capacité à industrialiser : flux de revenus récurrents, contrôle des coûts, et surtout, différenciation technologique défendable face aux concurrents.
Le moteur technique : long contexte, MoE et efficacité en inférence
Si MiniMax attire autant l’attention, ce n’est pas seulement pour sa trajectoire financière. L’entreprise met en avant des choix d’architecture qui ciblent le long contexte, la performance en Mixture-of-Experts et l’efficacité en inférence.
Lightning Attention : désengorger le Transformer
Le Transformer classique, pilier des LLM, a un talon d’Achille : quand le contexte s’allonge, le coût de calcul explose. Lightning Attention, chez MiniMax, est présenté comme une architecture hybride conçue pour dépasser ces goulots d’étranglement et lisser les pics de charge.
Une image simple aide à comprendre : c’est comme élargir une autoroute tout en ajoutant des voies réservées. Les données circulent mieux, et l’on évite que chaque nouveau paragraphe “bloque” tout le reste. Et le long contexte ne sert pas qu’à “se souvenir”. Il sert à raisonner sur de grands volumes : dossier juridique, base de code, logs de production ou mois d’échanges clients.
Mixture-of-Experts : énorme modèle, activation sélective
MiniMax-01 s’appuie sur une structure Mixture-of-Experts (MoE). Le principe : au lieu d’activer tout le réseau à chaque requête, le modèle active seulement une partie des “experts”, choisis dynamiquement en fonction de la tâche. MiniMax annonce 456 milliards de paramètres, dont 45,9 milliards activés par token.
En pratique, cela donne la puissance d’un très grand modèle, mais avec un coût de calcul limité à chaque étape. Le résultat attendu est un avantage sur le couple coût/latence, donc sur le produit final. Dans les usages “agent-centric”, la latence compte autant que la qualité : un agent qui attend trop longtemps, c’est un agent qui échoue aux yeux de l’utilisateur.
4 millions de tokens et NCR : l’obsession du rendement
MiniMax met en avant des fenêtres de contexte jusqu’à 1 million de tokens à l’entraînement et jusqu’à 4 millions de tokens en inférence (la phase où le modèle répond). Pour un lecteur non spécialiste : un token est une unité de texte manipulée par le modèle (morceau de mot, mot, ponctuation). Plus il y en a, plus on élargit la “mémoire de travail” disponible.
À ce long contexte s’ajoute une logique d’efficacité via NCR (Noise-Aware Compute Redistribution), intégrée dans Hailuo 02, qui augmenterait l’efficacité par un facteur de 2,5. MiniMax cherche donc à gagner sur deux fronts : contexte plus vaste et calcul moins coûteux. C’est un duo rare, et c’est exactement ce que demandent les entreprises qui travaillent sur de grands corpus.
Multimodalité : quand le modèle devient studio, et l’app devient canal
La multimodalité n’est plus une promesse marketing. Chez MiniMax, elle structure un écosystème : modèles fondamentaux d’un côté, produits grand public et outils créateurs de l’autre, tous connectés par la même infrastructure.

Hailuo AI et Video-01 : vidéo 1080p “physics-aware”
Avec Hailuo AI, MiniMax pousse la génération vidéo vers une ambition “cinématique”. Les modèles Hailuo 2.3 et Video-01 promettent des clips 1080p avec une physique plus crédible, un rendu dit physics-aware, c’est-à-dire sensible aux contraintes de mouvement, de contact et de cohérence visuelle.
Pour les équipes marketing, créatives ou produit, cela ressemble à un nouvel atelier de production. On prototype des scènes comme on prototypait hier des maquettes : une variante de publicité devient une requête, une déclinaison devient une nouvelle inférence, et le montage se rapproche d’un dialogue continu avec le modèle.
Talkie/Xingye : 29 millions d’utilisateurs et l’économie de l’attachement
MiniMax ne se contente pas du B2B. L’application Talkie (appelée Xingye en Chine) a dépassé 29 millions d’utilisateurs actifs mensuels fin 2024 et s’est hissée parmi les applications de divertissement les plus téléchargées aux États-Unis.
Les compagnons virtuels servent ici de banc d’essai grandeur nature. Ils testent des briques clés de l’AGI “pratique” : conversation longue durée, personnalisation, mémoire, gestion d’émotions, et surtout, rétention. Ce n’est pas un laboratoire isolé, c’est une usine à signaux comportementaux qui alimente ensuite les modèles.
Speech 2.6, Music, Glow : la chaîne audio s’automatise
L’écosystème se complète avec MiniMax Speech 2.6 pour le clonage vocal en temps réel et MiniMax Music pour générer des morceaux instrumentaux. L’enjeu n’est pas seulement créatif, il est opérationnel : produire une voix off, une ambiance sonore ou une variation linguistique, puis itérer à la minute.
Pour une entreprise européenne, ce type de stack pose une question simple : acheter des briques séparées (texte, audio, vidéo), ou une filière intégrée ? MiniMax parie sur l’intégration, avec un Glow de production qui joue le rôle de studio automatisé. La matière première, ce sont des prompts, des contraintes et des données internes encadrées.
Prix, automatisation, conformité : la partie la plus politique du produit
La performance d’un modèle ne suffit plus à départager les acteurs. Ce qui fait la différence, ce sont le coût réel, la conformité réglementaire et la capacité à s’insérer dans des cadres locaux très différents.
Des tokens jusqu’à 20× moins chers : avantage immédiat, question durable
MiniMax revendique une tarification agressive, avec des tokens pouvant coûter jusqu’à 20 fois moins cher que ceux de concurrents comme Claude sur certaines tâches. Vu d’une direction IT, c’est une promesse de ROI rapide : plus de tests, plus de déploiements, plus d’automatisation pour un budget constant.
Reste une question clé : ce différentiel est-il un simple “prix d’appel” ou le reflet d’une structure de coûts réellement plus efficace ? En IA, le prix est un signal : il peut traduire une supériorité technique, mais aussi une stratégie de conquête de parts de marché.
70% du code, 90% de l’analyse : l’entreprise qui s’auto-automatise
MiniMax affirme utiliser massivement sa propre IA en interne : 70% du code et 90% de l’analyse de données seraient générés par ses modèles. C’est un point clé, souvent négligé : la compétitivité ne vient pas seulement de l’algorithme, mais de l’organisation qui l’emploie.
Une analogie s’impose. Deux restaurants peuvent avoir la même recette ; celui qui automatise l’approvisionnement, la préparation et le service sert plus vite, plus régulièrement, et à moindre coût. Ici, le “service”, ce sont des releases produits et des itérations modèles, produites en continu. L’automatisation interne devient ainsi un avantage concurrentiel cumulatif, difficile à rattraper.
Droits d’auteur et conformité : le risque qui suit la croissance
La croissance mondiale de la génération de contenus se heurte à une réalité : le droit. MiniMax a fait face à des poursuites aux États-Unis de la part de studios comme Disney et Warner Bros, liées aux droits d’auteur sur des contenus générés.
Pour l’Europe et la France, la question se pose immédiatement : traçabilité des données d’entraînement, gestion des opt-out, documentation détaillée, et, côté entreprise, politiques d’usage claires (qu’a-t-on le droit de générer, avec quels matériaux, pour quel canal ?). La “multimodalité” implique aussi une multitude de risques : juridiques, réputationnels et contractuels, qui imposent des garde-fous.
Plus un outil est pratique, plus il se diffuse. Et plus il se diffuse, plus il devient visible, donc attaquable. Dans la course à l’AGI, la conformité n’est pas un supplément de confort : c’est un passage obligé pour tout acteur qui vise l’échelle.
Les actus IA de MiniMax :
MiniMax M2.7 franchit un cap avec l’IA auto-évolutive
Le 18 mars 2026, la startup MiniMax a dévoilé son nouveau modèle phare, le M2.7. Cette version ne se contente pas d’être plus performante ; elle a participé de manière active à sa propre conception. L’ère des modèles d’IA auto-évolutifs vient de franchir une étape décisive. À retenir Le MiniMax…
La Chine siphonne Claude et rend les sanctions sur les puces presque inutiles
Alors que le secteur de l’intelligence artificielle entre dans une phase de tensions ouvertes, Anthropic vient de confirmer ce que beaucoup redoutaient : la Chine a méthodiquement exploité les capacités de son modèle phare, Claude, à une échelle industrielle. Dans un rapport technique publié le 23 février 2026, l’entreprise américaine…
MiniMax M2.5 frappe fort avec une IA 20x moins chère que Claude
Alors que les géants américains de l’IA dominent encore le marché avec des modèles coûteux et des architectures fermées, une licorne chinoise vient de bousculer l’ordre établi. Le MiniMax M2.5, dévoilé le 13 février 2026, n’est pas seulement un nouveau modèle : c’est une déclaration de guerre économique. Avec des…
MiniMax M2.1, l’IA open source qui bouscule les géants
Le 23 décembre 2025, MiniMax, l’un des « Tigres de l’IA » de Shanghai, a dévoilé le modèle M2.1, présenté comme l’outil open source le plus puissant de l’ère des agents intelligents. Avec 230 milliards de paramètres, mais seulement 10 milliards activés par token, le modèle dépasse certains concurrents propriétaires tels que Gemini 3.0 Pro, Claude 4.5 Sonnet…
Moonshot AI et MiniMax bousculent la suprématie de l’IA US
La Chine se place désormais à la pointe de la course à l’intelligence artificielle, portée par deux startups, Moonshot AI et MiniMax, dont les modèles rivalisent avec les titans américains. Leur ascension, marquée par des levées de fonds massives et des performances inédites, remet en question la domination d’OpenAI et…
MiniMax-M2 : découvrir ce LLM open-source taillé pour le code
Le MiniMax-M2, nouveau grand modèle de langage open-source lancé en octobre 2025 par la startup chinoise MiniMax AI, bouleverse les workflows de codage et d’automatisation agentique grâce à son architecture ultra-efficace. Soutenu par Alibaba et Tencent, il atteint le sommet des classements open-source mondiaux tout en divisant par huit les…


Laisser un commentaire
Vous devez vous connecter pour publier un commentaire.