Mistral Medium 3.5 lance le codage asynchrone avec des agents cloud

·

·

Développeur devant plusieurs écrans montrant Le Chat Pro et des agents de codage Mistral Medium 3.5 exécutant des tâches dans le cloud.
Résumer cet article avec :

Mistral AI a dévoilé Mistral Medium 3.5, un modèle dense de 128 milliards de paramètres qui réunit raisonnement, instruction et codage. Ce nouveau socle alimente les agents distants de Mistral Vibe et le Work mode de Le Chat pour permettre un codage asynchrone dans des sandboxes cloud. Les développeurs peuvent lancer des tâches complexes depuis la CLI ou l’interface Pro, puis les laisser s’exécuter en arrière-plan tout en gardant le contrôle.


À retenir

  • Mistral Medium 3.5 : modèle dense de 128 milliards de paramètres avec un contexte de 256 000 tokens.
  • Architecture unique qui fusionne instruction, raisonnement et codage dans un seul jeu de poids.
  • Performances : 77,6 % sur SWE-Bench Verified et 91,4 % sur τ³-Telecom.
  • Raisonnement configurable par requête et encodeur de vision natif pour images variées.
  • Agents distants exécutés dans des cloud sandboxes pour un codage asynchrone continu.
  • Fonction /teleport pour migrer une session locale vers le cloud sans perte de contexte.
  • Work mode : prise en charge de tâches multi-étapes avec appels d’outils en parallèle.
  • Intégrations avec Gmail, Calendar, Linear, Jira, Slack et Sentry.
  • Open weights sous licence MIT modifiée et optimisation FP8 pour NVIDIA.
  • Prix API : environ 1,29 euro par million de tokens en entrée et 6,45 euros en sortie.

Mistral Medium 3.5 unifie trois compétences majeures en un seul modèle

Mistral AI a choisi une approche différente des architectures Mixture-of-Experts. Le modèle réunit trois domaines dans un unique jeu de poids dense, ce qui simplifie son déploiement.

Une architecture fusionnée sans complexité MoE

Contrairement aux modèles qui répartissent les calculs entre plusieurs experts, Mistral Medium 3.5 fonctionne comme un bloc unique de 128 milliards de paramètres. Cette structure facilite son installation sur une infrastructure réduite. Quatre GPU suffisent pour le faire tourner en production. Le contexte atteint 256 000 tokens, ce qui permet d’inclure un dépôt Git entier ou une spécification technique complète dans une seule session.

Des résultats solides sur les benchmarks de codage

Les tests publiés montrent une progression nette. Mistral Medium 3.5 obtient 77,6 % sur SWE-Bench Verified, un référentiel qui mesure la capacité à corriger des bugs réels. Il atteint aussi 91,4 % sur τ³-Telecom, un benchmark dédié au raisonnement technique. Ces scores le placent devant plusieurs modèles de taille comparable, tout en restant déployable localement.

Utilisatrice de Le Chat Pro en Work mode supervisant sur son ordinateur l’orchestration automatique d’emails, de calendrier et de tickets Jira et Linear.
Le Work mode transforme Le Chat en chef d’orchestre capable de coordonner plusieurs connecteurs comme Gmail, Calendar, Jira ou Slack.

Raisonnement configurable et vision native

L’utilisateur peut choisir le niveau d’effort de raisonnement par requête. Il sélectionne une réponse rapide pour les tâches simples ou une analyse plus poussée quand le problème demande plusieurs étapes. L’encodeur de vision, entraîné spécifiquement pour cette version, traite des images de tailles et de formats variables sans prétraitement supplémentaire, ce qui facilite les cas d’usage mêlant code et captures d’écran.

Mistral Vibe déplace les sessions de codage vers le cloud

Avec cette mise à jour, les sessions de développement ne restent plus cantonnées à la machine locale. Mistral Vibe change la façon de gérer les tâches longues.

Délocalisation des agents vers des sandboxes distantes

Les agents de codage s’exécutent désormais dans des environnements cloud sécurisés. Le développeur lance une tâche depuis la CLI ou Le Chat, puis peut s’absenter. L’agent continue d’avancer et envoie une notification une fois terminé. Ce fonctionnement réduit les blocages liés à l’ordinateur personnel et permet de mener plusieurs projets en parallèle.

La téléportation conserve l’historique et l’état

Une commande /teleport permet de basculer une session CLI locale vers le cloud sans perte de contexte. Les modifications en cours, l’historique des échanges et l’état du projet migrent d’un bloc. Le développeur peut ainsi commencer sur son poste, puis confier la tâche au cloud si la connexion devient instable ou s’il change d’endroit.

Automatisation des flux Git et des pull requests

L’agent clone automatiquement les dépôts, applique des modifications sur plusieurs fichiers et exécute les tests. Une fois les vérifications passées, il crée une pull request et la soumet à la revue. Le travail reste traçable à chaque étape. Les équipes gardent la main sur la validation finale tout en gagnant du temps sur les tâches répétitives.

Le Work mode transforme Le Chat en orchestrateur

Le nouveau mode de travail donne à l’interface Pro davantage d’autonomie. Il repose directement sur Mistral Medium 3.5 et gère des workflows transversaux.

Exécution de projets en plusieurs étapes

L’agent planifie la tâche reçue, la découpe en sous-objectifs et avance étape par étape. Il peut trier une boîte de réception, extraire le contexte d’une réunion à venir et générer le compte-rendu sans intervention manuelle entre chaque phase.

Ingénieur logiciel observant sur un écran la fusion du raisonnement, de l’instruction et du codage dans un seul modèle Mistral Medium 3.5.
Mistral Medium 3.5 unifie trois compétences clés dans un unique jeu de poids dense pour simplifier le déploiement.

Appels d’outils en parallèle aux connecteurs

Les connecteurs vers Gmail, Calendar, Linear, Jira, Slack et Sentry permettent des actions simultanées. Pendant que l’agent lit des messages, il peut déjà préparer un ticket ou mettre à jour le calendrier. Cette exécution parallèle réduit le temps nécessaire pour mener à bien des processus qui exigent souvent plusieurs allers-retours.

Sécurité assurée par les boucles d’approbation

Avant toute action qui modifie des données sensibles ou touche un dépôt de production, l’agent suspend son exécution. Il décrit l’opération prévue et attend la validation explicite de l’utilisateur. Le journal des appels d’outils et la logique de raisonnement restent visibles en temps réel, ce qui facilite le suivi et la correction rapide en cas d’écart.

L’ouverture technique soutient le déploiement en entreprise

Mistral AI a rendu le modèle accessible aux équipes qui gèrent leur propre infrastructure.

Une licence permissive pour un usage commercial

Les poids sont publiés sous une licence MIT modifiée. Elle autorise un usage commercial et non commercial, avec une limite de revenus pour les très grandes structures. Les entreprises françaises peuvent donc l’intégrer à leurs pipelines internes sans frais de licence supplémentaires.

Optimisation pour l’auto-hébergement et les GPU NVIDIA

Le format FP8 natif réduit la mémoire nécessaire. Le modèle complet tient sur un seul nœud H200 ou deux nœuds H100. Les systèmes équipés d’architectures Ampere, Hopper ou Blackwell bénéficient d’une exécution accélérée via NVIDIA NIM ou directement sur Hugging Face. Cette compatibilité facilite les déploiements locaux pour les données sensibles.

Intégration par défaut dans l’écosystème Pro

Mistral Medium 3.5 devient le modèle par défaut pour les comptes Pro, Team et Enterprise sur Le Chat. Il remplace Devstral 2 dans les sessions Vibe. Les utilisateurs accèdent immédiatement aux nouvelles fonctions d’agents distants, sans changer de configuration. Cette mise en place facilite l’adoption du codage asynchrone dans les organisations européennes.


Sur le même Thème :

Laisser un commentaire

Trop d’infos IA ?

Inscrivez-vous à la newsletter pour recevoir un résumé hebdomadaire directement dans ta boite email (et rien d’autre)