OpenAI a lancé le 5 mai 2026 GPT-5.5 Instant, qui remplace immédiatement GPT-5.3 Instant comme modèle par défaut de ChatGPT. Pensé pour des centaines de millions d’utilisateurs quotidiens, il privilégie la fiabilité dans les usages professionnels tout en conservant une latence très faible. Cette mise à jour répond directement aux retours sur les hallucinations et vise des réponses plus précises au quotidien.
À retenir
- GPT-5.5 Instant est le modèle par défaut depuis le 5 mai 2026 pour tous les utilisateurs de ChatGPT.
- 52,5 % d’hallucinations en moins dans les domaines du droit, de la médecine et de la finance selon les tests internes d’OpenAI.
- Score de 81,2 % au test AIME 2025, contre 65,4 % pour GPT-5.3 Instant.
- Fonctionnalité Memory Sources permettant de visualiser et corriger le contexte utilisé (conversations, fichiers, Gmail).
- Réponses environ 30 % plus courtes et ton plus professionnel, avec moins d’emojis.
- Optimisé pour l’inférence sur les systèmes NVIDIA GB200 et GB300 NVL72.
- Accès limité selon les forfaits : 10 messages toutes les 5 heures pour les comptes gratuits.
Un modèle par défaut conçu pour l’usage quotidien
OpenAI présente GPT-5.5 Instant comme le modèle principal de ChatGPT. Contrairement aux versions Thinking, plus puissantes mais plus lentes, lancées en avril, il doit absorber la majorité des requêtes quotidiennes sans baisse notable de qualité.
Un remplacement pensé pour la majorité des utilisateurs
Le déploiement du 5 mai est immédiat et global. Tous les utilisateurs basculent automatiquement sur GPT-5.5 Instant. OpenAI a choisi cette stratégie pour proposer une expérience stable plutôt que de multiplier les options techniques. L’objectif est de rendre le modèle plus simple à utiliser et plus prévisible au plus grand nombre.

Une latence maintenue malgré une complexité accrue
Les équipes d’OpenAI ont optimisé l’inférence pour les architectures NVIDIA GB200. Le temps de réponse reste comparable à celui de GPT-5.3 Instant, alors que le raisonnement interne s’est densifié. Cette optimisation matérielle permet de servir davantage d’utilisateurs simultanément sans dégrader l’expérience en temps réel.
Une réduction mesurée des hallucinations dans les domaines sensibles
La principale évolution annoncée concerne la fiabilité factuelle. OpenAI communique des chiffres issus de ses tests internes et des signalements d’utilisateurs.
Une amélioration sensible en droit, médecine et finance
Sur les conversations complexes signalées par les utilisateurs, le taux d’inexactitude a baissé de 37,3 %. Dans les domaines réglementés, la réduction des hallucinations atteint 52,5 % par rapport à la version précédente. Ces progrès viennent d’un travail sur l’exactitude factuelle et d’un entraînement ciblé sur des données vérifiées.
Des résultats chiffrés sur les benchmarks
Le modèle atteint 81,2 % au test AIME 2025, un benchmark de mathématiques avancées. GPT-5.3 Instant enregistrait 65,4 % sur le même exercice. Ces gains montrent une meilleure capacité à enchaîner des raisonnements rigoureux sans inventer d’étapes intermédiaires. Le score sur d’autres évaluations comme MMMU-Pro progresse également, avec davantage de cohérence dans les réponses longues.
Transparence et concision au service de l’utilisateur
OpenAI ajoute des outils de contrôle et modifie le style de réponse pour rendre les échanges plus professionnels et plus traçables.

Memory Sources : visibilité et correction du contexte
La nouvelle fonctionnalité Memory Sources affiche précisément les éléments utilisés pour générer chaque réponse : conversations antérieures, fichiers téléversés ou courriels Gmail connectés. L’utilisateur peut consulter ces sources, supprimer des données obsolètes ou désactiver temporairement une source. Cette option est d’abord proposée aux abonnés Plus et Pro avant un déploiement plus large. Elle répond à une demande croissante de contrôle sur les données personnelles exploitées.
Un style plus direct et 30 % plus court
GPT-5.5 Instant a été entraîné pour réduire la verbosité et limiter les emojis inutiles. Les réponses gagnent en densité tout en conservant l’information essentielle. Cette sobriété améliore la lisibilité et réduit le temps de lecture, surtout dans un contexte professionnel. Les utilisateurs peuvent toujours demander un ton plus détaillé si nécessaire.
Des limites d’usage adaptées à chaque forfait
Les quotas restent différenciés : 10 messages toutes les 5 heures pour les comptes gratuits, 160 messages toutes les 3 heures pour les abonnés Plus et Go. Via l’API, le modèle est accessible sous l’alias chat-latest. GPT-5.3 Instant reste disponible pour les abonnés payants pendant trois mois afin de permettre une transition progressive. Ces paramètres visent à garantir une disponibilité stable sans sacrifier la qualité de service.

















Laisser un commentaire
Vous devez vous connecter pour publier un commentaire.