AWS déploie ses instenses avec GPU NVIDIA H100 et Blackwell

·

·

AWS annonce des innovations clés avec les instances P5 GPU et UltraServers P6e-GB200
Résumer cet article avec :

Amazon Web Services déploie le 18 août 2025 une série d’innovations majeures visant à conserver son avance sur le marché du cloud. Les instances EC2 P5 à GPU unique ouvrent l’accès au GPU NVIDIA H100 pour 10 € l’heure en Europe, tandis que les UltraServers P6e-GB200 dépassent les 20 petaflops pour les plus gros modèles de langage. Ces lancements s’accompagnent de nouveaux outils de sécurité, de pilotage d’infrastructure et de bases de données.


À retenir

  • Disponibilité immédiate des instances EC2 P5 à GPU unique H100 dans la région Europe (Londres) à partir de 10,30 € l’heure.
  • UltraServers SageMaker P6e-GB200 : 72 GPU Blackwell, 360 petaflops FP8, 13,4 TB de mémoire HBM3e, 30× plus rapide que la génération précédente.
  • Support étendu de Cilium sur Amazon EKS Hybrid Nodes pour simplifier la gestion réseau des clusters Kubernetes.
  • Pilote AWS Advanced Go en disponibilité générale pour Amazon RDS et Aurora, réduisant les temps de basculement à quelques secondes.
  • Modèles open-weight d’OpenAI (gpt-oss-120b et gpt-oss-20b) disponibles sur AWS Bedrock et SageMaker.
  • Programme de mentorat gratuit BeSA démarrant le 6 septembre 2025.

Des GPU NVIDIA H100 et Blackwell à la portée des PME

Les instances EC2 P5 à GPU unique deviennent généralement disponibles le 18 août 2025. Elles embarquent un seul GPU NVIDIA H100 et offrent désormais une allocation flexible par GPU plutôt que par serveur complet. Cette granularité réduit la facture horaire à 10,30 € en région Europe (Londres) contre près de 50 € pour une instance P5 multi-GPU. Les cas d’usage ciblés sont l’inférence de modèles de langage de taille moyenne, la simulation financière ou pharmaceutique et le calcul haute performance.

Le support étendu de Cilium sur Amazon EKS Hybrid Nodes simplifie la gestion réseau des clusters Kubernetes. Cilium remplace kube-proxy et fournit nativement des stratégies de sécurité réseau Kubernetes, un équilibrage de charge intra-cluster et une ingestion d’applications sans configuration manuelle. L’intégration est certifiée par la Cloud Native Computing Foundation et fonctionne aussi bien sur les nœuds AWS que sur les serveurs on-premise.

UltraServers P6e-GB200 : 360 petaflops dédiés aux modèles à un trillion de paramètres

Amazon SageMaker HyperPod intègre désormais les UltraServers P6e-GB200. Ces serveurs réunissent 72 GPU NVIDIA Blackwell sous un seul domaine NVLink et atteignent 360 petaflops FP8 avec 13,4 TB de mémoire HBM3e. La bande passante NVLink de 130 TB/s assure 30× plus de rapidité d’inférence sur les grands modèles de langage. Deux tailles sont proposées : ml.u-p6e-gb200x36 (36 GPU) et ml.u-p6e-gb200x72 (72 GPU).

Optimisation des coûts et quotas granulaires

SageMaker HyperPod permet désormais d’attribuer des quotas de GPU, vCPU ou mémoire à l’échelle individuelle et de réserver des blocs de capacité pour éviter la contention réseau. Ces ressources sont disponibles exclusivement dans la zone locale us-east-1-dfw-2a via des plans de formation flexibles.

Pilote AWS Advanced Go et 10 ans d’Amazon Aurora

Le pilote AWS Advanced Go devient généralement disponible le 13 août 2025. Conçu pour Amazon RDS et Amazon Aurora compatibles PostgreSQL et MySQL, il réduit le temps de basculement du writer à quelques secondes et permet l’authentification via AWS Secrets Manager ou IAM. Distribué sous licence Apache 2.0, il est installable sur Windows, macOS ou Linux via GitHub.

AWS célèbre le 21 août 2025 les 10 ans d’Amazon Aurora lors d’un événement en direct. Parallèlement, Amazon RDS for Oracle prend en charge le Spatial Patch Bundle de juillet 2025 et MariaDB propose une montée de version automatique des versions mineures.

Agents IA ouverts et pilotage cloud en langage naturel

OpenAI a publié sur AWS ses premiers modèles open-weight gpt-oss-120b et gpt-oss-20b. Ces modèles sont accessibles via Amazon Bedrock et SageMaker JumpStart et offrent aux entreprises une alternative aux modèles propriétaires.

Deux nouveaux services d’Amazon Bedrock AgentCore simplifient la gestion des agents IA :

  • AgentCore Identity centralise les identités et les clés API via OAuth 2.0 et Sigv4.
  • AgentCore Gateway sert de serveur d’outils unifié pour connecter les agents aux services AWS et tiers.

L’AWS Cloud Control API (CCAPI) MCP Server permet de créer, lire, mettre à jour ou supprimer des ressources cloud à l’aide de phrases en langage naturel. Cette fonctionnalité est également disponible sur Amazon DynamoDB via Console-to-Code alimenté par Amazon Q Developer.

Formation gratuite et leadership Gartner

La cohorte du programme BeSA (Become a Solutions Architect) débute le 6 septembre 2025. Cette formation gratuite de six semaines est animée par des architectes AWS bénévoles et se concentre sur la migration et la modernisation vers le cloud.

Pour la quinzième année consécutive, AWS est nommé Leader du Gartner Magic Quadrant 2025 pour les services de plateforme cloud stratégiques. Six nouveaux Héros AWS ont également été récompensés pour leurs contributions techniques à la communauté.

Les prochains événements incluent AWS re:Invent 2025 à Las Vegas du 1er au 5 décembre, ainsi que des sommets gratuits à Johannesburg le 20 août et à Toronto le 4 septembre 2025.


Sur le même Thème :