Chrome teste WebMCP, un protocole qui rend les sites web lisibles par les IA

·

·

Photo d’un ordinateur portable affichant un navigateur web futuriste où des agents d’IA interagissent directement avec des outils structurés, illustrant le protocole WebMCP dans Chrome Canary qui remplace le screen-scraping.
Résumer cet article avec :

Le 10 février 2026, Google a officiellement lancé WebMCP (Web Model Context Protocol) en version d’early preview, une innovation qui pourrait bien marquer un tournant dans la manière dont les agents d’intelligence artificielle interagissent avec le web. Ce nouveau protocole, présenté par André Cipriani Bandarra de l’équipe Chrome, promet de remplacer les méthodes actuelles, souvent fragiles et inefficaces, comme le screen-scraping, par une communication directe et structurée entre les sites web et les agents d’IA. Pour des experts comme Dan Petrovic ou Glenn Gabe, il s’agit du changement le plus important dans le SEO technique depuis l’introduction des données structurées.


À retenir

  • WebMCP est un protocole conçu pour transformer chaque site web en un outil structuré et lisible par machine pour les agents d’IA.
  • Il remplace le screen-scraping par une communication directe via des Tool Contracts, réduisant les erreurs et les hallucinations.
  • Deux API sont proposées : Declarative API (sans JavaScript) et Imperative API (avec JavaScript).
  • Les premiers tests montrent une réduction de 90 % de la consommation de jetons par rapport aux méthodes actuelles.
  • Disponible en early preview dans Chrome 146 Canary, avec des outils de débogage comme l’Model Context Tool Inspector.
  • Objectif : standardiser l’Agentic Web pour une interopérabilité future entre navigateurs.

Si le screen-scraping – cette pratique consistant à analyser visuellement les pages web comme le ferait un humain – a permis aux agents d’IA de naviguer sur le web, elle reste une solution lente, coûteuse et peu fiable. Les agents doivent interpréter des pixels, deviner le rôle des boutons ou des formulaires, et corriger en permanence leurs erreurs. Résultat : une consommation excessive de ressources (notamment de jetons pour les modèles comme Gemini ou Claude), des délais d’exécution allongés, et un risque accru d’hallucinations – ces réponses erronées générées par l’IA lorsqu’elle mal interprète une page.

Avec WebMCP, Google propose une alternative radicale. Le protocole repose sur un principe simple : chaque élément interactif d’un site web (boutons, formulaires, liens) peut désormais être décrit de manière explicite, comme une fonction que l’agent d’IA peut appeler directement. Par exemple, un site de voyage n’aura plus besoin d’afficher un calendrier complexe pour qu’un agent réserve un vol. Il suffira de définir un Tool Contract nommé book_flight, avec une description claire de ses paramètres d’entrée (dates, passagers, classe) et de sa sortie (numéro de confirmation). L’agent n’aura plus qu’à soumettre ces données structurées, sans avoir à deviner comment interagir avec l’interface, ce qui simplifie fortement les intégrations.

Cette approche n’est pas totalement nouvelle : des frameworks comme LangChain ou AutoGen utilisent déjà des concepts similaires pour des applications locales ou propriétaires. Mais WebMCP l’étend à l’échelle du web, en intégrant cette logique directement dans les navigateurs, avec un socle standardisé. Pour Glenn Gabe, spécialiste du SEO, cela pourrait démocratiser l’automatisation web :

Les structured tools donneront enfin aux agents une interface claire avec les sites web.
Glenn Gabe, consultant SEO technique

Jusqu’ici, seul un nombre limité de développeurs maîtrisait les techniques avancées de DOM manipulation pour automatiser des tâches complexes. Avec WebMCP, même un site basique pourra exposer des outils utilisables par n’importe quel agent d’IA, sans expertise technique approfondie, ce qui ouvre la porte à une nouvelle vague de services automatisés.


Une architecture technique repensée pour l’efficacité

Pour fonctionner, WebMCP s’appuie sur une nouvelle API de navigateur : navigator.modelContext. Cette API permet aux sites web d’enregistrer des outils structurés (ou structured tools) que les agents d’IA pourront invoquer. Google ne se contente toutefois pas d’imposer une solution unique : le protocole offre deux approches distinctes, adaptées à différents cas d’usage, la Declarative API et l’Imperative API, afin de couvrir autant les sites simples que les applications web avancées.

Développeur français devant un écran affichant une interface de navigateur avec des blocs interconnectés représentant navigator.modelContext et les APIs déclarative et impérative de WebMCP.
L’architecture de WebMCP, via navigator.modelContext et ses structured tools, repose sur deux approches complémentaires : Declarative API et Imperative API pour une intégration souple dans les sites web.

La Declarative API : simplicité et accessibilité

Conçue pour les développeurs qui ne veulent pas – ou ne peuvent pas – modifier leur code JavaScript, la Declarative API permet de définir des outils directement dans le HTML, via des attributs dédiés. Cette approche vise surtout les sites vitrines, les blogs ou les formulaires classiques, pour lesquels une intégration légère est souvent préférable à une refonte complète du front-end.

<form toolname="submit_contact"
      tooldescription="Soumet un formulaire de contact avec les données utilisateur"
      inputschema='{"type": "object", "properties": {"name": {"type": "string"}, "email": {"type": "string"}}}'>
  <!-- Champs du formulaire -->
</form>

Grâce à ces annotations, un agent d’IA pourra comprendre instantanément la structure de ce formulaire et savoir quels champs renseigner, sans avoir à analyser son apparence visuelle. André Cipriani Bandarra souligne que cette approche est particulièrement adaptée aux sites existants :

Ajouter quelques attributs HTML suffit pour rendre un site compatible WebMCP.
André Cipriani Bandarra, ingénieur Chrome chez Google

Aucune refonte majeure n’est donc nécessaire : pour de nombreux sites, quelques lignes d’annotations structurées suffiront pour offrir une interface propre aux agents d’IA, avec un impact limité sur les équipes techniques.

L’Imperative API : puissance et flexibilité

Pour les cas plus complexes – comme les applications dynamiques ou les interfaces utilisateur riches –, Google propose l’Imperative API, qui s’appuie sur du JavaScript. Cette approche permet de gérer des interactions asynchrones, des états dynamiques et des règles métiers avancées, ce qui la rend adaptée aux plateformes SaaS, aux back-offices ou aux sites à fort trafic ayant des logiques de personnalisation.

Un site de réservation, par exemple, pourrait utiliser cette API pour gérer des règles de disponibilité en temps réel, des tarifs fluctuants ou des workflows multi-étapes. Les outils déclarés peuvent alors encapsuler des enchaînements d’actions complexes, tout en exposant aux agents une interface unique et stable, protégée des changements de design.

L’un des avantages majeurs de cette dualité est la réduction drastique de la consommation de jetons. Selon les tests internes de Google, une tâche simple comme remplir un formulaire et soumettre des données consomme 10 fois moins de jetons avec WebMCP qu’avec une approche classique de screen-scraping. Cette efficacité réduit directement les coûts d’exécution pour les éditeurs d’agents et permet d’envisager des scénarios d’usage plus fréquents, voire continus.

JSON Schema et déterminisme : la fin des approximations

Pour éviter les erreurs et les hallucinations, WebMCP s’appuie sur des JSON Schema pour décrire précisément la structure des données attendues et renvoyées par chaque outil. Plutôt que laisser les modèles deviner les formats, les contraintes sont définies explicitement, ce qui permet une validation systématique côté site et une préparation plus rigoureuse côté agent.

{
  "type": "object",
  "properties": {
    "amount": {"type": "number", "minimum": 0},
    "currency": {"type": "string", "enum": ["EUR", "USD", "GBP"]},
    "card_number": {"type": "string", "pattern": "^\d{16}$"}
  },
  "required": ["amount", "currency", "card_number"]
}

Grâce à cette description, l’agent d’IA sait exactement quel format utiliser pour chaque champ, et le site web peut valider les données avant traitement. Cette rigueur élimine une grande partie des ambiguïtés et réduit nettement les risques d’erreurs, un problème récurrent avec les méthodes actuelles qui reposent sur l’analyse du rendu visuel plutôt que sur des contrats formels.


Des cas d’usage concrets qui changent la donne

Pour illustrer le potentiel de WebMCP, Google a présenté plusieurs scénarios concrets où le protocole pourrait rebattre les cartes dans divers secteurs. L’objectif est clair : démontrer que cette évolution n’est pas qu’une avancée technique, mais une amélioration directe de l’expérience utilisateur, en rendant les agents plus fiables, plus rapides et plus prévisibles dans leurs actions.

Smartphone et ordinateur portable dans un café français affichant des interfaces abstraites de réservation de vol, illustrant les cas d’usage e-commerce et voyages rendus plus rapides et fiables par WebMCP.
Dans l’e-commerce et les voyages, WebMCP permet à des agents d’IA d’effectuer des réservations de bout en bout via des données structurées, sans passer par le screen-scraping et ses erreurs.

E-commerce et voyages : des réservations sans friction

Imaginez un agent d’IA qui doit réserver un vol pour un utilisateur. Aujourd’hui, il doit analyser visuellement un calendrier pour sélectionner des dates, interpréter les options de siège et les classes tarifaires, remplir manuellement un formulaire de passagers, puis valider le paiement en devinant le format des données bancaires. Chaque étape est une source potentielle d’erreur, et la moindre modification de design peut casser l’automatisation.

Avec WebMCP, ce processus devient déterministe et transparent. Un site comme Booking.com ou Skyscanner pourrait exposer un outil book_flight avec les paramètres suivants :

  • departure_date (date de départ, format YYYY-MM-DD).
  • arrival_date (date d’arrivée).
  • passengers (tableau d’objets avec âge et nom).
  • payment_method (objet avec numéro de carte, CVV, etc.).

L’agent n’a plus qu’à soumettre ces données structurées, et le site renvoie une confirmation sous forme de JSON. Plus de devinettes, plus de clics simulés, et beaucoup moins de risques d’erreur dans la chaîne de réservation, même lorsque l’interface graphique évolue.

Les bénéfices sont multiples :

  • Vitesse d’exécution : une réservation qui prenait plusieurs secondes (voire minutes) avec du screen-scraping devient quasi instantanée.
  • Fiabilité accrue : le respect des schémas de données limite les saisies incorrectes et les rejets de paiement.
  • Coûts réduits : une baisse significative de la consommation de jetons permet de déployer des agents plus économes et plus nombreux.

Support client et formulaires complexes : fin des tickets mal remplis

Les formulaires de support technique sont souvent un cauchemar pour les agents d’IA. Entre les champs obligatoires cachés, les validations complexes et les messages d’erreur ambigus, remplir un ticket peut devenir un parcours du combattant, aussi bien pour les utilisateurs que pour les systèmes automatisés. Les entreprises doivent ensuite consacrer du temps à compléter ou corriger ces demandes incomplètes.

Avec WebMCP, les entreprises peuvent exposer des outils dédiés comme submit_support_ticket, avec une description claire des champs requis et des formats attendus. Un même point d’entrée peut ainsi servir autant aux utilisateurs humains qu’aux agents, tout en garantissant l’homogénéité et la qualité des informations transmises.

{
  "type": "object",
  "properties": {
    "issue_type": {"type": "string", "enum": ["bug", "feature_request", "account_issue"]},
    "description": {"type": "string", "minLength": 10},
    "priority": {"type": "string", "enum": ["low", "medium", "high"]},
    "attachments": {"type": "array", "items": {"type": "string", "format": "uri"}}
  },
  "required": ["issue_type", "description"]
}

Grâce à cette structure, un agent d’IA peut générer un ticket complet et valide en une seule invocation, sans avoir à interagir manuellement avec l’interface. Pour les entreprises, cela se traduit par moins de tickets incomplets ou mal formatés, et pour les utilisateurs, par une résolution plus rapide de leurs problèmes, les équipes de support recevant enfin des demandes exploitables dès le premier envoi.

Maintenance technique et diagnostics : des agents qui comprennent les systèmes

Dans des domaines comme la cybersécurité ou la maintenance industrielle, les agents d’IA doivent souvent naviguer dans des portails techniques complexes pour diagnostiquer des problèmes. Un agent chargé de surveiller un serveur peut par exemple devoir se connecter à un tableau de bord, consulter des logs, exécuter des commandes et générer un rapport détaillé à destination d’une équipe d’intervention.

Avec WebMCP, chaque étape peut être exposée comme un outil distinct : check_server_logs, run_diagnostic_command ou generate_report. Les paramètres et les sorties sont décrits en JSON Schema, ce qui permet à l’agent de enchaîner ces actions de manière autonome et fiable, tout en respectant les contraintes de sécurité et les limites d’accès définies par l’éditeur du service.

Un cas d’usage concret a été démontré par Google sur un portail médical. Un agent pouvait récupérer les antécédents d’un patient via fetch_patient_record, analyser ces données pour détecter des anomalies avec analyze_medical_data, puis générer une alerte si nécessaire via trigger_alert. Le tout se fait sans aucune interaction manuelle et avec une précision bien supérieure à celle des méthodes actuelles, tout en laissant le dernier mot aux équipes médicales pour la décision clinique.


Disponibilité et adoption : un standard ouvert pour l’Agentic Web

À ce stade, WebMCP est encore en version d’early preview, mais son adoption pourrait s’accélérer rapidement si les développeurs s’en saisissent. Google met en avant une approche de standard ouvert, pensée pour dépasser le seul écosystème Chrome et poser les bases d’un web véritablement pilotable par des agents, quel que soit le navigateur utilisé.

Comment activer WebMCP aujourd’hui ?

Pour tester WebMCP, il faut utiliser la dernière version de Chrome 146 Canary (disponible depuis le 8 février 2026). En pratique, l’activation se fait en quelques étapes, ce qui permet à une équipe technique de mettre rapidement en place un environnement d’expérimentation contrôlé.

  1. Télécharger Chrome Canary depuis chrome.google.com/chrome/canary/.
  2. Activer le flag WebMCP for testing via chrome://flags.
  3. Utiliser l’extension Model Context Tool Inspector (disponible sur le Chrome Web Store) pour déboguer et visualiser les outils exposés par un site.

Google a également mis en ligne une démonstration live accessible pour illustrer les capacités du protocole : travel-demo.bandarra.me. Cette démo montre comment un agent peut réserver un vol en quelques secondes, sans aucune interaction visuelle, et permet aux développeurs de comprendre le flux complet, de la déclaration des outils à leur invocation par un modèle.

Un écosystème en construction : outils et ressources

Pour accompagner les développeurs, Google a publié une documentation technique détaillée qui couvre aussi bien les premiers pas que les intégrations avancées. L’objectif est de réduire au maximum la barrière d’entrée et d’encourager des expérimentations rapides, y compris dans des équipes de taille modeste.

  • Des guides pour implémenter la Declarative API et l’Imperative API.
  • Des exemples de JSON Schema pour différents cas d’usage (e-commerce, support, finance, santé).
  • Un playground en ligne pour tester des outils personnalisés, sans déployer immédiatement en production.

De plus, le protocole est en cours de standardisation au sein d’un W3C Community Group, ce qui laisse entrevoir une adoption future par d’autres navigateurs comme Firefox ou Safari. André Cipriani Bandarra insiste sur ce point stratégique :

Notre ambition est un standard ouvert, utilisable au-delà de Chrome.
André Cipriani Bandarra, ingénieur Chrome chez Google

Si les discussions au W3C aboutissent, l’interopérabilité entre navigateurs deviendra un argument clé pour les entreprises qui hésitent encore à investir dans de nouveaux protocoles d’intégration pour leurs services web.

Quelles sont les prochaines étapes ?

Google n’a pas encore annoncé de date pour une sortie stable, mais plusieurs étapes clés se dessinent déjà sur la feuille de route. Elles donnent un horizon aux équipes qui souhaitent planifier leurs investissements, sans pour autant attendre la généralisation du protocole pour expérimenter.

  1. Fin 2026 : stabilisation de l’API et intégration dans Chrome stable, avec une première vague de sites compatibles.
  2. 2027 : adoption potentielle par d’autres navigateurs via le processus de standardisation du W3C.
  3. 2028 et au-delà : déploiement massif des agents d’IA sur l’Agentic Web, avec une interopérabilité totale entre les outils, les modèles et les plateformes.

En attendant, les développeurs sont encouragés à expérimenter dès maintenant, car les premières entreprises à adopter WebMCP pourraient bénéficier d’un avantage concurrentiel significatif, notamment dans les secteurs où les interactions web répétitives représentent un coût important. Comme le résume Dan Petrovic :

Maîtriser WebMCP tôt, c’est prendre de l’avance sur la prochaine vague d’applications web automatisées.
Dan Petrovic, expert en SEO technique

Une chose est sûre : avec WebMCP, le web entre dans une nouvelle ère, où les agents d’IA ne seront plus de simples visiteurs passifs, mais des utilisateurs à part entière, capables d’interagir de manière fluide et efficace avec n’importe quel site. À condition, toutefois, que les éditeurs se saisissent de ce protocole et commencent à exposer leurs services dans un langage que les modèles peuvent enfin comprendre sans ambiguïté.


Sur le même Thème :

Laisser un commentaire