Sommaire
Google remet en question l’idée selon laquelle des versions Markdown, plus simples et centrées sur le contenu, seraient meilleures pour optimiser un site pour la recherche IA. Selon John Mueller et Martin Splitt, cette approche peut retirer des éléments utiles aux moteurs de recherche.
Le Markdown séduit par sa simplicité
Dans un épisode récent du podcast Search Off the Record, John Mueller et Martin Splitt sont revenus sur l’usage du Markdown dans le cadre du SEO orienté IA.
Le Markdown est un format de rédaction très léger, qui permet de structurer un texte avec des titres, des liens ou des listes sans tout le code HTML d’une page web classique.
L’idée défendue par certains SEO est simple. Une version Markdown contient moins de code qu’une page HTML classique. Elle paraît donc plus facile à lire pour un agent IA ou un LLM, car elle conserve principalement le texte, les liens et une structure minimale.
Martin Splitt reconnaît d’ailleurs cet avantage de lisibilité. Un fichier Markdown reste compréhensible même sans rendu dans un navigateur. Les liens, les titres et le contenu peuvent être lus directement dans un éditeur de texte.
Google estime que le HTML reste facile à traiter
John Mueller nuance fortement cet argument. Selon lui, le web repose sur HTML depuis longtemps, et les crawlers savent très bien l’analyser. Convertir une page HTML en texte est une opération simple, déjà maîtrisée par de nombreuses bibliothèques et par les moteurs de recherche.
L’argument selon lequel le Markdown faciliterait fortement le crawl ou l’indexation perd donc beaucoup de poids dans cette lecture.
Le risque de retirer des éléments utiles
Martin Splitt souligne un autre problème. Le Markdown se concentre surtout sur le contenu principal, mais il peut retirer des éléments qui aident à comprendre la page dans son environnement.
Le HTML contient aussi les liens, la navigation, les en-têtes et différentes structures qui montrent comment une page se connecte au reste du site.
Ces éléments jouent un rôle dans la découverte des pages et dans la compréhension de l’architecture du site. En les supprimant, une version trop allégée peut perdre une partie du contexte utile aux moteurs de recherche.
Le contexte du site compte aussi
Le rappel de Google porte sur un point essentiel. Une page web n’est pas seulement un bloc de texte isolé.
Les moteurs de recherche analysent les pages individuellement, mais aussi comme des parties d’un site, d’une section, d’une catégorie ou d’un réseau de liens. La navigation interne, les relations entre contenus et l’organisation globale donnent des informations que le Markdown peut appauvrir.
Présenter une version Markdown comme alternative SEO à une page HTML complète apparaît donc comme une mauvaise idée…