Sommaire
Paul DeMott propose un framework en cinq couches destiné à mesurer la performance du GEO (« Generative Engine Optimization »). L’objectif est de dépasser les simples dashboards de visibilité IA afin de rapprocher davantage les données GEO des signaux business réels.
Les dashboards GEO ne suffisent plus
Paul DeMott part d’un constat simple. Beaucoup d’agences utilisent aujourd’hui des métriques comme :
- le taux de présence dans les réponses IA,
- les citations,
- ou, dans les pays où ils sont déployés, la visibilité dans les AI Overviews.
Selon Paul DeMott, ces indicateurs restent toutefois insuffisants lorsqu’il s’agit de démontrer un impact réel sur le pipeline ou le chiffre d’affaires.
L’auteur compare d’ailleurs la situation actuelle du GEO à celle du paid media à la fin des années 2000, lorsque les impressions étaient visibles, mais beaucoup plus difficiles à relier précisément au revenu généré.
Une approche basée sur cinq couches
Le framework présenté repose sur plusieurs niveaux d’analyse qui doivent être utilisés ensemble.
Paul DeMott insiste sur un point. L’objectif n’est pas d’obtenir une boucle d’attribution parfaite, mais plutôt de croiser plusieurs signaux imparfaits afin d’identifier des tendances crédibles.
Première couche, l’attribution directe
La première couche repose sur le trafic provenant directement des moteurs IA. Selon l’auteur, il s’agit du signal le plus clair disponible actuellement :
- un utilisateur voit une réponse IA,
- clique sur un lien,
- puis arrive sur le site.
Le problème est que GA4 mesure encore mal ce trafic. Paul DeMott cite notamment une analyse de Loamly portant sur plus de 446 000 visites début 2026. Selon cette étude, 70,6 % du trafic IA apparaissait comme trafic direct dans GA4 par défaut.
L’auteur évoque aussi les difficultés croissantes liées aux navigateurs agentiques. Des outils comme ChatGPT Atlas ou Perplexity Comet peuvent utiliser des user-agents similaires à Chrome classique, ce qui rend l’identification du trafic IA beaucoup plus complexe au niveau HTTP.
Les logs deviennent une couche d’analyse importante
La deuxième couche concerne l’analyse des logs serveur. Paul DeMott estime que beaucoup d’agences négligent encore cette source de données pourtant disponible sur la majorité des serveurs web. Il distingue trois grandes catégories de bots IA :
Les crawlers d’entraînement
Ils incluent notamment :
- GPTBot,
- ClaudeBot,
- Bytespider,
- CCBot.
Leur présence indique surtout que les contenus sont explorés pour l’entraînement ou l’amélioration des modèles.
Les crawlers de recherche et d’indexation
Cette catégorie comprend notamment :
- OAI-SearchBot,
- Claude-SearchBot,
- PerplexityBot,
- DuckAssistBot.
Selon l’auteur, ces bots représentent davantage un signal d’éligibilité aux citations IA.
Les fetchers déclenchés par les utilisateurs
Les user-agents comme :
- ChatGPT-User,
- Claude-User,
- Perplexity-User,
- MistralAI-User,
correspondent davantage à des récupérations liées à une requête utilisateur réelle.
Google reste plus difficile à isoler
Paul DeMott précise également que les systèmes IA de Google restent plus compliqués à identifier dans les logs. Des user-agents comme :
- Google-Agent,
- Google-NotebookLM,
existent bien, mais, dans les pays concernés, AI Overviews et AI Mode utilisent aussi l’infrastructure de crawl classique de Google. Selon Paul DeMott, il reste donc difficile de distinguer précisément le crawl SEO classique des récupérations liées aux réponses IA.
Des ratios crawl / trafic très élevés
L’analyse s’appuie aussi sur plusieurs données issues de Cloudflare. Les ratios entre le volume de crawl et les visites réelles restent extrêmement élevés pour certains acteurs IA :
- OpenAI atteindrait des ratios supérieurs à 1 700:1,
- Anthropic dépasserait parfois 70 000:1.
À titre de comparaison, Google serait plus proche de 14:1 selon les données citées. L’auteur insiste toutefois sur un point important. Ces volumes de récupération ne représentent pas du trafic utilisateur réel, mais plutôt une pression de récupération exercée par les systèmes IA sur les contenus.
Le partage de voix devient une troisième couche
La troisième couche repose sur le « Share of Voice » dans les réponses IA (part de visibilité d’une marque par rapport à ses concurrents sur un ensemble de requêtes). Paul DeMott estime toutefois que cette métrique devient rapidement une vanity metric lorsqu’elle n’est pas rapprochée :
- du trafic direct,
- des recherches de marque,
- ou des données business réelles.
Il recommande de suivre les tendances sur plusieurs semaines plutôt que de chercher des mesures absolues trop précises.
Les outils GEO donnent parfois des résultats très différents
Le document souligne également un problème de cohérence entre plateformes GEO. Selon l’auteur, des outils comme :
- Profound,
- AthenaHQ,
- Semrush AI Visibility,
- Ahrefs Brand Radar,
- ou Otterly,
peuvent afficher des résultats très différents pour une même marque au même moment. Paul DeMott recommande donc de considérer ces plateformes comme des outils de tendance plutôt que comme des systèmes de mesure absolus.
Interroger directement les IA
Une autre couche importante du framework consiste à analyser ce que les IA disent réellement d’une marque. L’auteur recommande de poser régulièrement aux modèles des questions portant notamment sur :
- les forces d’une entreprise,
- ses faiblesses,
- son positionnement,
- ses clients idéaux,
- ou ses différences face aux concurrents.
L’objectif est notamment d’identifier :
- les erreurs factuelles,
- les biais de perception,
- les sources utilisées,
- ou les informations manquantes.
Le déclaratif client garde une valeur
La quatrième couche concerne les formulaires et les échanges commerciaux. Paul DeMott recommande d’ajouter dans les formulaires de lead des options permettant d’indiquer :
- ChatGPT,
- Gemini,
- Claude,
- Perplexity,
- ou d’autres moteurs IA comme source de découverte.
L’auteur conseille également de faire remonter ces données dans le CRM afin de suivre leur impact jusqu’aux opportunités commerciales ou aux ventes closes.
Une logique d’incrémentalité
La cinquième couche tente de mesurer l’impact global du GEO à travers des comparaisons entre groupes de clients. Paul DeMott reconnaît toutefois les limites de cette approche.
Contrairement au paid media, il n’est pas possible de couper totalement un moteur IA dans une région ou sur un marché donné afin de créer un véritable groupe témoin.
L’auteur présente donc cette couche davantage comme un benchmark statistique que comme une preuve causale absolue.
L’avis de Position Zéro
Cette analyse montre surtout que la mesure du GEO reste encore très imparfaite. Les outils actuels donnent des signaux intéressants, mais aucun ne permet aujourd’hui de mesurer précisément l’impact réel des moteurs IA sur le trafic ou le chiffre d’affaires.
Il paraît donc préférable de ne pas tout déployer d’un coup. Commencez plutôt par les éléments les plus simples à mettre en place et réellement adaptés à votre marché. En France, par exemple, nous n’avons toujours pas AI Overviews ni AI Mode dans Search.
L’idée est surtout de construire progressivement son propre système de mesure selon ses besoins, ses outils et ses objectifs. Un dashboard GEO peut servir de comparateur pour suivre certaines évolutions, mais il ne doit pas être considéré comme une preuve de performance à lui seul.