Accueil GEO et IA Recherche IA 2025 : l’état du marché en 150 statistiques

Recherche IA 2025 : l’état du marché en 150 statistiques

par Jordan Belly
L'ia modifie l'écosystème de la recherche

L’écosystème de la recherche IA se structure rapidement avec des acteurs, des usages et des impacts mesurables. Joe Youngblood, expert SEO et consultant en marketing digital, a compilé et analysé plus de 150 statistiques provenant des leaders du secteur (Profound, Ahrefs, SEMrush, Local Falcon et Tollbit) pour dresser un panorama exhaustif de cette révolution en cours.

Cette compilation révèle les vraies tendances derrière le battage médiatique, données à l’appui.

L’impact réel du trafic IA : entre promesses et réalité

Premier enseignement des données 2025 : l’écart entre perception médiatique et impact mesurable. Malgré l’attention portée aux outils IA, leur contribution au trafic web reste marginale. Décryptage des chiffres qui relativisent la « révolution » annoncée.

Volume de trafic global

Constat de base (Tollbit) : la recherche IA génère moins de 1 % du trafic web total. Malgré l’attention médiatique, l’impact reste marginal.

Répartition par type de plateforme (Tollbit) :

  • Moteurs de recherche IA (Perplexity, etc.) : CTR de 0,74 %.
  • Systèmes de chatbot IA (ChatGPT, Claude, etc.) : CTR de 0,33 %.

Comparaison avec Google (Tollbit) :

  • Les moteurs IA envoient 91 % de clics en moins que Google.
  • Les chatbots IA envoient 96 % de clics en moins que Google.

Croissance et répartition du marché

Leadership ChatGPT (Ahrefs) :

  • 83 % du trafic IA vers les sites web provient de ChatGPT.
  • Croissance de 85 % entre janvier et juin 2025.
  • Représente 0,165 % de tout le trafic web – plus que Reddit ou LinkedIn (0,198 % pour l’IA globalement).

Autres acteurs (Ahrefs) :

  • Perplexity : 10 % du trafic IA.
  • Microsoft Copilot : 4 % du trafic IA.
  • Autres systèmes : 3 % du trafic IA.

Évolution (Ahrefs) : le trafic des systèmes IA vers les sites web a crû 9,7x entre 2024 et 2025.

Google AI Overviews : L’effet « grande déconnexion »

Déploiement et adoption

Timeline Google :

  • 14 mai 2024 : lancement AI Overviews aux USA (Search Engine Roundtable).
  • 20 mai 2025 : lancement AI Mode aux USA (Search Engine Land).

Fréquence d’apparition (SEMrush) :

  • 15 % des requêtes affichent un AI Overview en juin 2025.
  • 92 % des AI Mode incluent une sidebar avec liens.
  • 51 % de chevauchement entre domaines AI Mode et résultats de recherche classiques.

Impact observé : « The Great Decoupling »

Phénomène baptisé par Darwin Santos (Search Engine Roundtable) : formation d’une « gueule d’alligator » entre :

  • Impressions Google qui montent,
  • Clics depuis Google qui baissent.
  • Problématique tracking : Google refuse de mesurer le trafic généré par les AI Overviews, ce qui rend l’analyse impossible pour les webmasters.
  • Stratégie Google (Search Engine Roundtable, avril 2025) : Google lie désormais d’autres requêtes de recherche dans les AI Overviews, gardant les utilisateurs sur sa plateforme.

Analyse des citations AI Overviews

Chevauchement avec le SEO traditionnel (SEMrush) :

  • 85,79 % de chevauchement entre citations AI Overview et domaines bien classés.
  • 89 % de chevauchement quand les liens apparaissent sous la réponse IA.

Paradoxe des sources (SEMrush) : ChatGPT, Perplexity et AI Overviews puisent souvent leurs citations d’URLs classées au-delà de la page 2 (position 21+) sur les requêtes associées.

Longueur des réponses (SEMrush) : les requêtes commerciales génèrent des réponses AI Mode 2x plus longues que les requêtes informationnelles.

Recherche locale et IA : adoption sélective

Terrain d’expérimentation privilégié : Google déploie ses AI Overviews de manière stratégique sur les recherches locales. L’analyse révèle une logique claire dans cette sélectivité, avec des variations importantes selon l’intention utilisateur.

Déploiement par intention de recherche

Données Local Falcon (mai 2025) :

  • 40 % des recherches locales affichent un AI Overview.
  • Recherches informationnelles locales : 58 % d’AI Overview.
  • Recherches commerciales locales : 17,02 % d’AI Overview.
  • Recherches navigationnelles locales : 10,50 % d’AI Overview.

Secteur des services : taux d’apparition jusqu’à 65 % pour les requêtes de services locaux – le plus élevé.

Explication : Google déploie les AI Overviews prioritairement là où l’IA apporte une valeur ajoutée vs liens directs.

Hiérarchie des sources : qui les IA citent-elles vraiment ?

La question essentielle pour tout créateur de contenu : quels sites les IA privilégient-elles comme sources d’autorité ? L’analyse de millions de citations révèle une hiérarchie claire, avec des surprises qui bousculent les idées reçues sur l’autorité web.

Top global transversal (SEMrush)

Les 19 sites les plus cités par l’ensemble des LLMs :

  1. Reddit : 40,11 % des citations,
  2. Wikipedia : 26,33 % des citations,
  3. YouTube : 23,52 % des citations,
  4. Google.com : 23,28 % des citations,
  5. Yelp : 21,01 % des citations (leader local business),
  6. Facebook : 19,96 % des citations (leader réseaux sociaux),
  7. Amazon : 18,72 % des citations (leader e-commerce),
  8. TripAdvisor : 12,46 % des citations,
  9. MapBox : 11,29 % des citations (ex-aequo),
  10. OpenStreetMap : 11,29 % des citations (ex-aequo),
  11. Instagram : 10,89 % des citations,
  12. MapQuest : 9,76 % des citations,
  13. Walmart : 9,32 % des citations,
  14. eBay : 7,74 % des citations,
  15. LinkedIn : 5,90 % des citations,
  16. Quora : 4,60 % des citations (seul site Q&A du top),
  17. HomeDepot : 4,56 % des citations,
  18. Yahoo! : 4,40 % des citations,
  19. Target : 4,33 % des citations,
  20. Pinterest : 4,22 % des citations.

Spécificités par plateforme IA (Profound)

Perplexity – Top 3 :

  1. Reddit : 46,7 % des citations,
  2. YouTube : 13,9 % des citations,
  3. Gartner : 7,0 % des citations.

Google AI Overviews – Top 3 :

  1. Reddit : 21,0 % des citations,
  2. YouTube : 18,8 % des citations,
  3. Quora : 14,3 % des citations.

ChatGPT – Top 3 :

  1. Wikipedia : 7,9 % des citations,
  2. Reddit : 11,3 % des citations,
  3. Forbes : 6,8 % des citations.

Sources transversales importantes (Profound)

Présentes sur plusieurs plateformes :

  • Forbes : 17,1 % des citations (ChatGPT + Google + Perplexity).
  • NerdWallet : 15,5 % des citations (ChatGPT + Google + Perplexity).
  • LinkedIn : 18,3 % des citations (Google + Perplexity uniquement).
  • Gartner : 14,1 % des citations (Google + Perplexity uniquement).
  • G2 : 10,7 % des citations (ChatGPT + Perplexity uniquement).
  • Business Insider : 9,4 % des citations (ChatGPT + Google uniquement).

Sources spécifiques par plateforme (Profound)

Exclusives à Perplexity :

  • Yelp : 5,8 % des citations.
  • TripAdvisor : 4,1 % des citations.
  • PC Mag : 3,7 % des citations.

Exclusives à ChatGPT :

  • TechRadar : 5,5 % des citations.
  • NY Post : 4,4 % des citations.
  • Reuters : 3,4 % des citations.
  • Toxigon (éditeur indépendant) : 4,1 % des citations.

Exclusives à Google AI Overviews :

  • Medium : 3,9 % des citations.

Domination absolue du trio de tête (Profound)

Cumul des 3 leaders :

  • Reddit : 79 % des citations (toutes plateformes confondues).
  • Wikipedia : 53,6 % des citations (toutes plateformes confondues).
  • YouTube : 32,7 % des citations (toutes plateformes confondues).

Types de domaines privilégiés par les IA

Au-delà des marques, l’extension même du domaine influence-t-elle les citations IA ? Les données révèlent des préférences nettes qui reflètent à la fois l’héritage du web et les nouvelles hiérarchies d’autorité.

Répartition par extension (Profound)

Hiérarchie des TLD dans les citations IA :

  • .com : 80,41 % – domination écrasante.
  • .org : 11,29 % – autorité institutionnelle.
  • .uk : 2,16 % – représentation britannique.
  • .io : 1,67 % – domaines tech/startup.
  • .ai : 1,13 % – domaines spécialisés IA.
  • .net : 1,01 % – infrastructure historique.
  • .co : 0,97 % – alternative commerciale.
  • .au : 0,52 % – représentation australienne.
  • .br : 0,45 % – représentation brésilienne.
  • .ca : 0,39 % – représentation canadienne.

Corrélation autorité (SEMrush) : le nombre de citations IA d’un domaine corrèle fortement avec ses classements top 10 sur Google.

Comportement utilisateur : que cherchent vraiment les gens ?

Comprendre l’usage réel des IA dépasse les métriques de trafic. Comment les utilisateurs interagissent-ils avec ces outils ? Leurs intentions diffèrent-elles des recherches Google traditionnelles ? Les réponses redéfinissent les stratégies de contenu.

Répartition des intentions sur ChatGPT (Profound)

Types de requêtes :

  • Pas d’intention de recherche/Génératif : 49,6 %.
  • Informationnel : 32,7 %.
  • Commercial : 9,5 %.
  • Transactionnel : 6,1 %.
  • Navigationnel : 2,1 %.

Détail du génératif : 37,5% des requêtes ChatGPT sont purement génératives (demander à l’IA de créer quelque chose).

Implication : ChatGPT sert davantage à créer qu’à chercher, ce qui explique le faible CTR vers les sites externes.

Détection de contenu IA par les consommateurs

Capacité de reconnaissance (Joe Youngblood SEO & Digital Marketing Consulting) : 71,63 % des consommateurs américains identifient correctement les photos et graphiques générés par IA générative.

Impact : les utilisateurs développent une méfiance envers le contenu artificiel, qui privilégie les sources authentiques.

Le défi technique : robots.txt et scraping

Le paradoxe de l’IA : ces outils promettent de respecter les directives des webmasters tout en développant des contournements sophistiqués. Entre déclarations publiques et pratiques réelles, l’analyse révèle un paysage complexe où le contrôle du contenu échappe progressivement aux créateurs.

Respect des directives robots.txt

Anthropic (Claude) : respecte robots.txt pour tous les usages (entraînement, scraping et duplication de contenu).

OpenAI (ChatGPT) :

  • Respecte robots.txt seulement pour l’entraînement des modèles,
  • Ignore robots.txt pour les « actions utilisateur » (Joe Youngblood).

Meta (Meta AI/Llama) :

  • Respecte robots.txt seulement pour l’entraînement des modèles,
  • Peut ignorer robots.txt pour les « comportements initiés par l’utilisateur ».

Perplexity :

  • Ne précise pas comment ils crawlent pour l’entraînement.
  • Aucun mécanisme fourni pour bloquer ce comportement.
  • PerplexityBot (crawler de recherche) respecte robots.txt mais n’est pas utilisé pour l’entraînement.
  • Perplexity-user (crawler d’actions utilisateur) prétend respecter robots.txt.

Google (Gemini, AI Mode, AI Overviews) :

  • Respecte robots.txt du user agent « Google-Extended » pour l’entraînement
  • N’honore PAS le blocage Google-Extended pour l’affichage en AI Overview (Joe Youngblood)

Contournements et problématiques

Complexité technique (observations) :

  • Les LLM utilisent plusieurs sources pour l’entraînement (Common Crawl + autres),
  • Partenaires comme Scale AI ne déclarent pas d’user-agent bloquable,
  • Les entreprises ne divulguent plus toutes leurs sources d’entraînement,
  • Possibilité d’utiliser des « search crawlers » pour récupérer du contenu puis l’intégrer dans l’entraînement.

Réaction du marché :

  • 80 % des entreprises bloquent les user-agents LLM quand c’est possible (PPC Land).
  • Certains providers comme SourceHut bloquent carrément tous les systèmes cloud (Google Cloud, Azure, AWS) (The Register).

Impact financier du scraping

Coûts documentés :

  • Startup : facture de près de 6 500 € après que des bots LLM aient déclenché des milliers d’appels automatiques à des services tiers payants (Metacast).
  • E-commerce : 900 € de surcoûts d’hébergement dus aux bots IA (Joe Youngblood).
  • Volume : certains sites subissent des centaines de milliers de visites de scrapers LLM masqués en utilisateurs normaux par mois (Hacker News).

Secteurs gagnants et perdants de l’IA générative

Disruption en cours : au-delà des métriques, quels métiers et industries subissent l’impact direct de l’IA générative ? L’analyse des changements structurels révèle des gagnants inattendus et des perdants qui se dessinent déjà.

Secteurs exprimant des inquiétudes (observations)

Craintes du marché – certains métiers s’interrogent sur l’impact de l’IA générative :

Contenu et médias :

  • Éditeurs s’inquiétant de la réécriture automatique de leurs contenus,
  • Providers d’images stock face à la génération d’images IA,
  • Créateurs visuels questionnant l’évolution du marché.

Métiers de l’écriture :

  • Rédacteurs web craignant l’automatisation des contenus basiques,
  • Copywriters s’interrogeant sur l’évolution de leur métier.

Réalité nuancée : l’IA générative reste un outil d’assistance qui nécessite supervision humaine. Les experts qui l’adoptent pour améliorer leur productivité prennent l’avantage sur ceux qui la perçoivent uniquement comme une menace. L’expertise humaine pour relecture, validation et création originale reste irremplaçable.

Implications stratégiques pour le SEO 2025

Synthèse opérationnelle : comment traduire ces 150+ statistiques en actions concrètes ? L’émergence de nouveaux KPIs, plateformes et métriques d’autorité redéfinit fondamentalement les stratégies de visibilité digitale.

Nouvelles priorités

Présence multiplateforme obligatoire :

  • Reddit (79 % des citations cross-platform),
  • YouTube (32,7 % des citations cross-platform),
  • Wikipedia (53,6 % des citations cross-platform).

Autorité de domaine renforcée :

  • Domaines .com établis dominent (80,41%),
  • Corrélation forte classements Google ↔ citations IA,
  • Marques reconnues surreprésentées.

Métriques adaptées :

  • Tracker les mentions et citations IA, pas seulement le trafic,
  • Monitorer la Share of Voice dans les réponses générées,
  • Mesurer l’autorité perçue par les algorithmes IA.

Stratégies émergentes

Content Authority Building :

  • Créer du contenu de référence citable,
  • Développer une expertise reconnue sur des niches,
  • Optimiser pour être la source d’autorité.

Multi-Channel Presence :

  • Investir les plateformes UGC (Reddit, Quora et YouTube),
  • Maintenir une présence Wikipedia si éligible,
  • Développer des partenariats avec les sources citées.

Technical SEO Evolution :

Conclusion : redéfinition de la visibilité

Les données 2025 révèlent un écosystème en transition rapide où :

  • Nouveaux KPIs : être cité devient plus important qu’être cliqué,
  • Nouvelles plateformes : Reddit et YouTube deviennent des canaux SEO incontournables,
  • Nouvelle autorité : les marques établies dominent les citations mais des acteurs émergents (Toxigon) réussissent des percées.

L’enjeu ? Passer d’une logique de génération de trafic à une stratégie d’autorité citationnelle dans l’écosystème IA.

Car avec moins de 1 % de trafic mais une influence croissante sur la perception d’autorité, la recherche IA redéfinit fondamentalement ce que signifie « être visible » en 2025.

Source complète : Joe Youngblood SEO & Digital Marketing Consulting – Compilation 2025 basée sur les données de Profound, Ahrefs, SEMrush, Local Falcon, Tollbit, Search Engine Roundtable, Search Engine Land, The Register, PPC Land, Hacker News, Metacast et recherches internes Joe Youngblood.

Note importante : ces statistiques concernent principalement le marché américain. Les comportements, taux d’adoption et impacts peuvent varier significativement en Europe selon les réglementations locales (RGPD), habitudes culturelles et déploiement des outils IA.

À découvrir également