Sommaire
SE Ranking a passé 129 000 domaines au crible pour comprendre pourquoi certains sites sont plus souvent cités par ChatGPT que d’autres. Les fondamentaux SEO classiques (backlinks, trafic, vitesse et profondeur de contenu) restent selon lui fortement corrélés aux citations, loin des “hacks IA”.
Une étude corrélationnelle, pas la recette interne de ChatGPT
Voici les résultats d’une étude menée par SE Ranking :
- 129 000 domaines étudiés,
- 216 524 pages,
- 20 secteurs,
- L’objectif était d’identifier les facteurs associés à un nombre plus élevé de citations dans les réponses de ChatGPT.
SE Ranking insiste sur un point : il s’agit d’associations statistiques, pas d’une rétro-ingénierie de l’algorithme d’OpenAI. L’étude ne précise pas non plus :
- La version exacte de ChatGPT utilisée,
- La période exacte de collecte.
Le travail décrit donc la façon dont ChatGPT cite les sources dans cet échantillon, à ce moment donné, selon la méthodologie de SE Ranking.
Ce que les données mettent en avant
1. Backlinks et signaux de confiance en tête
Selon SE Ranking, le facteur le plus corrélé aux citations reste le nombre de domaines référents :
- jusqu’à ~2 500 referring domains : en moyenne 1,6 à 1,8 citation,
- au-delà de 350 000 referring domains : ~8,4 citations en moyenne.
L’étude décrit un palier marquant autour de 32 000 domaines référents : le nombre moyen de citations passerait alors d’environ 2,9 à 5,6.
Même logique côté Domain Trust :
- score < 43 : ~1,6 citation,
- scores 91–96 : ~6 citations,
- scores 97–100 : ~8,4 citations.
Deux points importants rapportés par SE Ranking :
- Le signal de domaine domine le signal de page : au-delà d’un Page Trust de 28, toutes les pages tournent autour de 8,3 citations en moyenne ;
- Les .gov et .edu n’ont pas d’avantage automatique : environ 3,2 citations, contre 4,0 pour les domaines “classiques”.
Ce qui compte avant tout reste la qualité globale perçue et la valeur des contenus, pas l’extension.
2. Trafic, position Google et effets de seuil
Le trafic de domaine apparaît comme deuxième facteur, mais uniquement à partir de volumes élevés :
- < 190 000 visites mensuelles : entre 2 et 2,9 citations,
- 10 millions de visites : ~8,5 citations en moyenne.
Un détail intéressant, le trafic de la page d’accueil se distingue nettement. Dès ~7 900 visites organiques sur la home, les domaines affichent les taux de citations les plus élevés.
SE Ranking observe aussi une corrélation entre position moyenne dans Google et citations :
- positions 1 à 45 : ~5 citations,
- positions 64 à 75 : ~3,1 citations.
Les auteurs prennent soin de préciser que ces résultats ne prouvent pas que ChatGPT se base sur l’index de Google. Ils y voient plutôt le signe d’un diagnostic similaire de l’autorité et de la qualité par les deux systèmes.
3. Profondeur, structure et fraîcheur du contenu
Plusieurs signaux de qualité éditoriale ressortent nettement dans l’analyse de SE Ranking :
- Longueur :
- < 800 mots : 3,2 citations,
- 2 900 mots : 5,1 citations.
- Structure : les pages où les sections entre deux titres font 120 à 180 mots obtiennent les meilleurs scores (~4,6 citations). Les sections très courtes (< 50 mots) restent en retrait (~2,7 citations).
- Expertise visible :
- contenus avec citation d’experts : ~4,1 citations,
- sans citations d’experts : ~2,4.
- Données chiffrées :
- 19 points de données ou plus : 5,4 citations,
- très peu de chiffres : ~2,8.
- Fraîcheur :
- pages mises à jour dans les 3 derniers mois : ~6 citations,
- contenu ancien : ~3,6.
Deux résultats vont à l’encontre de certains réflexes SEO récents :
- les pages avec section FAQ affichent légèrement moins de citations (3,8 contre 4,1) ;
- les titres sous forme de questions (H1/H2) performent moins bien (3,4 citations) que les titres descriptifs (4,3).
SE Ranking avance une hypothèse : les FAQ et titres interrogatifs seraient sur-représentés dans des contenus simples, de type support, moins intéressants pour ChatGPT lorsqu’il cherche des sources riches et détaillées.
4. Communautés et plateformes d’avis : des signaux forts de présence de marque
L’étude insiste sur l’impact des plateformes de discussion et d’avis.
Sur Quora :
- domaines avec faible présence (jusqu’à ~33 mentions) : ~1,7 citation,
- domaines avec millions de mentions (jusqu’à 6,6 M) : ~7 citations.
Sur Reddit, la dynamique semble similaire : plus une marque est citée, plus ChatGPT la reprend.
SE Ranking interprète ce résultat comme une opportunité pour les sites modestes :
Une activité soutenue sur Quora ou Reddit peut compenser en partie l’absence de gros profils de liens et de trafic, en apportant des signaux de confiance supplémentaires.
Même constat pour les plateformes d’avis (Trustpilot, G2, Capterra, Sitejabber, Yelp…) :
- domaines présents sur plusieurs de ces sites : ~4,6 à 6,3 citations,
- domaines absents : ~1,8 citation.
L’étude y voit un indicateur de présence de marque reconnue et évaluée, apprécié par ChatGPT.
5. Performance technique : rapide, mais pas forcément ultra-minimaliste
Sur le plan technique, SE Ranking note des corrélations nettes entre vitesse et citations :
- First Contentful Paint < 0,4 s : ~6,7 citations,
- 1,13 s : ~2,1 citations.
Même logique pour le Speed Index : en-dessous de ~1,14 s, les domaines restent réguliers ; au-delà de 2,2 s, la courbe décroche.
Une observation plus surprenante concerne l’Interaction to Next Paint (INP) :
- INP ultra rapide (< 0,4 s) : ~1,6 citation,
- INP modéré (0,8–1,0 s) : ~4,5 citations.
SE Ranking suggère que les pages extrêmement “simples” ou statiques (et donc très rapides) ne transmettent pas forcément les signaux de profondeur recherchés par ChatGPT, là où des pages plus riches mais bien optimisées offrent un meilleur équilibre.
6. URLs et titres : moins de sur-optimisation, plus de clarté thématique
Un point saillant de l’étude concerne la façon de nommer les URLs et les titres :
- Les pages où la similarité sémantique entre URL et mot-clé cible est faible à moyenne (0,00 à 0,57) affichent ~6,4 citations.
- Celles avec une correspondance très forte (0,84 à 1,00) tombent à ~2,7 citations.
Même phénomène pour les titres :
- titres peu “sur-optimisés” : ~5,9 citations,
- titres très alignés sur le mot-clé : ~2,8 citations.
Pour SE Ranking, ChatGPT semble préférer :
des URLs et titres qui décrivent un sujet global plutôt qu’une requête unique calibrée pour un mot-clé.
7. Ce qui a peu pesé dans l’étude
Plusieurs tactiques souvent citées dans les discussions “IA + SEO” émergent comme faiblement corrélées :
- FAQ schema : 3,6 citations en moyenne avec, 4,2 sans ;
- llms.txt : impact jugé négligeable dans ce jeu de données ;
- liens sortants vers des sites d’autorité : effet limité sur les citations.
SE Ranking rappelle que les signaux se combinent. Miser sur un seul levier isolé réduit l’effet global.
Ce que cela implique (et n’implique pas) pour les stratégies SEO & IA
L’interprétation proposée par SE Ranking reste prudente :
- Les fondamentaux SEO bien exécutés – liens, trafic, performance, contenu sérieux et mis à jour – semblent converger avec les facteurs qui favorisent les citations dans ChatGPT.
- Les tactiques focalisées sur les mots-clés ou de micro-optimisation de balises ressortent comme secondaires.
Pour des sites plus petits, l’étude propose quelques pistes :
- se concentrer sur un contenu plus profond et mieux étayé,
- soigner la présence dans les communautés de référence (Reddit, Quora…),
- investir les plateformes d’avis adaptées à leur secteur,
- garder des pages rapides et techniquement fiables.
La portée du travail reste limitée :
- il décrit ChatGPT uniquement, pas l’ensemble des moteurs IA,
- la méthodologie appartient à SE Ranking,
- les résultats restent des corrélations, pas une preuve de logique interne.
L’étude de SE Ranking va plutôt dans le sens d’une continuité : un site solide sur le plan éditorial, technique et de notoriété semble mieux ressortir dans ChatGPT, exactement comme en SEO classique.
Il convient bien sûr de prendre ces résultats avec des pincettes : d’abord parce qu’ils ne coïncident pas forcément avec ceux des autres études (par exemple sur des éléments comme les backlinks), ensuite parce qu’il s’agit d’un outil commercialisé et donc pas neutre.