Sommaire
Depuis la mise à jour du modèle début mars, plusieurs analyses montrent une évolution nette : ChatGPT réduit le nombre de sites cités dans ses réponses, tout en élargissant fortement les sources qu’il consulte en amont.
Certaines données analysées par Resoneo et relayées par Lily Ray montrent une baisse du nombre moyen de domaines cités par réponse après le déploiement de ChatGPT 5.3.
Les réponses contiennent moins de liens sortants, ce qui réduit mécaniquement la part de trafic pouvant être envoyée vers les sites.
- moins de domaines cités par réponse,
- moins de liens visibles,
- moins de trafic potentiel.
Ce point concerne surtout les acteurs qui suivaient les citations comme indicateur. Une marque peut continuer à être mentionnée sans que cela se traduise par des clics.
Une recherche plus large côté modèle
En parallèle, le fonctionnement interne évolue. ChatGPT semble élargir fortement sa phase de recherche avant de produire une réponse.
Selon Chris Long, le modèle lance désormais un nombre de requêtes bien plus élevé qu’auparavant, avec des explorations qui dépassent souvent les dix recherches pour une seule réponse.
- multiplication des requêtes en amont,
- exploration de davantage de sources,
- dépendance moindre à une page unique.
Autre évolution observée, l’usage plus fréquent de requêtes de type site:. Le modèle va chercher directement l’information sur les sites des marques, plutôt que de s’appuyer uniquement sur des contenus tiers.
Des sources plus cadrées
Ce travail de recherche plus large s’accompagne d’une sélection plus structurée des sources. Dans plusieurs cas documentés, ChatGPT s’appuie sur :
- des plateformes reconnues (Clutch et G2),
- des sources sectorielles identifiées,
- des données vérifiables.
Le modèle intègre aussi des éléments d’autorité, comme des accréditations, des récompenses ou des indicateurs de performance, y compris lorsqu’ils ne sont pas explicitement mentionnés dans la requête.
Ce déplacement est visible dans les résultats, qui mettent davantage en avant des acteurs établis que des listes plus hétérogènes.
Pourquoi certains contenus sont cités… et d’autres non
Les travaux d’Andrea Volpini permettent de replacer ces évolutions dans un cadre plus technique.
Dans les systèmes actuels, la citation n’intervient qu’à la fin du processus. Avant cela, plusieurs étapes déterminent quels contenus seront pris en compte.
- sélection de documents candidats,
- recherche lexicale et sémantique,
- réévaluation des résultats,
- synthèse de la réponse.
Si un contenu n’est pas récupéré au départ, il ne peut pas être cité. La visibilité dépend d’abord de la capacité d’un contenu à entrer dans ce premier ensemble de documents analysés.
Des exigences plus fortes sur la structure des contenus
Dans ce contexte, certains types de contenus semblent mieux remonter que d’autres. On retrouve des caractéristiques récurrentes :
- des passages clairs et autonomes,
- des entités explicitement nommées,
- des informations précises et vérifiables,
- une cohérence forte à l’échelle de la page.
À l’inverse, les contenus plus vagues, dilués ou peu structurés apparaissent moins adaptés à ces logiques de sélection.