Sommaire
Nous avons tous connu ces moments où mettre à jour la date de publication d’un contenu semblait magiquement améliorer notre classement organique. L’idée était simple : Google favorisait le contenu récent. Aujourd’hui, cette même question resurface avec les modèles de langage (LLM).
Une nouvelle étude de Sonny Vasquez, expert en intelligence artificielle, apporte des réponses chiffrées à partir de l’analyse de plus de 5000 URLs citées par ChatGPT, Perplexity et AI Overviews. Ses conclusions révèlent que près de 65% des interactions de bots IA ciblent du contenu publié dans l’année écoulée. Mais cette règle n’est pas absolue et varie considérablement selon les secteurs.
Cette recherche offre un éclairage précieux pour adapter sa stratégie de contenu à l’ère des moteurs de réponse et mieux comprendre comment optimiser sa visibilité dans un monde où les IA choisissent leurs réponses.
Méthodologie : mesurer la récence du contenu et l’activité des bots IA
Pour mener cette analyse, Sonny Vasquez s’est concentré sur deux indicateurs clés permettant de mesurer l’impact de la fraîcheur du contenu sur la visibilité dans les LLM.
Les métriques analysées
- Date de publication : le cœur de la « récence » repose sur le moment où le contenu a été publié ou mis à jour pour la dernière fois. Les données ont été regroupées par année de dernière mise à jour pour identifier les périodes qui attirent le plus l’attention des crawlers IA.
- Hits de bots IA : ces interactions reflètent la fréquence à laquelle les bots IA visitent les pages. L’analyse s’est concentrée sur l’activité de trois bots ChatGPT spécifiques, en utilisant les fichiers de logs pour traquer cette visibilité.
- Trafic de référence IA : pour mesurer l’impact concret, l’étude intègre également l’âge moyen du contenu qui génère effectivement des visites depuis les LLM vers les sites web.
L’analyse porte sur plus de 5000 URLs dont les dates de publication ont pu être extraites, et qui sont citées par des modèles comme ChatGPT, Perplexity et AI Overviews. La récence joue un rôle dans les trois plateformes.
Le biais de récence confirmé : les chiffres qui parlent
L’étude révèle un biais de récence très marqué dans le comportement des LLM :
- 65% des hits de logs concernent du contenu publié dans l’année écoulée (2025),
- 79% des interactions totales ciblent du contenu des deux dernières années (2024-2025),
- 89% des hits portent sur du contenu mis à jour dans les trois dernières années (2023-2025),
- 94% des interactions se concentrent sur du contenu publié dans les cinq dernières années (2021-2025),
- Seulement 6% des hits concernent du contenu de plus de six ans.
Cette tendance confirme que la fraîcheur influence significativement les interactions des IA avec le contenu. Cette règle n’est cependant pas universelle : le secteur d’activité compte plus qu’on ne pourrait le penser.
Analyse sectorielle : des patterns distincts selon l’industrie
L’étude de Sonny Vasquez révèle des comportements différenciés selon les secteurs, remettant en question l’idée d’une règle universelle sur la récence du contenu.
Services financiers : la récence extrême
Le secteur financier présente un biais de récence très prononcé :
- Des milliers de hits sur le contenu 2024-2025,
- Quasi-absence d’interactions sur le contenu antérieur à 2020.
Cette tendance s’explique par la nature des sujets traités : paie, fiscalité, réglementations RH… Ces domaines nécessitent des mises à jour fréquentes car l’information obsolète perd rapidement sa pertinence. Les utilisateurs comme les systèmes IA privilégient naturellement l’information actuelle et opportune.
Voyage : un équilibre entre récence et pérennité
L’industrie du voyage montre également une forte préférence pour le contenu récent, avec une fenêtre légèrement plus large que les services financiers :
- 92% des hits se concentrent sur les trois dernières années,
- Pic d’activité sur le contenu de 2023.
Cette répartition s’explique par la nature semi-pérenne du contenu voyage. Des guides comme « meilleures destinations pour voyager en juillet » ou « quand réserver ses vols de vacances » restent pertinents au-delà de leur date de publication initiale.
Énergie : la pertinence prime sur la récence
Le secteur de l’énergie présente un pattern différent et révélateur :
- Biais de récence moins extrême,
- Fenêtre temporelle plus large pour les interactions,
- Attraction vers un type de contenu différent.
Les crawlers IA gravitent vers du contenu informationnel evergreen qui ne deviendra pas obsolète le mois suivant : « qu’est-ce que la durabilité environnementale ? » ou « énergie verte vs énergie renouvelable ».
Cette préférence indique que les sujets du secteur énergétique ont tendance à avoir une durée de vie plus longue due à leur nature éducative et pérenne.
Cas d’étude : les enseignements du secteur des terrasses en bois
L’analyse d’un secteur spécifique – la construction de terrasses – offre des insights précieux pour tous les secteurs stables où l’information reste valable dans le temps.
Malgré une quantité importante de hits sur le contenu récent, ce secteur montre que du contenu de qualité et instructionnel peut tenir dans la durée. Les crawlers IA interagissent avec du contenu remontant jusqu’à 2004, soit plus de 15 ans.
Cette observation ne signifie pas qu’il faut abandonner la mise à jour du contenu ancien. Au contraire, elle révèle que les crawlers IA interagissent avec le contenu plus ancien et qu’actualiser ce contenu performant pourrait décupler son impact sur le nombre de bots qui l’explorent.
Analyse des citations : ChatGPT, Perplexity et AI Overviews à la loupe
Pour compléter l’analyse des logs, l’étude examine les patterns de citation via les données de Peec.ai. Cette approche offre un aperçu direct de la façon dont la fraîcheur se traduit en visibilité et crédibilité dans la pratique.
ChatGPT : entre récence et autorité
ChatGPT présente la répartition la plus large en termes de dates de publication citées :
Période | Part des citations |
---|---|
2025 | 31% |
2024 | 29% |
2023 | 11% |
Total 2023-2025 | 71% |
2022 | 8% |
Pré-2022 | 21% |
ChatGPT privilégie fortement le contenu récent mais cite également des articles plus anciens remontant à 2004. Certaines de ces pièces incluent des articles Wikipédia, dont des études récentes montrent qu’ils sont fortement exploités dans les modèles ChatGPT. Cela suggère que bien que la récence soit un facteur, l’autorité et la longévité comptent également.
Perplexity : la récence comme priorité
Perplexity montre une attraction encore plus forte vers le contenu récent que ChatGPT :
Période | Part des citations |
---|---|
2025 | 50% |
2024 | 20% |
2023 | 10% |
Total 2023-2025 | 80% |
Cette concentration sur le contenu très récent (50% rien que pour 2025) révèle une stratégie axée sur l’actualité et la fraîcheur de l’information.
AI Overviews : l’héritage Google
Les AI Overviews présentent la préférence la plus marquée pour le contenu récent :
Période | Part des citations |
---|---|
2025 | 44% |
2024 | 30% |
2023 | 11% |
Total 2023-2025 | 85% |
Cette tendance s’explique naturellement : les AI Overviews sont soutenus par Google, qui a historiquement favorisé le contenu frais. Le comportement du modèle reflète cette évolution du SEO et nous ramène à l’époque des mises à jour de dates de publication.
Adapter sa stratégie de contenu à son secteur
L’analyse croisée des comportements de crawl et des données de citation montre une chose : le contenu récent est favorisé, mais l’impact varie selon la nature de l’information et le secteur.
Recommandations par secteur
- Services financiers : nécessitent des contenus extrêmement à jour, en raison des évolutions réglementaires.
- Voyage : mix d’evergreen et d’actualisé ; des guides saisonniers peuvent vivre longtemps, mais une mise à jour renforce la pertinence.
- Énergie : privilégient les contenus éducatifs durables. La valeur réside souvent dans leur capacité à ne pas vieillir.
- Secteurs stables (ex. BTP, jardin, bricolage) : des contenus vieux de 10 ans peuvent encore générer de la visibilité, à condition de rester accessibles, utiles, et idéalement remis à jour.
Principes directeurs pour votre stratégie
Adaptez votre production de contenu en fonction :
- de la fréquence de péremption des infos dans votre domaine,
- de la manière dont les utilisateurs (et les IA) accèdent aux réponses,
- et de l’intention réelle derrière la requête.
Ce n’est pas la date qui prime, c’est la valeur.
La meilleure stratégie consiste certainement à actualiser les bons contenus et à offrir une réponse précise, humaine et ciblée. L’authenticité reste un levier différenciateur, tant pour Google que pour les LLMs.
Cette approche s’inscrit parfaitement dans les facteurs qui influent vraiment sur Google en 2025 : l’authenticité et la valeur ajoutée humaine restent des différenciateurs clés.
Conclusion : récence intelligente vs récence systématique
L’étude de Sonny Vasquez montre clairement que la récence influence la visibilité dans les LLMs, avec près de 90 % des interactions concentrées sur des contenus publiés ou mis à jour depuis 2023. Mais cette tendance, loin d’être universelle, varie selon le secteur, le type de contenu et l’intention de l’utilisateur.
La stratégie gagnante ne consiste pas à mettre à jour aveuglément tous ses contenus, mais à comprendre :
- Dans la finance, l’information doit être ultra-actualisée.
- Dans l’énergie, l’éducatif et l’evergreen priment.
- Dans les secteurs stables, même un contenu de 10 ans peut rester performant — à condition d’être maintenu utile et accessible.
La vraie stratégie gagnante ne consiste pas à rafraîchir tout, mais à hiérarchiser :
- Ce qui doit être mis à jour (juridique et réglementaire),
- Ce qui peut être réactivé (guides pratiques),
- Ce qui fonctionne déjà sans retouche (evergreen).
Dans cette évolution vers la recherche conversationnelle, la récence reste un levier important, mais elle doit servir une stratégie plus large centrée sur la pertinence et la valeur ajoutée pour l’utilisateur final.