Accueil GEO et IA Comment Perplexity classe les contenus : ce que révèle une étude récente

Comment Perplexity classe les contenus : ce que révèle une étude récente

Robot perplexity, référencement

Perplexity ne se contente pas d’agréger des contenus. Il les évalue, les classe et parfois… les écarte. Une enquête menée par le chercheur indépendant Metehan Yesilyurt lève le voile sur plusieurs mécanismes internes de classement du moteur de réponses IA.

Une hiérarchie en trois couches pour les entités

Première découverte, Perplexity utiliserait un système de reranking à trois niveaux (L3) pour les recherches liées à des entités (personnes, entreprises, concepts…). Le processus suit trois étapes :

  1. Récupération et scoring initial des résultats (comme une recherche classique).
  2. Filtrage par apprentissage automatique, plus strict à chaque couche.
  3. Élimination de la totalité des résultats si trop peu passent les filtres.

Conséquence directe, la simple optimisation par mots-clés ne suffit plus. Seuls les contenus de qualité, fortement liés au sujet, peuvent passer ces seuils.

Des listes de domaines favorisés manuellement

Yesilyurt affirme avoir identifié des listes de domaines autoritaires favorisés manuellement, comme Amazon, GitHub, LinkedIn ou Coursera. Ces sites bénéficieraient de boosts systématiques en visibilité.

Publier sur ces plateformes, ou structurer ses contenus à partir de leurs données, augmente les chances d’être repris.

Une synergie avec YouTube

Autre découverte étonnante, les titres de vidéos YouTube qui correspondent exactement aux requêtes tendance sur Perplexity semblent bénéficier d’un coup de pouce algorithmique. Ce mécanisme suggère une validation croisée des tendances entre plateformes.

Les facteurs de classement identifiés

Le chercheur a documenté plusieurs signaux utilisés par Perplexity pour classer les contenus. En voici une sélection :

  • Performance initiale : les premiers clics conditionnent la visibilité future.
  • Catégorisation des sujets : la tech, l’IA ou les sciences sont favorisées ; le sport ou le divertissement sont sous-exposés.
  • Obsolescence rapide : les contenus non mis à jour perdent vite en visibilité.
  • Pertinence sémantique : la profondeur prime sur l’optimisation de surface.
  • Engagement utilisateur : clics et interactions alimentent les modèles.
  • Réseaux de mémoire : les clusters de contenus liés sont mieux classés ensemble.
  • Distribution en flux : la visibilité dépend aussi du cache et de la fraîcheur.
  • Signaux négatifs : un contenu redondant ou peu apprécié peut être masqué.

Une stratégie à adapter

L’étude conclut qu’un bon classement sur Perplexity repose sur plusieurs piliers :

Autrement dit, les fondamentaux du SEO s’appliquent – mais avec des critères légèrement différents.

À découvrir également