Accueil GEO et IA Les IA génèrent trois fois plus de liens brisés que Google

Les IA génèrent trois fois plus de liens brisés que Google

Google randonneur

Une étude Ahrefs sur 16 millions d’URL révèle que les assistants IA dirigent les utilisateurs vers des pages brisées près de trois fois plus souvent que Google Search. ChatGPT arrive en tête pour la création de liens hallucinés.

ChatGPT champion des URL inventées

L’étude montre que 1 % des URL cliquées via ChatGPT mènent à des pages 404, contre seulement 0,15 % pour Google. Le problème s’aggrave quand on examine toutes les URL mentionnées par ChatGPT : 2,38 % dirigent vers des pages d’erreur, comparé à 0,84 % pour les premiers résultats Google.

Claude arrive en deuxième position avec 0,58 % de liens brisés pour les URL cliquées, suivi de Copilot (0,34 %), Perplexity (0,31 %) et Gemini (0,21 %). Mistral affiche le meilleur taux à 0,12 %, mais génère aussi le moins de trafic vers les sites web.

Deux causes principales identifiées

La recherche identifie deux raisons majeures derrière ces liens factices. D’abord, certaines URL ont existé par le passé mais ne sont plus actives. Quand l’IA s’appuie sur d’anciennes informations plutôt que sur une recherche web en temps réel, elle peut suggérer des pages supprimées ou déplacées.

L’IA invente ensuite parfois des URL qui semblent plausibles mais n’ont jamais existé. Ryan Law d’Ahrefs partage des exemples concrets : les assistants IA ont créé de fausses URL comme « /blog/internal-links/ » et « /blog/newsletter/ » pour leur site, car ces adresses sonnent comme des pages qu’Ahrefs pourrait avoir, sans qu’elles existent réellement.

Impact limité sur le trafic global

Malgré l’ampleur du problème, la plupart des sites web ne ressentiront pas d’impact majeur. Les assistants IA ne génèrent qu’environ 0,25 % du trafic web, tandis que Google en dirige 39,35 %.

Les URL factices affectent donc une infime portion d’une source de trafic déjà minuscule. Le problème pourrait cependant s’amplifier avec l’adoption croissante de l’IA pour la recherche d’informations.

L’étude révèle aussi que 74 % des nouvelles pages web contiennent du contenu généré par IA. Quand ce contenu intègre des liens factices, les crawlers web peuvent les indexer et propager le problème.

John Mueller avait raison

Ces résultats corroborent les prédictions de John Mueller de Google en mars dernier. Il avait prévu « une légère hausse de ces liens hallucinés cliqués » dans les 6-12 mois.

Mueller suggérait de se concentrer sur l’amélioration des pages 404 plutôt que de courir après un trafic accidentel. Son conseil de collecter des données avant d’effectuer de gros changements semble judicieux, vu le faible impact sur le trafic découvert par Ahrefs.

Mueller avait aussi prédit que le problème diminuerait avec l’amélioration des services IA dans la gestion des URL. L’avenir dira s’il avait raison sur ce point également.

À découvrir également