Sommaire
Akamai indique que les sites de publication concentrent une part importante du trafic généré par les bots IA dans le secteur des médias. OpenAI arrive en tête des acteurs les plus actifs, devant Meta et ByteDance.
Les sites de publication concentrent une large part du trafic IA dans les médias
Akamai a analysé l’activité des bots IA à partir du trafic observé par ses outils de gestion au niveau applicatif. Dans ses données, le commerce reste le secteur qui reçoit le plus de trafic de bots IA, avec 48 %. Les médias arrivent en deuxième position avec 13 %.
À l’intérieur de ce groupe, les sites de publication représentent la part la plus élevée :
- publishing : 40 % de l’activité bots IA dans les médias,
- broadcast et OTT : 29 %.
Akamai indique aussi qu’OpenAI est l’acteur le plus présent sur les sites médias. L’entreprise arrive devant Meta et ByteDance, tandis qu’Anthropic et Perplexity complètent le top 5 avec des volumes plus faibles.
Le poids d’OpenAI s’explique en partie par la diversité de ses bots :
- GPTBot pour l’entraînement,
- OAI-SearchBot pour la recherche,
- ChatGPT-User pour la récupération de contenu en temps réel.
Akamai distingue les crawlers d’entraînement et les fetcher bots
Le rapport sépare les bots IA en plusieurs catégories selon leur comportement. Dans les médias, les deux types les plus présents sont les crawlers d’entraînement et les fetcher bots.
Les premiers servent à collecter des contenus pour alimenter les modèles. Les seconds récupèrent des pages précises lorsqu’un utilisateur pose une question à une interface IA.
Sur la période étudiée :
- les crawlers d’entraînement représentent 63 % de l’activité bots IA dans les médias,
- les fetcher bots représentent 24 %,
- les sites de publication concentrent 43 % de l’activité de ces fetcher bots.
Akamai souligne que ces deux catégories n’ont pas le même effet. Un crawler d’entraînement agit sur la manière dont les contenus peuvent être intégrés aux modèles. Un fetcher bot intervient au moment où une réponse est produite, avec récupération directe d’une page sans passage obligé de l’utilisateur par le site d’origine.
Les éditeurs utilisent plusieurs réponses techniques
Le rapport présente aussi plusieurs méthodes utilisées par les éditeurs pour gérer ce trafic. Les réponses les plus fréquentes chez les clients d’Akamai sont les suivantes :
- deny : blocage direct des requêtes.
- delay : ajout d’un délai avant la réponse.
- tarpit : maintien de la connexion ouverte pour mobiliser les ressources du bot.
Akamai cite le cas d’un éditeur non nommé qui a choisi le tarpitting plutôt que le blocage. Selon le rapport, cette approche lui a permis de contrôler 97 % des requêtes de bots IA, tout en laissant ouverte la possibilité d’accords de licence.
Le rapport précise aussi qu’un blocage généralisé peut fermer cette option, certaines entreprises IA étant disposées à payer pour accéder aux contenus.