Reddit attaque Anthropic pour usage non autorisé de ses données d’entraînement

écrit par Jordan Belly 5 juin 2025

Sommaire

Le 4 juin 2025, Reddit a assigné Anthropic devant les tribunaux de San Francisco, accusant l’entreprise derrière Claude d’avoir exploité illégalement les conversations de ses utilisateurs pour alimenter ses modèles d’IA générative.

Les faits reprochés

Reddit soutient qu’Anthropic a aspiré des messages d’utilisateurs présents sur sa plateforme pour entraîner ses systèmes, en violation des conditions d’utilisation. La plainte s’appuie notamment sur un document de recherche de 2021 cosigné par Dario Amodei, CEO d’Anthropic, qui évoquait explicitement l’utilisation de contenus Reddit et Wikipédia pour ce type d’entraînement.

Plus problématique encore : malgré les déclarations publiques d’Anthropic affirmant avoir bloqué l’accès de ses robots à Reddit, la plateforme affirme avoir détecté plus de 100 000 connexions depuis juillet 2024.

Une stratégie commerciale en question

Cette affaire révèle la tension croissante entre plateformes de contenu et entreprises d’IA générative. Depuis son introduction en bourse en 2024, Reddit a durci sa politique : l’exploitation de ses données nécessite désormais un accord de licence payant.

La plateforme a d’ailleurs déjà signé de tels accords avec Google et OpenAI, démontrant qu’un modèle économique viable existe. L’absence d’accord avec Anthropic suggère soit un refus de négocier, soit des conditions jugées inacceptables.

Anthropic sur la défensive

L’entreprise conteste les accusations et promet de se défendre vigoureusement. Ironique pour une société qui se positionne sur l’IA responsable et éthique, en opposition assumée aux pratiques de ses concurrents.

Reddit ne mâche d’ailleurs pas ses mots, dénonçant « deux personnalités » chez Anthropic : l’image publique responsable versus les pratiques privées supposées discutables.

Enjeux pour l’écosystème IA

Cette plainte s’inscrit dans une vague de contentieux similaires, où les créateurs de contenu tentent de monétiser l’usage de leurs données par les géants de l’IA. Avec 97,2 millions d’utilisateurs actifs quotidiens, Reddit représente une source d’entraînement particulièrement riche en conversations naturelles.

L’issue de cette affaire pourrait définir les règles de l’exploitation commerciale des contenus web par l’intelligence artificielle, au-delà du seul cas Anthropic.

Les points clés à retenir

Sur les accusations :

Anthropic aurait exploité les conversations Reddit sans autorisation pour entraîner Claude.
Plus de 100 000 connexions détectées malgré les dénégations publiques.
Un document de 2021 signé par le CEO évoquait déjà cette utilisation.

Sur les enjeux économiques :

Reddit exige désormais des accords de licence payants depuis son introduction en bourse.
Google et OpenAI ont déjà signé de tels accords.
L’affaire pourrait redéfinir les règles d’exploitation des données web par l’IA.

Jordan Belly

Rédacteur web SEO à Toulouse, j’interviens depuis plus de vingt ans sur le contenu éditorial, dont plus de douze ans dédiés au référencement naturel. À travers Le Phare SEO, j’accompagne les entreprises dans la construction de leur visibilité en ligne, en m’appuyant sur une veille continue des évolutions de Google et des moteurs basés sur l’IA. Je continue par ailleurs à écrire pour la presse spécialisée (Système D, Le Particulier, UFC Que Choisir…) et suis l’auteur du Guide du rédacteur web (Edi.Pro).