Sommaire
Google Extended est un mécanisme de contrôle disponible dans le fichier robots.txt qui permet d’empêcher Google d’utiliser votre contenu pour entraîner ses futurs modèles Gemini et pour ancrer les conversations dans l’application Gemini.
Comment bloquer Google Extended
Pour empêcher Google d’utiliser votre contenu, ajoutez ces lignes à votre robots.txt :
User-agent: Google-Extended
Disallow: /
Pour bloquer uniquement un répertoire spécifique :
User-agent: Google-Extended
Disallow: /directory1
Ce que Google Extended bloque (et ne bloque pas)
✅ Ce qui est bloqué :
- Entraînement futur des modèles Gemini,
- Citations dans l’app Gemini (grounding/mise à la terre),
- Références dans VertexAI utilisant Grounding with Search.
❌ Ce qui n’est PAS bloqué :
- AI Overviews dans les résultats de recherche Google,
- Mode IA de Google Search,
- Contenu déjà intégré dans les modèles actuels de Gemini.
Google Extended n’empêche pas votre contenu d’apparaître dans les AI Overviews, considérés comme partie intégrante de l’expérience de recherche Google.
Impact sur le référencement
Google précise que Google Extended n’affecte pas :
- L’inclusion dans les résultats de recherche Google,
- Le classement dans les résultats (pas un signal de ranking),
- L’indexation par Googlebot,
- Il ne supprime pas les données déjà intégrées dans les modèles Gemini.
Pour bloquer les AI Overviews
Si vous souhaitez empêcher l’utilisation de votre contenu dans les AI Overviews, utilisez la balise :
<meta name="robots" content="nosnippet">
Attention : cette balise bloque également l’affichage d’extraits dans la recherche classique.
Qui utilise Google Extended actuellement
Grands médias (selon Reuters, 24 % des sites d’actualités) :
- New York Times,
- CNN,
- BBC…
Autres plateformes :
- Facebook,
- Quora.
Sites qui ne l’utilisent PAS :
- Wikipedia,
- LinkedIn,
- Netflix,
- WebMD,
- Investopedia.
Les cas d’usage recommandés
Utilisez Google Extended si :
- Vous avez du contenu sous licence ou premium,
- Votre propriété intellectuelle réside dans vos mots (essais, fiction, recherches payantes),
- Vous monétisez directement votre contenu écrit.
Évitez Google Extended si :
- Votre modèle économique dépend de la visibilité et du trafic,
- Vous monétisez la confiance et l’expertise plutôt que le contenu lui-même,
- Vous souhaitez être cité comme source dans les conversations IA.
Le dilemme de visibilité
Marie Haynes souligne un point important : « De plus en plus de personnes utiliseront Gemini comme interface de chat pour obtenir des réponses. Google Extended empêchera l’utilisation de votre site comme source dans la recherche approfondie. »
L’Assistant Google sur téléphones, objets connectés et voitures utilise désormais Gemini. Bloquer Google Extended pourrait vous priver de citations dans ces interfaces qui deviennent des points d’entrée majeurs.
Recommandation pratique
Pour la plupart des sites web, permettre l’utilisation par l’IA Google semble plus bénéfique que de bloquer. Les citations dans Gemini peuvent :
- Augmenter la visibilité de votre expertise,
- Attirer de nouveaux visiteurs,
- Renforcer votre autorité dans votre domaine.
Exception : sites dont la valeur économique repose directement sur l’exclusivité du contenu (presse payante, recherches propriétaires, créations littéraires…).