Pour Google, la qualité des résultats de recherche est une priorité essentielle. Par conséquent, Google abandonne l'indexation des pages de votre site seulement sur demande du webmaster responsable de ces pages. Cette règle est nécessaire pour garantir que vos pages ne sont pas supprimées de notre index par erreur (ou selon des critères arbitraires).
Google ayant pour mission de fournir des résultats de recherche exhaustifs et impartiaux, nous n'avons pas l'intention de « censurer » les informations disponibles sur le Web.
|
Options de modification |
Les options suivantes sont disponibles ; elles prennent effet lors de la prochaine exploration de votre site par Google, soit au bout de six-huit semaines environ :
- Changer l'URL de votre site Web
- Supprimer votre site Web
- Supprimer certaines pages
- Supprimer les extraits de page (snippets)
- Supprimer les pages archivées (cache)
- Supprimer un lien périmé
- Supprimer une image
|
Changer l'URL de votre site Web |
Le robot-explorateur (araignée) de Google associe toujours le contenu d'une page à son adresse URL, il n'est pas possible de modifier manuellement l'URL affichée pour une page donnée. Si vous changez l'URL d'une page, elle sera mise à jour dans l'index Google lors de la prochaine exploration de votre site. Notre robot visite chaque site suivant un programme automatisé, ce qui fait que nous ne pouvons pas avancer manuellement la date de la prochaine exploration de votre site.
Si l'URL de votre site a changé depuis la dernière exploration Google, vous pouvez utiliser le formulaire prévu à cet effet (cela vous prendra trois secondes !) ainsi que les options de suppression décrites ci-après. Notez que le formulaire de soumission d'URL ne prend pas effet immédiatement ; par conséquent si vous exécutez en même temps la suppression de votre ancienne URL et la soumission de la nouvelle URL, votre site ne sera pas pris en compte par Google avant la prochaine exploration.
Par conséquent, au lieu de demander un changement de ce type à Google, nous vous conseillons de contacter les sites qui contiennent un lien vers votre ancienne URL et de leur demander de mettre à jour ce lien. Dans la foulée, n'oubliez pas de mettre à jour les entrées enregistrées pour votre site dans l'annuaire Yahoo, dans l'ODP (Open Directory Project) et peut-être ailleurs. Enfin, si votre ancienne URL assure une redirection permanente (HTTP 301) vers la nouvelle URL, notre robot saura comment interpréter ces informations. Notez que ce type de modification prend six à huit semaines environ avant d'apparaître dans l'index et dans les recherches Google.
|
Supprimer votre site Web |
Pour exclure de l'index Google une partie (un ou plusieurs dossiers) ou la totalité de votre site Web, il suffit de placer le fichier robots.txt au niveau racine/root de votre serveur.
Pour empêcher l'exploration de votre site par Google (et par tout autre service de recherche), votre fichier robots.txt doit contenir l'instruction suivante :
User-Agent: *Disallow: /
Ce protocole standard est respecté par la plupart des robots-explorateurs et autres araignées : lorsqu'ils rencontrent cette instruction, ils n'incluent pas le serveur Web (ou le ou les dossiers considérés) dans leur index. Pour plus de détails sur le fichier robots.txt, consultez la page suivante (en anglais) : www.robotstxt.org/wc/norobots.html, ou la page suivante (en français) : www.referencement-fr.com/?file=referencement7.
|
|
Supprimer certaines pages |
Pour empêcher l'indexation de certaines pages par Google (et par tout autre service de recherche), insérez la balise suivante dans le code HTML de ces pages :
Pour empêcher l'indexation de certaines pages seulement par les robots Google (et non par les autres services de recherche), insérez la balise suivante dans le code HTML de ces pages :
Pour plus de détails sur cette balise, consultez la page suivante : www.robotstxt.org/wc/exclusion.html#meta.
|
|
Supprimer les extraits de page (snippets) |
Un « snippet » Google est un court extrait de page qui permet aux utilisateurs de voir leurs termes de recherche en caractères gras et en contexte dans les résultats Google, et de sélectionner la page qui les intéresse. En général, les utilisateurs sélectionneront plus volontiers (et plus rapidement !) une page qui est présentée avec des termes en contexte.
Toutefois, si vous préférez présenter des pages sans snippet, insérez la balise suivante dans leur code HTML :
Remarque : Lorsque vous demandez la suppression des extraits de page/snippets, Google supprime également les pages cachées.
|
|
Supprimer les pages archivées (cachées) |
Google dispose d'un « cache » dans lequel il conserve une copie texte de la plupart des documents qu'il rencontre sur le Web. Grâce à ce cache, vous pouvez à tout moment consulter une version archivée (ou « cachée ») d'une page Web qui vous intéresse, même si la page originale est inaccessible suite à un incident subi par son serveur Web). Lorsque vous cliquez sur le lien « Copie cachée » d'une page Web, Google affiche celle-ci dans l'état où elle se trouvait lors de son indexation la plus récente, et un message affiché en haut de page rappelle qu'il s'agit d'une version cachée de la page demandée.
Pour empêcher l'archivage de certaines pages par Google (et par tout autre service de recherche), insérez la balise suivante dans leur bloc <HEAD> :
Pour empêcher l'archivage de certaines pages seulement par les robots Google (et non par les autres services de recherche), utilisez la balise suivante :
Remarque : Cette balise annule uniquement le lien « Copie cachée » de la page ; en l'absence d'autres balises spécifiques, Google continue à indexer la page et à afficher un extrait/snippet.
|
|
Supprimer un lien périmé |
Google met à jour son index automatiquement, intégralement et à intervalles réguliers. Lorsque nous explorons le Web, nous trouvons les nouvelles pages, nous éliminons les liens périmés ou sans cible et nous mettons à jour les liens selon besoin. Les liens périmés ou sans cible disparaissent automatiquement de notre index lors de la prochaine exploration du Web.
|
|
Supprimer une image |
Si vous souhaitez qu'un élément graphique (image) de votre site soit supprimé de l'index d'images proposé par Google, vous devez demander à votre webmaster d'ajouter le fichier robots.txt au niveau racine/root du serveur (si ce n'est pas possible, placez ce fichier au niveau des dossiers du site).
Exemple : Si vous souhaitez que Google n'indexe pas l'image ludo.jpg du site www.mon_site.com, soit www.mon_site.com/images/ludo.jpg, créez le fichier robots.txt à l'adresse suivante www.mon_site.com/robots.txt et insérez l'instruction suivante dans ce fichier :
User-Agent: Googlebot-ImageDisallow: /images/ludo.jpg
Pour exclure toutes les images de votre site de l'index Google, placez le fichier robots.txt suivant au niveau racine/root de votre serveur :
User-Agent: Googlebot-ImageDisallow: /
Après avoir placé ce fichier, faites-nous parvenir un e-mail (googlebot@google.com) pour décrire la modification effectuée et préciser l'emplacement de votre fichier robots.txt : sous 48 heures, nous arrêterons d'indexer les images de votre site. Pour plus de détails sur les fichiers robots.txt et leur utilisation, consultez la page suivante (au stade actuel, en anglais uniquement) : www.google.com/webmasters/3.html#B3.

