Brioude Internet Référencement Notre expertise au service de vos projets
Accueil » Actualités » Google » Googlebot et les en-têtes HTTP
L'expert de votre visibilité
sur Internet depuis 1998
Googlebot et les en-têtes HTTP
Dans un nouveau « rendez-vous avec googlebot » sur le blog Webmaster, Google nous explique comment sont pris en compte les en-têtes HTTP et les différents codes retournés par une page web. Ceci confirme beaucoup de choses que l'on supposait sur le comportement des moteurs.
Google affirme que les codes d'erreur 404 sont un signal clair pour indiquer que des pages n'existent plus et qu'elles doivent être désindexées. Il est cependant conseille de ne pas se limiter à un simple code d'erreur mais de supprimer aussi une page personnalisée.
Une redirection 301 est le meilleur moyen de mettre à jour l'adresse d'une page et de rediriger les internautes arrivant sur un site par des liens erronés. « A chaque fois que je vois une 301, je mets à jour toutes les références de l'ancienne page avec la nouvelle que vous m'avez signalé » nous dit googlebot.
Une redirection 302 (temporaire) peut être utilisée dans certains cas particuliers, par exemple pour rediriger un internaute vers une nouvelle page mais pas de façon définitive. Dans ce cas les internautes aboutissent à la nouvelle page mais Google conservera les données de l'ancienne URL : « Une redirection 302 est utilisée pour me dire que tout le contenu et les propriétés de liens de l'URL ne devraient pas être mis à jour vers la cible - c'est juste une page temporaire »
En ce qui concerne les redirections à la chaîne (plusieurs redirections 301 successives par exemple), Google affirme que cela peut être traité par googlebot mais que c'est déconseillé.
« En petites quantités ces redirections répétées sont compréhensibles mais cela vaut le coup de considérer pourquoi vous les utilisez de premier abord. Si vous enlevez les 301s au milieu et m'envoyez directement vers la destination finale, vous nous épargnez à tous les deux un bon paquet de temps et de requêtes HTTP. Mais ne pensez pas qu'à nous. D'autres personnes peuvent se lasser de voir ce même vieux jeu de « contacting....loading...contacting » dans leur barre d'adresse. Mettez-vous à leur place - si votre chaîne de redirections commence à sembler trop longue, les utilisateurs peuvent craindre d'être envoyés dans une boucle illimitée ! Les robots aussi bien que les utilisateurs peuvent être effrayés par ce type d'engagement éternel. »
Pour finir Google nous parle des codes 304 (non modifié) : lorsqu'il va sur une page qu'il a déjà visitée, googlebot envoie une requête « If-Modified-Since » avec la date. L'envoi d'un en-tête 304 permet donc d'indiquer à Google que la page n'a pas changé et qu'il n'est pas utile de la copier, ce qui peut économiser de la bande passante pour un site.
Voilà de nombreuses informations intéressantes pour gérer l'indexation de son site dans Google...
