Brioude Internet Référencement Notre expertise au service de vos projets
Accueil » Actualités » Google » Google et les fichiers sitemap
L'expert de votre visibilité
sur Internet depuis 1998
Google et les fichiers sitemap
Il est rare que Google communique sur son système d'indexation : voilà une bonne raison de s'intéresser à une étude publiée récemment et baptisée Sitemaps: Above and Beyond the Crawl of Duty. Cette étude apporte des informations intéressantes sur la façon dont Google prend en compte les fichiers sitemap pour l'indexation.
Un fichier sitemap consiste en une liste d'URL mises en forme dans un fichier XML et respectant un standard au niveau du balisage (voir http://www.sitemaps.org/fr/ pour plus d'informations). Ce fichier peut être un outil précieux pour indiquer aux moteurs de recherche les URL des pages à indexer.
Dans son guide en ligne sur les sitemaps, Google affirme ceci :
Les sitemaps fournissent à Google des informations supplémentaires sur votre site, complétant ainsi nos méthodes d'exploration standard du Web. Nous espérons que ces plans nous aideront à explorer votre site de manière plus exhaustive et en temps opportun. Toutefois, nous ne pouvons pas garantir que les URL de votre sitemap seront ajoutées à l'index Google
Selon cette explication, un sitemap serait d'un intérêt limité car il ne favorise pas l'indexation des pages d'un site. Or l'étude publiée par Google contredit cette affirmation : un sitemap est bien un outil stratégique pour faciliter l'indexation d'un site.
En effet selon l'étude, les pages naturellement découvertes par googlebot ne représenteraient que 22% des pages indexées, contre 78% des pages fournies par le fichier sitemap. Ce dernier joue donc un rôle très important dans l'indexation de nouvelles pages.
Une fois découvertes, les URL passent à travers un filtre antispam avant d'être transmises au robot d'exploration, qui va ensuite visiter les pages et analyser le contenu. Après passage à travers un autre filtre, spécialisé dans la détection de contenu dupliqué, les pages sont indexées et proposées dans les résultats de recherche.
Ce système peut être résumé dans le schéma suivant (source : étude Google sur les sitemaps)

Un fichier sitemap fait donc partie de la panoplie des outils incontournables pour les webmasters. On sait qu'il permet d'indexer rapidement de nouvelles pages, mais son rôle ne se limite pas à cela...
Une utilisation judicieuse des balises <priority> peut permettre d'indiquer à Google quelles sont les pages les plus stratégiques du site, à visiter régulièrement. Un sitemap peut également servir à indiquer quelles sont les URL à indexer lorsqu'il existe plusieurs URL pointant vers la même page.
Il s'agit donc d'un outil de communication avec Google et pas d'un simple fichier XML...
