webmaster tools

Google encourage l'utilisation complémentaire d'un ou plusieurs fichier(s)s Sitemap XML et d'un fil RSS pour mieux indexer les pages d'un site web dans le moteur de recherche...

Le blog pour webmasters de Google rappelait la semaine dernière une "bonne pratique" pour ce qui est de l'indexation d'un site web dans le moteur de recherche. En effet, rappelons que le standard "Sitemap XML" accepte plusieurs formats de fichier : texte simple, XML ou fil RSS/Atom.

Ainsi, il est judicieux de déclarer, dans le fichier robots.txt et dans les Webmaster Tools, les différents formats que vous utilisez pour votre site. Un sitemap XML pourra gérer l'aspect exhaustif de votre site, tandis que votre fil RSS prendra en compte l'actualité, les dernières pages que vous avez créées.

Google donne également sur son blog d'autres conseils de bon sens pour l'utilisation de ces fichiers :
- N'indiquez dans le Sitemap/fil RSS que des URL crawlables (pas d'URL interdite au crawl via le robots.txt, par exemple).
- Ne proposez que des URL canoniques.
- Indiquez la date de dernière modification de la page (dans le bon format).
- Envoyez si nécessaire un ping à Google lorsque vos fichiers ont été modifiés.
- Ne créez pas de Sitemap de plus de 50 000 URL ou 10 Mo.
- Utilisez PubSubHubbub pour indexer plus rapidement vos fils RSS.

Rappelons enfin que :
- Le fait qu'une URL se trouve dans un fil RSS ou fichier Sitemap ne garantit pas son indexation.
- Que cela n'aide pas au positionnement d'une page mais unique à son "référencement" dans l'index du moteur.
- Et enfin qu'une navigation "naturelle" dans le site, en cliquant sur les liens (et également au travers du plan du site pour les internautes), sera toujours plus profitable et efficace dans le cadre de l'indexation de votre site, plutôt que de compter sur des fichiers Sitemap pour "combler les trous de référencement"...

xml-sitemap-illustration

Source de l'image : DR