robot spider

Les Google Webmaster Tools proposent depuis hier des statistiques sur l'indexation d'un site par Google. Une fonction encore assez proche du 'gadget' mais qui représente un pas intéressant vers un outil vraiment efficace que beaucoup de webmasters appellent de leurs voeux...

Cela faisait des années que de nombreux webmasters demandaient à Google un outil permettant de suivre de façon fine l'indeaxtion de leur site dans le moteur de recherche. Le fait que Bing fasse actuellement le forcing pour ses Webmaster Tools force au moins son concurrent à aller de l'avant lui aussi pour son outil, ce qui est une bonne chose...

Du coup, Google vient d'annoncer qu'un certain nombre d'informations statistiques étaient dès maintenant disponibles dans les GWT, sous la forme de courbes sur cet historique d'indexation pour un site donné dans la partie "Etat de santé" :

Google Webmaster Tools Indexation
Source de l'image : Google

Un bouton "Avancé" donne plus d'informations avec le nombre total de pages indexées, le nombre total de pages déjà explorées auparavant, les pages non sélectionnées (duplicate content ou pages redirigées) et les pages bloquées par le fichier robots.txt (difficile de savoir ce qu'il en est de ces différentes informations qui ne semblent pas pour l'instant expliquées en ligne) :

Google Webmaster Tools Indexation
Source de l'image : Google

C'est un premier pas de la part de Google dans le domaine de l'indexation, qui permet d'avoir une donnée historique sur l'accroissement (ou la régression) de celle-ci. Mais il manque encore l'essentiel avec un vrai outil (de meilleure qualité que la syntaxe "site:") qui permette de suivre avec la plus grande finesse les URL réellement indexées (et donc de déduire celles qui ne le sont pas)... Patience certainement...