Google a modifié son mode de calcul du nombre de pages indexées pour un site web

John Mueller a indiqué dans un hangout que Google avait amélioré son système de calcul du nombre de pages indexées pour un site web, donnée affichée dans la Search Console (Webmaster Tools). Cela suscite quelques interrogations de notre part...

Petit pataquès de communication (encore un ?) chez Google actuellement au sujet du nombre de pages indexées affiché pour site web dans la Search Console (Webmaster Tools) dans la zone "Index Google > Etat de l'indexation" dont voici un exemple :

google-sc-indexation

Source de l'image : Google

Il y a quelques semaines (entre le 16 et le 23 août, comme on le voit bien sur le graphique ci-dessus au niveau de la flèche rouge), ce nombre de pages indexées avait chuté de façon anormale pour se restabiliser quelques jours plus tard. John Mueller, dans un hangout (à partir de 5'30", voir ci-dessous) explique, de façon un peu floue, à Barry Schwartz qu'il s'agissait en fait d'une coïncidence entre un bug chez eux et le moment où ils ont décidé d'améliorer ce comptage de pages afin qu'il soit plus précis.

4 remarques sur le nombre de pages indexées

Ce fait amène donc 4 remarques :
- La nouvelle est surtout que Google a modifié/amélioré son système de calcul du nombre de pages indexées pour un site web, ce qui est une bonne chose.
- Aucun rappel ou mention n'est fait (sous la forme d'un trait vertical en règle générale dans les Webmaster Tools, lorsque cela est fait) de cette date de modification du système de comptage sur les graphiques, ce qui est dommage. Attention donc : à partir de fin août, il peut y avoir un décalage au niveau des stats sur la courbe fournie. On aurait apprécié un peu plus de communication de la part de Google à ce sujet.
- Il est étonnant de voir que Google ait du mal à effectuer ce comptage du nombre de pages indexées, ce qui semble pourtant ultra-simple (même dans un index aussi énorme que le sien). Que la syntaxe de recherche "site:" soit approximative, on peut le comprendre car il faut répondre très rapidement à une requête en ligne. Mais dans les Webmaster Tools, Google a tout le temps d'effectuer ces calculs. Il est étonnant qu'il en soit encore aujourd'hui à améliorer ce système...
- Rappelons qu'il serait VRAIMENT très utile de pouvoir télécharger les URL des pages indexées. Cela permettrait de vérifier que toutes les pages importantes sont présentes, mais également de nettoyer l'index de Google de pages de faible qualité. Tout le monde aurait à y gagner en ne présentant au moteur que les pages réellement intéressantes. C'est, à notre avis, le plus grand manque des Webmaster Tools à l'heure actuelle !



Source de l'image : YouTube