Goossips : Images, Indexation et Sitemap XML

Quelques infos sur Google et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec au programme cette semaine quelques réponses à ces angoissantes questions : Google indexe-t-il des images dont l'URL se trouve dans les feuilles de style CSS ? Le moteur de recherche indexe-t-il toutes les pages d'un site web, de façon exhaustive ? Les URL présentes dans un Sitemap XML sont-elles considérées comme canoniques ? Etc.

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, Google+, forums, conférences, etc.). Donc "gossips" (rumeur) + Google = "Goossips" 🙂 La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

 Images
John Mueller a expliqué dans un hangout que Google n'indexait pas les images dont l'URL serait présente dans un fichier CSS. Il ne prend en compte que les URL présentes dans le code HTML lui même, et il a recommandé l'utilisation de la balise "IMG" pour cela.
Source : Search Engine Roundtable
Taux de fiabilité :
Notre avis : Google indexe également des images présentes dans des codes plus complexes qu'au travers de la balise IMG, mais effectivement toujours dans des balises HTML et non pas dans les CSS. Mais il est clair que si les images sont importantes pour votre site, l'utilisation de la balise IMG (et son attribut ALT, bien sûr) est fortement recommandée...

 

 Indexation
John Mueller a confirmé sur Twitter que Google n'indexait jamais TOUTES les pages d'un site web. Et, comme d'habitude, selon la communication bien huilée du moteur, il a ajouté qu'il fallait avant tout se concentrer sur la qualité du contenu, etc., etc.
Source : Search Engine Roundtable
Taux de fiabilité :
Notre avis : Il est normal que Google n'indexe pas toutes les pages d'un site web, ce qui signifie qu'il va se concentrer sur les pages de meilleure qualité. Mais que se passe-t-il si on désindexe toutes les pages de faible qualité pour ne "donner à manger" à Googlebot que les "bonnes" pages ? Google les indexera-t-il toutes, dans ce cas ?...

 

 Sitemap XML
John Mueller a là aussi rappelé (car cela avait déjà été dit à plusieurs reprises dans le passé) que les URL présentes dans le fichier Sitemap XML étaient souvent utilisées par le moteur pour définir les adresses des pages canoniques et, donc, celles qui doivent se retrouver dans les résultats de recherche.
Source : Search Engine Roundtable
Taux de fiabilité :
Notre avis : Il s'agit en effet de l'une des utilisations les plus intéressantes du fichier Sitemap XML : indiquer à Google quelles sont les URL importantes de votre site et donc quelles sont les pages canoniques. Il faut donc bien réfléchir au contenu de ce fichier qui n'a pas obligatoirement vocation à être exhaustif. Et éviter les 301 ou les pages dupliquées en son sein...

 

logo-infos-google
Goossip (Infos Google).
Source de l'image : Google