Goossips : Firewall et CDN, Adresses Relatives et Canonical, Indice de Densité

Quelques infos sur Google (et Bing parfois) et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec au programme cette semaine quelques réponses à ces angoissantes questions : Pourquoi Googlebot ne peut-il pas parfois crawler un site ? Peut-on mettre des URL relatives dans les balises canonical ? Google utilise-t-il le concept d'indice de densité d'un mot clé dans son algorithme ?

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, forums, conférences, etc.). Donc « gossips » (rumeur) + Google = « Goossips » 🙂

La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

  

Firewall, CDN et crawl
Gary Illyes a expliqué sur LinkedIn que les deux obstacles les plus souvent rencontrés par Googlebot pour crawler un site étaient les CDN et les Firewalls plus ou moins bien configurés. Et il donne le conseil de bien vérifier ce que ces barrières mises sur un site bloquent ou pas, car selon lui, lorsqu'un blocage de Googlebot arrive, il est la plupart du temps involontaire...
Source : Search Engine Roundtable
Taux de fiabilité :
On s'en rend compte quand on veut crawler un site client lors d'un audit : certains Firewalls ou CDN sont extrêmement paranos par rapport aux outils de crawl, ce qui peut être une bonne chose pour éviter du plagiat par exemple, mais peut également être problématique si les barrières ne permettent pas à Googlebot de passer...

  

Adresses relatives dans les balises "canonical"
Gary Illyes a expliqué sur LinkedIn que les balises "canonical" sur un site web devaient contenir des adresses absolues (https://www.abondance.com/20230203-51450-quand-les-quality-raters-de-google-manifestent-pour-etre-mieux-payes.html) et non pas relatives (exemple : ../20230203-51450-quand-les-quality-raters-de-google-manifestent-pour-etre-mieux-payes.html)...
Source : Search Engine Roundtable
Taux de fiabilité :
C'est un conseil souvent réitéré par Google depuis plusieurs années et donc un point technique à retenir lorsque vous gérez ces balises...

  

Indice de densité
John Mueller a expliqué une nouvelle fois dans un hangout pour webmasters que l'algorithme de Google n'utilisait pas une notion d'« indice de densité » d'un mot clé dans un contenu pour donner une note de pertinence à une page pour cette requête : « La densité des mots-clés n'a pas d'importance, mais le fait pour le contenu d'être explicite en a et, contrairement aux vieux mythes, à l'histoire, à la plaisanterie et aux commentaires sur le référencement, il n'est pas nécessaire de mentionner toutes les variantes possibles d'un même mot clé dans un texte. »...
Source : Search Engine Roundtable
Taux de fiabilité :
Là aussi, Google le dit et le répète despuis des années. C'est une notion qui était peut-être valable sur les anciens moteurs (Inktomi, Altavista ou autre), mais pas sur Google...

  

  

Goossips : Firewall et CDN, Adresses Relatives et Canonical, Indice de Densité
Goossips : Firewall et CDN, Adresses Relatives et Canonical, Indice de Densité. Source : Google