Goossips : EMD, Temps de chargement des pages et Budget Crawl

Quelques infos sur Google et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec au programme cette semaine quelques réponses à ces angoissantes questions : Google va-t-il relancer son filtre antispam EMD (Exact Match Domain) ? Quelle est la limite à ne pas dépasser en temps d'affichage moyen de vos pages web ? Une balise robots 'noindex' ou 'canonical' impacte-t-elle le budget crawl alloué à votre site par Googlebot ?

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, Google+, forums, conférences, etc.). Donc "gossips" (rumeur) + Google = "Goosssips" 🙂 La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

Sujet   Information Taux  de  fiabilité Source
EMD    Gary Illyes a indiqué la semaine dernière qu'il était en chasse pour rechercher des noms de domaines "spammy" de type EMD (Exact Match Domain). Il a également expliqué que les EMD en eux-mêmes ne posaient pas de problèmes, mais que c'était plutôt leur conjonction avec d'autres techniques spammy qui pouvaient pénaliser un site. En tout cas, il se pourrait que cela bouge dans ce domaine d'ici peu... Search Engine Roundtable
Vitesse d'affichage    John Mueller a indiqué sur Twitter qu'une métrique intéressante pour le temps d'affichage moyen d'une page sur un site web était de garder ce chiffre inférieur à 2 à 3 secondes, en appliquant l'outil WebPageTest. De notre côté, nous partons le plus souvent sur la base suivante : "le plus rapide possible, mais tant que cela ne dépasse pas 4 à 5 secondes, pas trop de soucis à se faire, et de toutes façons cela n'influera pas vos classements sur Google"... Search Engine Roundtable.
Budget crawl    Un point évident mais rappelé par John Mueller sur Twitter : le fait d'intégrer une balise meta robots "noindex" n'économisera pas du "budget crawl" (temps alloué à Googlebot pour crawler votre site) puisque, pour lire cette balise, le robot doit crawler le code source. Il est en globalement de même avec les balises "canonical"... Search Engine Roundtable 1, Search Engine Roundtable 2.
logo-infos-google
Goossip (Infos Google).
Source de l'image : Google