Quelques infos sur Google et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec au programme cette semaine quelques réponses à ces angoissantes questions : Les indications de la Search Console sont-elles suffisantes dans le cadre d'un désaveu de liens ? Une URL redirigée doit-elle se trouver dans un fichier Sitemap XML ? Est-ce que le fait de rediriger des nombreuses URL vers la page d'accueil est une bonne pratique ? Comment Google analyse-t-il les fichiers PDF ? La mauvaise qualité d'un site implique-t-elle la mauvaise qualité des liens qu'il génère ? Faut-il il créer un maximum de liens internes depuis la page d'accueil d'un site web ?

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, Google+, forums, conférences, etc.). Donc "gossips" (rumeur) + Google = "Goossips" 🙂

La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

 Désaveu
Lors d'un hangout, John Mueller a indiqué que, dans le cadre d'une procédure de désaveu de lien, les données de la Search Console (zone "Liens vers votre site") étaient la plupart du temps suffisantes pour vérifier qu'aucun lien toxique ne pointait vers votre source d'information.
Source : Search Engine Journal
Taux de fiabilité :
Notre avis : On est assez d'accord. Les données de netlinking fournies par la Search Console ne sont pas exhaustives mais sont, en général, plus utiles selon nous que celles d'outils tiers comme Majestic, Ahrefs ou Open Site Explorer. Même si ces derniers outils sont complémentaires par ailleurs, pour d'autres raisons et besoins. Mais dans le cadre d'un désaveu, la Search Console peut suffire pour identifier des liens éventuellement toxiques dans la majorité des cas.
 Sitemap XML
John Mueller l'a dit et redit dans le passé : lorsque vous créez vos fichiers Sitemap XML, n'y intégrez pas d'URL redirigée (301 ou autre). Il l'a encore répété sur Twitter récemment. Google se sert notamment de ce fichier pour établir la liste des URL canoniques, donc les URL redirigées n'y ont pas leur place.
Source : TheSemPost
Taux de fiabilité :
Notre avis : C'est clair et c'est la même chose pour les URL canonicalisées (hors DUST, bien sûr). Elle ne doivent pas se trouver dans le fichier Sitemap XML.
 Redirections massives
John Mueller l'avait là aussi, déjà dit dans le passé. Il l'a encore une fois répété dans un hangout : rediriger (notamment lors d'une migration avec changement massif d'adresse des pages web) toutes les anciennes URL d'un site vers la page d'accueil est une très mauvaise pratique, à éviter aboslument. Les redirections doivent dans l'idéal se faire page par page, chacune vers un contenu proche ou similaire.
Source : Search Engine Roundtable
Taux de fiabilité :
Notre avis : Voir notre vidéo sur le traitement des erreurs 404. Cette (mauvaise) pratique est connue et non recommandée par tous les référenceurs depuis des lustres. A éviter absolument !
 PDF
John Mueller a indiqué sur Twitter que, lorsqu'il indexe les documents PDF ou autres (certainement Word, Excel, Powerpoint ou autres), il passe dans un premier temps par une phase de conversion du PDF en HTML. Et c'est ce document converti en HTML qui est ensuite indexé.
Source : Search Engine Roundtable
Taux de fiabilité :
Notre avis : Cela ne nous aide pas beaucoup en termes de SEO de savoir cela (si ce n'est que cela renforce encore un peu plus le risque de duplicate content entre un document HTML natif et son équivalent PDF s'il est disponible en ligne), mais c'est toujours intéressant d'avoir cette information sur laquelle, à notre connaissance, Google n'avait jamais communiqué. De la culture générale, en quelque sorte ☺
 Lien de faible qualité
John Mueller a expliqué sur Twitter que la qualité globale du site qui fait un lien vers vous n'est pas la seule source d'information que Google utilise afin de qualifier la qualité du lien en lui-même. D'autres critères entrent en ligne de compte.
Source : Search Engine Roundtable
Taux de fiabilité :
Notre avis : Google a également communiqué sur ce point à de nombreuses reprises dans le passé. Et c'est clair. L'ancre du lien, par exemple, son emplacement dans la page, etc. sont autant de points très (voire beaucoup plus) importants dans ce sens.
 Linking interne
John Mueller a parlé lors d'un hangout de la technique consistant à mettre en place des liens depuis la page d'accueil vers toutes les pages d'un site, ou vers un maximum de ces pages. Si la pratique est assez logique pour un tout petit site, elle est à déconseiller pour des gros sites, car Google n'arrivera pas, alors à comprendre la structure du site et la façon dont l'arborescence est conçue.
Source : Search Engine Journal
Taux de fiabilité :
Notre avis : Quand on vous dit d'éviter les mega-lmenus et les fat footers qui tuent votre SEO !
Goossip (Infos Google). Source : Google