Goossip : Balises Canonical, Pénalités, Sitemap et Rich Snippets, PDF et Duplicate Content, HTML5, Balises Linguistiques et Netlinking Adulte

Quelques infos sur Google et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec une mouture 'spéciale rentrée' : la balise 'canonical' adaptée aux images, la perte de trafic après une pénalité, l'effet du Sitemap XML sur les rich snippets, le risque de duplicate content entre contenus PDF et HTML, l'HTML5 comme critère de pertinence, la prise en compte des balises linguistiques et l'impact d'un netlinking depuis des sites adultes. Rien que ça...

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, Google+, forums, conférences, etc.). Donc "gossip" (rumeur) + Google = "Goosssip" 🙂 La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

Sujet Information Taux  de  fiabilité Source
Canonical  John Mueller a indiqué lors d'un hangout que la balise "canonical" ne pouvait pas fonctionner pour les URL des images. Ceci est logique puisque cette balise n'est absolument pas faite pour cela. Search Engine Roundtable
Pénalités  Le même John Mueller a également indiqué qu'après être sorti d'une pénalité, un site ne retrouve jamais , en général, son référencement tel qu'il était avant la pénalité, car "le Web a changé et les algorithmes de Google également entre temps". Une autre raison est que vous avez perdu (puisque vous avez nettoyé) les liens toxiques qui vous faisaient monter dans les classements ou toute autre tentative de manipulation que vous aviez mis en oeuvre. Sans ces "boosters artificiels", il est normal que la situation soit moins rose après leur élimination... Search Engine Roundtable.
Sitemap et Rich Snippet  Une question étonnante qui a été posée à John Mueller lors d'un hangout : "est-ce que les Sitemaps XML aident pour obtenir les étoiles en rich snippets (lorsque ces étoiles n'apparaissent pas alors que le code est bien implémenté) dans les SERP Google ?" Ben la réponse est non, il n'y a aucun impact. Logique... 🙂 Search Engine Roundtable
PDF et Duplicate Content  John Mueller a fait une réponse ambigüe sur le risque de duplicate content entre un contenu disponible au format HTML et également dans un fichier PDF à l'identique. Pour lui, cela ne semblerait pas poser de problèmes. Matt Cutts avait dit le contraire en 2011. C'était certes il y a 5 ans, la situation a peut-être changé chez Google depuis ce temps... Search Engine Roundtable
HTML5  Toujours John Mueller qui a cette fois répondu clairement sur le fait qu'un site développé en HTML5 n'était pas un critère de pertinence retenu par l'algorithme de Google à l'heure actuelle. TheSemPost
Balise de langue  Et encore John Mueller (qui ne semble pas être parti en vacances 🙂 ) qui a expliqué que Google ne tient absolument pas compte des balises de type <html lang="en-gb"> du code HTML d'une page pour en déterminer la langue et le pays-cible, car ces balises ne sont en règle générale pas fiables. Ce sont les balises Hreflang qui sont utilisées pour cela. TheSemPost
Netlinking adulte  John Mueller, cette fois sur Twitter, a indiqué que le fait d'avoir des backlinks qui proviennent de sites "adultes" n'est en soi pas un problème et n'est pas systématiquement considéré comme "pénalisable" par les algorithmes du moteur, simplement sur le fait qu'il s'agit de sites "adultes". Bref, ce type de site est considéré comme toute autre source d'information par Google en termes de netlinking (ils ne bénéficient pas d'un traitement spécifique)... Search Engine Roundtable
logo-infos-google
Goossip (Infos Google).
Source de l'image : Google