Le Google Leak n’a pas fini de livrer ses surprises. Mike King a poursuivi ses investigations et a fait de nouvelles découvertes dans les 2500 documents qui ont fuité de l’équipe de recherche de Google. On fait le point !

Ce qu'il faut retenir :

  • Mike King a fait de nouvelles découvertes en poursuivant sa lecture des 2500 documents ; 
  • ll existerait un score d’effort pour le contenu généré par IA et pour le contenu généré par les utilisateurs ; 
  • Les backlinks toxiques pourraient véritablement être pénalisants, contrairement aux affirmations de Google ; 
  • L’intention de recherche des documents serait prise en compte pour déterminer le type de contenu - commercial, informationnel… 

Nouvelles découvertes du Google Leak

Baby Panda n'est pas le HCU

Contrairement à ce qu’on pouvait penser à la lecture des documents, le système "Baby Panda" mentionné dans les documents fuités est un ancien système et non la mise à jour du contenu utile (Helpful Content Update), d’après une source connaissant les systèmes internes de Google. Mike King maintient toutefois que Baby Panda partage des propriétés similaires avec HCU.

La fuite remonte à deux ans

Les documents du Google Leak sont visiblement disponibles depuis 2 ans dans diverses bibliothèques clients de Google pour Java, Ruby et PHP. La différence réside dans le fait que ces documents avaient peu de documentation, contrairement à ceux-ci.

Score d'effort pour le contenu IA

Google semble évaluer l'effort déployé dans la création de contenu, notamment dans ceux générés par l'intelligence artificielle. On ne sait pas si tous les contenus sont notés de cette façon par un LLM, ou s’il s’agit seulement des contenus soupçonnés d’être créés avec de l’IA. 

Importance des mises à jour de page

Google mesure l'importance des mises à jour des pages pour déterminer la fréquence de leur exploration et potentiellement de leur indexation. Des mises à jour significatives sont nécessaires pour signaler la fraîcheur du contenu. Simplement modifier les dates sur la page ne suffit pas au moteur de recherche. 

Des pages protégées avec Penguin

L’algorithme Penguin (qui fait aujourd’hui partie de l’algorithme principal de Google) avait, d’après cette fonctionnalité, des pages considérées comme “protégées” du fait de l’historique de leur profil de liens. 

Selon Mike King, cette fonctionnalité combinée aux signaux de vitesse des liens pourrait expliquer pourquoi Google affirme que les attaques de negative SEO avec des liens ne sont pas efficaces.

Backlinks toxiques

Google affirme que désormais, les backlinks toxiques sont simplement ignorés par l’algorithme, et n’ont aucun impact sur le positionnement des pages. Or, la fonctionnalité “badbacklinksPenalized” suggère le contraire. Y’a t-il donc effectivement des backlinks “toxiques” qui peuvent entraîner des pénalités ? 

Score de copie pour les blogs

D’après le module BlogPerDocData, Google pourrait utiliser un score de copie spécifique pour les blogs, mesurant la duplication et affectant la qualité perçue du contenu. Ce n’est pas explicite, mais le module est lié au docQualityScore. 

Mentions et entités

Les mentions d'entités semblent jouer un rôle important dans le ranking. Même si les mentions ne sont pas traitées comme des liens, agrémenter votre stratégie de contenu en prenant en compte les entités nommées pourrait être intéressant.

Capacités de Googlebot

Googlebot n’est pas seulement capable d’effectuer des requêtes GET, mais également des requêtes POST, PUT et PATCH, d’après la documentation. Cela montre des capacités plus sophistiquées que ce que nous savions auparavant.

Effort pour l’UGC

Google mesurerait la qualité du contenu généré par les utilisateurs (user generated content) séparément du contenu principal, influençant la visibilité des sites basés sur le contenu utilisateur.

Score commercial des pages

L’intention de recherche est très importante pour le ranking. Google évalue visiblement les documents en prenant en compte leur intention de recherche, comme on le voit avec le commercialScore, qui indique si un document est commercial ou pas. Faites donc bien attention à répondre précisément à l’intention de recherche de l’utilisateur en créant votre page !

Changements stratégiques dans l'approche SEO

Quelques conseils de Mike King par rapport à ses nouvelles découvertes sur le Google Leak : 

  • Travaillez davantage votre UX en parallèle de votre SEO, pour NavBoost. Grâce à une bonne expérience utilisateur, vous pouvez amener les utilisateurs à passer plus de temps sur votre site.
  • Soyez plus attentifs aux statistiques de clics. Si vous avez beaucoup d’impressions et aucun clic, il y a certainement un problème et cela peut conduire à des baisses de positions.
  • Restez dans un domaine d’expertise précis. Le contenu doit être ciblé, votre site ne doit pas couvrir de multiples sujets qui n’ont rien à voir les uns avec les autres. Les auteurs doivent également démontrer une expertise dans ce domaine pour répondre aux critères de pertinence de Google.
  • Continuez de tester et d’ajuster continuellement vos stratégies SEO selon les résultats obtenus dans chaque domaine. 
  • Veillez à ce que les utilisateurs font après avoir quitté votre site, puisque Google utilise toutes les données de Chrome. Examinez les données de parcours de navigation (Semrush, SimilarWeb…) pour améliorer vos pages.
  • Vérifiez les SERP lorsque vous faites une étude de mots-clés. Google pourrait limiter le nombre de certains types de contenu dans les SERP, vous devez donc vérifier les résultats de recherche avant d’essayer de vous positionner sur des mots-clés difficiles à atteindre. 

Changements opérationnels dans l'approche SEO

Quelques conseils plus concrets, avec des recommandations de Rand Fishkin également : 

  • Il n’y a pas de limite de 60 à 70 caractères pour les titres, vous pouvez écrire des titres longs.
  • Faites appel à moins d’auteurs différents pour développer davantage leur expertise sur des sujets spécifiques.
  • La valeur des liens est plus élevée pour les pages les plus populaires et qui génèrent le plus de clics.
  • Un contenu long aura moins d’impact qu’un contenu original avec un meilleur gain d’informations.
  • Toutes les dates associées à une page doivent être cohérentes.
  • Lorsque vous utilisez un ancien domaine, mettez à jour le contenu pour supprimer progressivement ce que Google a en mémoire.