La récente fuite de données de Google a secoué la communauté SEO, révélant des informations potentiellement importantes sur les algorithmes de classement. Google a enfin répondu, minimisant l'importance de la fuite, tandis que plusieurs SEO américains expriment des doutes sur la véracité et l'actualité des données divulguées.

Ce qu'il faut retenir :

  • Google affirme que les documents divulgués manquent de contexte et sont obsolètes ; 
  • Google maintient sa politique de non-commentaire sur les détails spécifiques des algorithmes de classement ; 
  • La communauté SEO est divisée, certains doutant de l'authenticité et de la pertinence des fuites ; 
  • Des experts SEO mettent en garde contre les conclusions hâtives basées sur ces informations.

La réponse de Google face au Google Leak

En réponse à la fuite des 2500 documents internes de l’équipe de recherche Google, la firme a pris le parti de minimiser leur importance en affirmant qu'ils manquent de contexte et sont obsolètes

Un porte-parole de Google a déclaré que de nombreuses hypothèses basées sur ces données sont incorrectes et que les signaux de classement évoluent constamment, même si les principes fondamentaux du classement restent inchangés.

En refusant de commenter les détails spécifiques des documents, Google prétend protéger l'intégrité de ses résultats de recherche contre toute manipulation malveillante. Cependant, cette position sert aussi à maintenir une opacité qui profite avant tout à l'entreprise elle-même.

Les doutes des SEO américains au sujet du Google Leak

Parmi les experts SEO, de nombreux sceptiques ont récemment fait entendre leur voix concernant la validité et l'actualité des documents divulgués. Pedro Dias, un ex-Googler, et Ryan Jones, ont exprimé des réserves sur la crédibilité des fuites. Ils incitent les SEO à ne pas tirer de conclusions hâtives sans une analyse approfondie et contextuelle des informations.

Même si je pense que la transparence est une bonne chose. Envisagez une approche saine face aux fuites de données :

- Utilisation de questions

- Prise en compte du contexte d'absence

En un mot : informez-vous, mais ne suivez pas aveuglément le point de vue de qui que ce soit simplement parce qu'il s'agit d'un sujet complexe.

Merci pour l'avertissement, Mike!

Mon point de vue sur les documents divulgués.

Nous ne savons pas si c’est pour la production ou pour les tests. Je suppose que c'est principalement pour tester des changements potentiels.

Nous ne savons pas ce qui est utilisé pour le Web ou pour d’autres verticales. Certaines choses peuvent uniquement être utilisées pour un accueil Google ou des actualités, etc.

Nous ne savons pas ce qu’est une entrée dans un algorithme ML et contre quoi on s’entraîne. Je suppose que les clics ne sont pas une entrée directe mais sont utilisés pour entraîner un modèle à prédire la cliquabilité. (en dehors des boosts de tendances)

Je suppose également que certains de ces champs s'appliquent uniquement aux ensembles de données de formation et non à tous les sites.

Suis-je en train de dire que Google n'a pas menti ? Pas du tout. Mais examinons cette fuite de manière répréhensible et sans biais préconçus.

Trevor Stolber va même plus loin, affirmant que ce sont simplement des données de code obsolètes et une distraction de la part de Google face au lancement des AI Overviews dans un post LinkedIn : 

Comme la plupart des référenceurs, j’ai lu des informations sur la fuite de la documentation Google.

J’ai une opinion légèrement différente de celle que la plupart semblent avoir et je la partage.

Voici quelques observations que j'ai faites;

1) Il s'agit d'une base de code obsolète (toujours très intéressante - mais ancienne et non utilisée)

2) Cela ne vient pas réellement de leur algorithme de classement, c'est une API utilisée en interne

3) Nous connaissions déjà la plupart des choses qui s’y trouvent

4) Il existe de nombreuses informations publiques qui confirment certaines des choses ici

5) Vous devez remettre en question le timing – Google avait besoin d'une distraction

6) Pour moi, cela ressemble beaucoup à la fuite de Yandex

7) Je ne pense pas que vous auriez une variable pour les bons clics et les mauvais clics, vous auriez une valeur pour une variable appelée clics que l'évaluateur indiquerait bon ou mauvais

8) Une bonne documentation du code de production spécifierait des plages et des valeurs - je ne vois rien de tout cela ici

9) Google n'utilise pas le DA (Domain Authority) - DA est un analogue du PR (Page Rank) qui était le différenciateur remarquable de Google - je ne sais pas pourquoi tant d'attention est accordée à ces nuances.

10) Je n’y crois pas !”

Alors, que penser de ce Google Leak ? Véritables informations utiles pour améliorer vos pratiques SEO ? Ou informations potentiellement obsolètes à prendre avec des pincettes ?