Google a publié cette semaine son rapport annuel sur le spam et la façon dont il le combat au quotidien. Moins chiffré que d'habitude, ce rapport met surtout l'accent sur les différents algorithmes lancés l'année dernière pour lutter contre ce fléau...

Google a publié, comme chaque année (exemples en 2021 ou 2020) son compte-rendu sur la façon dont il a combattu le spam en 2021. À cette occasion, il parle dans son post de l'algorithme SpamBrain en ces termes : « En 2021, nous avons détecté 200 fois plus de sites de spam qu'à nos débuts, il y a près de vingt ans, grâce notamment à notre système de prévention du spam basé sur l'IA, appelé SpamBrain.

SpamBrain a été lancé en 2018 et nous n'avons cessé d'améliorer ses performances. En 2021, SpamBrain a identifié près de six fois plus de sites de spam qu'en 2020. Cela s'est traduit par une réduction importante du spam piraté (70 %), qui était un type de spam couramment observé en 2020, et du spam de type "bouillie" sur les plateformes d'hébergement (75 %). Une autre caractéristique notable de SpamBrain est qu'il a été conçu pour être une plateforme robuste et évolutive permettant de faire face à tous les types d'abus.

Avec un volume croissant de spam sophistiqué produit chaque jour, la capacité de SpamBrain à identifier les comportements perturbateurs et malveillants parmi des milliards de pages Web nous a permis de maintenir plus de 99 % des recherches sans spam. »

« (…) Pour protéger la sécurité des utilisateurs, nous avons étendu SpamBrain pour lutter contre le harcèlement en ligne et, pour les requêtes de noms, réduire la proéminence des sites ayant des pratiques de suppression mal intentionnées. »

L'article parle également des différents algorithmes mis en place en 2021 pour lutter contre le spam en général : Link Spam Update en juillet mais aussi les algorithmes lancés en juin et en novembre, tout comme un algorithme sur le classement des pages présentant des évaluations de produits.

Bien sûr, toutes ces annonces surprendront tous ceux qui se retrouvent encore aujourd'hui confrontés à des SERP remplies de spam sur certaines requêtes… Cela tient à plusieurs critères : tout d'abord la définition du spam SEO qui n'est peut-être pas la même pour Google et pour les éditeurs de sites web. Mais également à la définition plus générale du spam pour Google, qui concerne tout autant les contenus soumis à copyright et piratés en ligne que le scam, le phishing ou enfin le spamdexing, soit les techniques « black hat SEO ». Quoi qu'il en soit, rappelons-nous que Google découvre 40 milliards de pages de spam chaque jour et qu'il reste encore un travail colossal à effectuer, car il y a fort à parier que la pollution des SERP a fortement augmenté ces dernières années… Hélas…

La lutte de Google contre le spam. Source : Google