La procédure DMCA (Digital Millenium Copyright Act) de Google fait encore des siennes, comme hélas depuis plusieurs années : une campagne de phishing pour obtenir des liens a été détectée sur cette base, tout comme une énième désindexation de site, cette fois pour celui de Moz...

La procédure DMCA (Digital Millenium Copyright ACt) - dont le texte peut être consulté, en anglais, sur le site Web de l'office américain des droits d'auteur, n'hésitez pas à lire l'article de Réacteur qui vous dira tout sur le sujet - a été mise en place par Google afin de pouvoir lui signaler un site web ayant copié vos contenus, dans le but de le désindexer pour cause de plagiat. Ainsi, on apprenait l'année dernière que Google avait désindexé plus de 5 milliards de pages web suite à des signalement DMCA depuis la prise en compte de cette procédure…

L'objectif de ce système était donc tout à fait louable au départ, mais hélas, comme d'habitude, cela entraîne des dérives regrettables depuis bien longtemps. On vient d'en avoir deux exemples dernièrement :

Du phishing au DMCA

Il y a quelques jours, on apprenait notamment qu'une vague de phishing était apparue, sur la base de fausses déclarations DMCA. Des mails envoyés par un système d'intelligence artificielle, créant un faux profil d'avocat, avec une photo « fake », demandant à ce qu'un lien « source » soit rajouté à une image affichée sans crédit dans une page. Une bonne façon de récupérer des backlinks pour des sites n'étant pas propriétaires des images en question, bien sûr…

Mail de demande de backlink en mode phishing. Source : TheNextWeb

La page d'accueil du site Moz désindexée pendant quelques heures

Autre épisode cette semaine, lorsque le site bien connu des SEO Moz.com a fait l'objet d'une déclaration DMCA de la part d'une personne l'accusant de distribuer frauduleusement son application, ce qui a valu à sa page d'accueil une désindexation de Google pour sa page d'accueil, le temps que Twitter s'en émeuve, que Danny Sulivan le détecte et que la situation reviennne rapidement à la normale environ 12 heures après.

Ce sont des situations qui arrivent hélas souvent, depuis de nombreuses années, notamment par le biais d'actions frauduleuses de la part de SEO mal intentionnés (l'article de Réacteur en avait parlé à l'époque) et c'est aussi le fruit de l'automatisation à outrance de la part des algorithmes de Google : un biais qui peut poser problème quand un site web n'a pas la notoriété de Moz, faisant dans ce dernier cas en sorte qu'un officiel de Google agisse rapidement. Qu'en est-il lorsqu'il s'agit d'un petit site beaucoup moins influent ? Un vrai chantier important pour Google dans le futur proche.

La réponse de Google à ce problème est arrivée dans la foulée « Notre procédure de retrait DMCA vise à trouver un équilibre entre la facilité et l'efficacité avec lesquelles les titulaires de droits peuvent signaler un contenu illicite et la protection du libre accès à l'information. Si nous constatons que des pages ont été retirées de nos résultats par erreur, nous les rétablissons, ce que nous avons fait dans ce cas. Nos efforts de transparence sont conçus pour aider les tiers à identifier ce type de problèmes, et lorsqu'ils sont mis en lumière, nous agissons. Nous étudions les moyens d'améliorer nos systèmes et nos processus afin d'éviter ce type d'erreurs à l'avenir. » Bref, pas de solutions pour le moment...

Ceci dit, les demandes ne sont pas anonymes, ce qui peut limiter la portée d'actions malveillantes. Reste que c'est potentiellement possible...

Formulaire de demande DMCA sur le site de Google. Source : Google