Le site Genius vient d'attaquer Google en justice, accusant le moteur de recherche et son partenaire LyricFind de « scraper » ses contenus, point qu'il a pu prouver au travers d'un piège inséré dans les paroles de chansons qu'il propose en ligne. Une bataille juridique qui ne date pas d'hier et qui va certainement s'avérer longue et difficile... Et qui nous rappelle qu'il peut être dangereux de laisser les moteurs de recherche piller nos contenus pour leur propre intérêt...

Si on en croit The Verge, le site de paroles de chansons Genius a attaqué en justice Google, reprochant au moteur de recherche de reprendre dans ses SERP son contenu, c'est-à-dire les paroles des chansons recherchées par les internautes.

L'histoire est en fait longue. Il y a quelques mois, Google affichait les paroles des chansons recherchées (par exemple sur des requêtes comme [paroles chanson xxxx] ou [lyrics xxx]), sans même citer la source. En effet, il était difficile de vérifier que ces paroles avaient été extraites de tel ou tel site car, a priori, elles étaient les mêmes partout, par définition même. Google pouvait donc avoir fait, de son côté, ce travail de retranscription lui-même. Pourquoi pas, après tout ?

Mais Genius était persuadé que c'était son travail qui était repris. En juin dernier, il accuse une première fois Google de lui piller son contenu. Mais comme il était difficile de prouver que c'était son travail qui était affiché, plus que celui d'un autre site ou d'une source interne au moteur, la société a alors imaginé un piège pour vérifier cela : il a rajouté, à certains endroits, dans les paroles des chansons, des apostrophes sous plusieurs formes (droites ou non) qui n'étaient bien sûr visibles que dans ses textes. Pour la petite histoire, ces différentes apostrophes, une fois extraites, dévoilaient en morse l'expression « red-handed » (« pris la main dans le sac ») 🙂 .

Des apostrophes pour piéger Google

Il suffisait ensuite d'attendre et de vérifier que le schéma des apostrophes additionnelles étaient bien réaffichées dans les SERP pour prouver que le moteur « scrapait » bien les paroles de Genius pour les reproduire d'une façon que le site estimait illégale. Google avait cependant rejeté la faute sur Twitter à ses partenaires fournisseurs de paroles de chansons : "Les paroles de chansons dans les recherches Google sont sous licence, nous ne les générons pas à partir d'autres sites sur le web. Nous enquêtons sur cette question et si nos partenaires de licence de données ne respectent pas les bonnes pratiques, nous mettrons fin à nos accords."

Ceci dit, Google affichait, depuis cette mésaventure, la source des paroles dans ses SERP, comme on le voit sur cette copie d'écran (même si, à l'heure actuelle, les paroles de chansons semblent avoir disparu des SERP en "position zéro", peut-être suite à la plainte de Genius, car elles ressortaient il y a encore quelques jours en France) :

Indication de la source lors de l'affichage des paroles de chanson. Source de l'image : Numerama

Mais Genius ne veut pas lâcher l'affaire et a continué à affirmer son préjudice subi en attaquant en justice ce mois-ci le moteur de recherche leader (et le site LyricFind, en accord avec Google), demandant 50 millions de dollars de dommages et intérêts (voir ici le dépôt de plainte). Le combat sera certainement long et difficile car il faudra établir à qui appartiennent in fine ces paroles, au moteur de recherche, à LyricFind, à Genius ou tout simplement aux auteurs des textes, voire aux interprêtes… Un sujet qui ne sera certainement pas traité en quelques jours…

Cette actualité nous montre également le danger qu'il y a à voir son contenu "pillé" par Google et repris pour le seul intérêt du moteur de recherche et de la firme de Mountain View. Tant que ce ne sont que quelques extraits (snippets) qui sont pris en compte, cela peut convenir à tout le monde dans un mode gagnant/gagnant. Mais si c'est le contenu entier qui est « scrapé », c'est une toute autre histoire ! Il est toujours bon de s'en souvenir !