scraping

Le Knowledge Graph de Google commence à afficher, sur le site américain du moteur, des listes à puces sous la forme d'un petit tutoriel extraits de pages web. Google, le plus grand scrapeur mondial ?...

Google continue sa quête pour devenir un moteur de réponse... Depuis quelques jours, le Knowledge Graph affiche, sur certaines requêtes (notamment lorsqu'elles commencent par des termes comme "how to..."), des petits tutoriels de style "pas à pas", sous la forme de listes à puce, extraits d'une page web pour laquelle un lien est proposé en-dessous.

Ce test n'apparait pour l'instant que sur le site américain du moteur. Parfois, toutes les étapes ne sont pas indiquées, une phrase (X more items) indiquant que la suite sera trouvée grâce au lien fourni.

Quand on pense que Google a mis en place un formulaire pour lutter contre le scraping (le copier/coller sauvage) de textes sur le Web. Mais qu'est-ce donc que ce type de fonctionnalités, si ce n'est du scraping à grande échelle ?? Les contenus affichés sont-ils extraits avec l'accord des propriétaires de ces données ? On peut fortement en douter...

Voici quelques exemples de requêtes relevés par le site Search Engine Land :

google-how-to-reset-iphone
Source de l'image : Search Engine Land
make-french-toast-steps-google
Source de l'image : Search Engine Land
google-more-steps-knowledge
Source de l'image : Search Engine Land