> > Le Knowledge Graph commence à afficher des tutoriels (et scrape le Web sans vergogne)

Le Knowledge Graph commence à afficher des tutoriels (et scrape le Web sans vergogne)


Le Knowledge Graph commence à afficher des tutoriels (et scrape le Web sans vergogne)
5 (100%) 2 votes

scraping

Le Knowledge Graph de Google commence à afficher, sur le site américain du moteur, des listes à puces sous la forme d'un petit tutoriel extraits de pages web. Google, le plus grand scrapeur mondial ?...

Google continue sa quête pour devenir un moteur de réponse... Depuis quelques jours, le Knowledge Graph affiche, sur certaines requêtes (notamment lorsqu'elles commencent par des termes comme "how to..."), des petits tutoriels de style "pas à pas", sous la forme de listes à puce, extraits d'une page web pour laquelle un lien est proposé en-dessous.

Ce test n'apparait pour l'instant que sur le site américain du moteur. Parfois, toutes les étapes ne sont pas indiquées, une phrase (X more items) indiquant que la suite sera trouvée grâce au lien fourni.

Quand on pense que Google a mis en place un formulaire pour lutter contre le scraping (le copier/coller sauvage) de textes sur le Web. Mais qu'est-ce donc que ce type de fonctionnalités, si ce n'est du scraping à grande échelle ?? Les contenus affichés sont-ils extraits avec l'accord des propriétaires de ces données ? On peut fortement en douter...

Voici quelques exemples de requêtes relevés par le site Search Engine Land :

google-how-to-reset-iphone

Source de l'image : Search Engine Land
make-french-toast-steps-google

Source de l'image : Search Engine Land
google-more-steps-knowledge

Source de l'image : Search Engine Land

Commentaires : 7
  1. soRef 26 juin 2014 at 9 h 21 min

    ah tiens je suis surpris qu'après une telle annonce le cours de l'action Google n'enregistre qu'une petite hausse de 2,48 %... Wait and see, ça va sûrement grimper beaucoup plus vite d'ici quelques temps, d'autant plus que maintenant que big G vend du NDD et de l’hébergement, la boucle est bien bouclée.

  2. Robert 26 juin 2014 at 11 h 27 min

    Plus ça va Olivier, plus tu tapes sur Google !

    Ça me fait toujours rigoler de voir comment Google est passé sur ce blog en 10 ans du statut de la boite la plus cool du monde à une multinationale tentaculaire que tout le monde déteste 🙂

  3. Fabien Branchut 26 juin 2014 at 12 h 46 min

    @Robert : Tout à fait et ça me rassure (et fait plaisir) de voir Olivier monter au créneau pour pousser des coups de gueules de ce genre, lui qui habituellement est plutôt modéré.

  4. serge esteves 26 juin 2014 at 13 h 25 min

    C'est finalement qu'une continuité logique, sauf que là ça touche directement des gros morceaux de contenus et pas seulement des petit bouts (title, description, avis, microdata,...). Google a toujours scraper du contenu, obligé, il en a besoin dans son algo. C'est la manière dont il utilise qui peux susciter des interrogations.

    Pour voir le verre à moitié plein, le visiteur qui verra ce genre d'extraits ira surement sur le site source, pour voir plus de détails. Je constate qu'il y a des petits points ...

    Et ça récompense les sites qui font des articles de fonds, une tendance qui se confirme

  5. Christophe 26 juin 2014 at 14 h 14 min

    Ben oui il a tous les droits ... Et lorsqu'on fait quelques petites requêtes pour connaitre nos positions, il nous met un captcha. On devrait en faire autant, sauf que pour être dans les SERPs, on est obligé de laisser passer le bot.

  6. Victor 27 juin 2014 at 10 h 10 min

    Il a raison GG nous persuade de modeler le web (guidelines, micro-données, ...) pour mieux l'exploiter, et ce forcement à son avantage ...
    Par contre, pas question de le scrapper lui 🙂

  7. jimmy 27 juin 2014 at 10 h 24 min

    Ce qui me fait le plus marrer dans tout ça moi c'est que plusieurs site reprenne les même images de recherche avec des "HOW TO" qui vont générer un nombre de requete pour Iphone assez significatif ... ce qui va faire remonter Iphone (ou les french toast) dans les propositions du knowledge Graph.
    Et si derrière tout ça ce n'était pas les actions Apple qui montait ... #EVIL
    🙂

Un site du Réseau Abondance | Olivier Andrieu | Contact | Publicité sur le site