> > Du spamdexing à base de balise "canonical"

Du spamdexing à base de balise "canonical"


Notez cet article

un pirate est peut être en train d'insérer à votre insu dans vos pages des balises "canonical", montrant à Google que vos documents sont dupliqués des pages du site du pirate... Bad trip...

Le site Search Engine Watch relate, sur la base d'une discussion dans le forum Webmaster World, le fait qu'un nouvelle forme de spamdexing (fraude aux moteurs de recherche) verrait le jour actuellement : l'insertion de balises "link rel canonical" dans des pages d'un site à l'insu de leur webmaster.

Le principe est finalement assez simple : un pirate s'introduit sur votre site et intègre dans vos pages une balise "link rel canonical" indiquant à Google que la page en question est dupliquée d'une page sur le site du pirate. C'est donc cette page qui sera mise en avant par le moteur de recherche dans ses résultats. La page "canonique" du pirate recevra également les backlinks de la page piratée.

Plus fort encore : certains pirates mettraient en place un système de cloaking, ne montrant la balise "canonical" qu'aux moteurs et pas aux internautes. Ainsi, ni vu ni connu et difficile de vérifier si tout va bien (on pourra, dans ce cas, utiliser l'outil, dans les Webmaster Tools, qui vous indique comment Googlebot voit votre code HTML)...

Attention donc de vérifier que votre site ne connaît pas d'intrusion de ce type, sachant qu'un pirate pourrait faire bien pire encore une fois qu'il est dans la place...


Source de l'image : Search Engine watch

Articles connexes sur ce site :
- Deux nouvelles balises meta pour identifier la source d'un contenu (18 novembre 2010)
- Google : la balise "rel=canonical" maintenant disponible pour des sites différents (16 décembre 2009)
- Duplicate Content : Google, Microsoft et Yahoo! s'entendent sur une balise commune (16 février 2009)
- Contenus syndiqués et Duplicate Content (22 janvir 2008)

Commentaires : 15
  1. LaurentB 22 mai 2011 at 15 h 07 min

    L'imagination de certains n'en finira jamais de m'étonner.

  2. Jeremy 22 mai 2011 at 18 h 02 min

    J'en tire mon chapeau, c'est d'une finesse. Il faut avouer que c'est tout de même plus beau qu'un spam comment en masse.

  3. Dinosaure 22 mai 2011 at 21 h 16 min

    très très malin et inquiétant...
    se voir quasiment disparaitre de l'index google, c'est disparaitre... les dommages sont bien plus importants qu'un effacement de site où un backup résoudra le problème assez vite finalement.

    Par contre là le mal est vraiment important sur du long terme 🙁

  4. Annuaire Qualitatif 22 mai 2011 at 21 h 47 min

    D'où l'intérêt de maîtriser les solutions techniques (CMS, blogs, forums, wiki...) employées 😉

  5. Keeg 23 mai 2011 at 9 h 30 min

    On risque de voir quelques procès débarquer. Sur certains secteurs, ça va s'amuser.

  6. Thibaut 24 mai 2011 at 12 h 39 min

    comment est-ce possible ? si vos articles sont en base de données, je ne vois vraiment pas comment un pirate peut faire pour insérer du contenu... à moins d'avoir les pass de la bd...

  7. Référencement 25 mai 2011 at 19 h 49 min

    Comme annoncé à leur lancement, les liens entre sites internet, utilisant des balise canonical, ne sont pas pris en compte par Google.

    Le référencement n'est donc normalement pas impacté par une telle pratique. Maintenant, il bien évident que si le pirate est dans la place les conséquences peuvent être dramatiques.

    Pour info l'utilisation de canonical n'est pas très bien gérée jusqu'à preuve du contraire car même si le moteur de recherche est informé d'un duplicate content, l'internaute lui ne le sait a priori pas...

  8. Abondance 26 mai 2011 at 5 h 07 min

    @Référencement : euh, je n'ai pas compris la première et la troisième phrase ????

    "Comme annoncé à leur lancement, les liens entre sites internet, utilisant des balise canonical, ne sont pas pris en compte par Google."

    Ce ne sont pas les liens qui utilisent les balises canonical ??

    "Pour info l'utilisation de canonical n'est pas très bien gérée jusqu'à preuve du contraire car même si le moteur de recherche est informé d'un duplicate content, l'internaute lui ne le sait a priori pas..."

    Alors là j'avoue que je ne comprends pas la phrase ;))

    a+++

  9. Référencement 26 mai 2011 at 6 h 57 min

    @Abondance : les réponses que tu cherches pour la première phrase sont dans cette vidéo : http://www.youtube.com/watch?v=Cm9onOGTgeM

    Pour la troisième phrase, je n'ai peut-être pas été clair. Utiliser une redirection 301 est simple et clair puisque l'internaute n'a plus accès à la page redirigé et ne pénalise donc presque pas le référencement. A l'inverse, lorsque que l'on utilise un élément canonical, l'internaute a accès à la page "dupliquée". C'est donc moins propre qu'une redirection 301. Sachant que l'important est, si possible de gérer, ces problèmes de duplication de contenu le plus en amont possible et d'utiliser l'élément canonical uniquement si aucune autre solution n'est envisageable.

  10. Abondance 26 mai 2011 at 7 h 08 min

    @referencement : ben j'aurais préféré une explication plutot que l'URL d'une vidéo très connue sur le sujet 🙂
    En gros, on parle de lien ou de balise canonical ? Je ne vois pas le rapport entre les deux ? En fait, pour moi, la phrase " les liens entre sites internet, utilisant des balise canonical, ne sont pas pris en compte par Google" ne veut rien dire, ou alors je ne la comprends pas, ce qui est possible... D'où la nécessité d'une explication...

    Pour l'autre partie attention : la balise canonical ne peut pas etre remplacée a chaque fois par une 301, heureusement d'ailleurs; Elle sert surtout en cas de partenariat et syndication, pour mettre dans la version imprimable d'une page, etc. voire dans le cas de duplicate content de type DUST, etc. Et là, pas de 301 possible...

    cdt

  11. David Wynot 26 mai 2011 at 8 h 29 min

    "les liens entre sites internet, utilisant des balise canonical, ne sont pas pris en compte"

    Je n'en ai pas eu l'usage donc je n'ai pas mémorisé la source

    mais il me semble bien que justement un Rel Canonical peut faire référence à un autre site (c'est obligé parfois pour signaler une duplication hors site)
    et que donc il a PRESQUE tous les "avantages" d'une 301. J'ai bien dit PRESQUE.

    Ce piratage serait donc une application de cette "redirection".

    David

  12. Anonymous 26 mai 2011 at 13 h 55 min

    et si on a pas de balise canonical ?
    c'est grave ??

  13. Référencement 26 mai 2011 at 16 h 12 min

    "En gros, on parle de lien ou de balise canonical ?" j'ai peur que l'on passe beaucoup de temps à expliquer les choses... il s'agit d'un "Canonical link element" c'est dans le film 😉

    Un peu plus loin, toujours dans cette même vidéo, il est expliqué que : "we allow things within the same domain but we don't allow things to cross domain (...) right now with this element you can only use it within the same domain"...

    Nous autorisons des choses (échanges) dans un même site mais pas entre sites (...) actuellement vous ne pouvez utiliser cet élément que dans un même site. Matt Cutts ajoute plus loin qu'il par contre possible de l'utiliser dans les sous-dommaines d'un même site.

    Bon référencement.

  14. Abondance 26 mai 2011 at 16 h 17 min

    La vidéo date du 12 février 2009...
    Le 16 décembre 2009, la balise a été étendue aux sites diférents :
    http://actu.abondance.com/2009/12/google-la-balise-relcanonical.html
    La veille c'est important, il faut lire Abondance quotidiennement 🙂
    ps : bon pour l'explication, je laisse tomber, pas grave 😉
    Bonne soirée
    a+

  15. Référencement 27 mai 2011 at 7 h 31 min

    Bonjour, En effet je ne savais pas que l'on pouvait l'utiliser inter sites...

    Merci pour l'info.

    Bonne journée

Un site du Réseau Abondance | Olivier Andrieu | Contact | Publicité sur le site