Nous continuons notre série de questions/réponses avec Google en abordant un point souvent évoqué dans le domaine du SEO : le Content Spinning.

Rappelons que le Content Spinning est un système de réécriture automatisée de textes : lorsque vous avez sur une page web un texte donné et que vous désirez reproduire ce texte sur une autre page en évitant tout problème de "duplicate content", une façon de procéder est d'utiliser des outils de Content Spinning (il en existe des tonnes facilement trouvables sur le Web), qui vont réécrire le texte en question en changeant certains mots, des verbes, etc. pour obtenir un deuxième texte modifié sans aucune intervention humaine et suffisamment différent pour passer aux yeux des moteurs pour un contenu distinct de l'original.

Certains "scrappeurs" (voleurs de contenus) utilisent également ces outils pour créer des contenus sur leur site de façon automatique en copiant des textes qui ne leur appartiennent pas sur le Web et en le modifiant automatiquement. D'autres gros sites web, en France ou ailleurs, utilisent également de tels logiciels pour modifier leurs contenus ou leurs fiches produits, etc.

Nous avons donc posé la question au service "Search Quality" de Google : qu'en est-il du "Content Spinning" et Google accepte-t-il ces pratiques ?...

Question Abondance : Quelle est la position officielle de Google au sujet du "content spinning" (réécriture automatique de contenu) : est-ce du spamdexing ? Peut-on utiliser de telles techniques pour éviter le duplicate content ? Dans un autre domaine, pour des techniques comme le cloaking, la position de Google est très claire : il n'existe pas de "bon cloaking". Qu'en est-il du content spinning : la position est-elle aussi claire ?

La réponse de Google : Tout contenu proposé sur un site web doit être avant tout être créé pour les utilisateurs et non pour les moteurs de recherche. Le "content spinning" n’offre rien de nouveau aux internautes (si ce n’est un contenu déjà existant, rendu illisible) et est clairement destiné aux moteurs de recherche plutôt qu’aux utilisateurs. Par conséquent, des actions peuvent être prises sur les sites qui proposent ce genre de contenus et de pratiques.
Il en va de même pour tout contenu réécrit, traduit automatiquement, ou modifié de façon à vouloir le faire apparaître comme unique au robot Googlebot.

Notre commentaire : la position de Google est donc très claire concernant le Content Spinning : il s'agit de Spamdexing et ces techniques sont donc pénalisables sans aucun problème.
Reste à voir la notion de "texte rendu illisible", comme le dit Google, par ce type de logiciel, ce qui nous semble assez loin de la réalité, certains outils étant très performants dans ce domaine.
La question majeure reste celle-ci : comment Google peut-il détecter - et donc pénaliser - un texte réécrit automatiquement par des outils de "Content Spinning" ? Difficile, ici, d'apporter une réponse...
Mais au moins, les webmasters qui tenteront le Diable avec ces outils sauront à quoi s'en tenir si leur site web est pénalisé (rappelons que depuis peu, le fait qu'une tentative de spam soit détectée par Google sur certaines pages d'un site peut faire étendre la pénalité au site entier). Un webmaster averti en vaut donc deux...

Rappel des précédentes Questions à Google :
1. Les underscores dans les URL
2. Web 2.0, Contenu caché et pénalités Google
3. La pondération des liens entrants - ou backlinks
4. Les redirections multiples en cascade
5. Modification de la vitesse de crawl des spiders
6. Référencement et hébergement mutualisé
7. Sitemaps et nombre d'URL indexées
8. Référencement et redirections 301
9. Google prend-il en compte l'attribut Longdesc ?
10. Le nombre de pages d'un site web indexées par Google
11. Mots clés et Google Webmaster Tools
12. Les 3 chiffres dans les URL sont-ils obligatoires pour être indexé dans Google Actualités ?