Pour Google, le contenu généré automatiquement enfreint ses recommandations et est donc passible de pénalités

Olivier Andrieu / 11 Avr 2022 à 07h48

Temps de lecture : 3 minutes

Partagez l'article

Pour Google, le contenu généré automatiquement enfreint ses recommandations et est donc passible de pénalités

Google l'a répété une fois de plus : le contenu généré automatiquement par des algorithmes de type GPT-3 est considéré comme du spam et est donc pénalisable par le moteur de recherche. Tout est ensuite certainement affaire de nuances...

John Mueller (Google) l'a indiqué (à nouveau, car ce n'est pas une nouveauté) lors d'un récent hangout avec des webmasters : le contenu généré automatiquement grâce à l'intelligence artificielle et des outils comme GPT-3 et assimilés, est considéré comme du spam et va à l'encontre de ses recommandations pour les webmasters. Il est donc potentiellement passible de pénalités de la part du moteur de recherche.

Une page dédié à ce contenu généré automatiquement est d'ailleurs disponible dans ces recommandations. Voici ce qu'elle dit :

Le contenu généré automatiquement repose sur la programmation. Lorsque ce contenu est destiné à manipuler les classements de recherche plutôt qu'à aider les utilisateurs, Google peut intervenir. Voici quelques exemples (liste non exhaustive) :

Texte qui contient peut-être certains mots clés de recherche mais qui n'a aucun sens pour le lecteur ;
Texte traduit par un outil automatisé sans intervention humaine, ni correction avant publication ;
Texte généré par des processus automatisés, tels que les chaînes de Markov ;
Texte généré à l'aide de techniques automatisées de synonymie ou d'obscurcissement ;
Texte généré en détournant des résultats de recherche ou des flux Atom/RSS ;
Assemblage ou combinaison de contenus issus de différentes pages Web sans ajout de valeur.

Si vous hébergez un tel contenu sur votre site, empêchez son affichage dans la recherche Google.

Quand on sait que Google sait aujourd'hui faire la différence entre un texte rédigé par des humains et un texte conçu par un algorithme, on peut comprendre que le texte créé par intelligence artificielle comporte des risques non négligeables.

On peut cependant aussi comparer cette situation à celle du spinning : si c'est fait avec des méthodes de bourin (massivement et sans intervention humaine), il est évident que c'est condamnable parce que détectable (qui plus est, c'est éthiquement et humainement blâmable). Mais si les algorithmes ne sont que des outils secondaires et qu'une partie humaine est ajoutée à un « premier jet » réalisé par une machine, il y a de fortes chances que cela soit totalement indéctectable et non pénalisé.

Il reste donc à savoir à quel niveau on se positionne sur l'échelle du bourinage… 🙂

La question posée à John Mueller lors du hangout pour webmasters. Source : YouTube

Auteur : Olivier Andrieu.

Olivier Andrieu

Fondateur Abondance

Olivier Andrieu était consultant SEO indépendant. Il a créé la société Abondance en 1996 et le site abondance.com en 1998. En 2023, il a décidé de prendre sa « retraite SEO » pour se consacrer à son activité de scénariste de BD à temps plein.

ActuMoteurs, la newsletter hebdo d'Abondance

Rejoignez nos 20 000 abonnés et recevez, chaque semaine, tous nos articles dans votre boite mail !

Les données transmises par le biais de ce formulaire sont uniquement destinées à Abondance. Elles ne seront en aucun cas cédées à des tiers. Vous pouvez vous désabonner à tout moment en cliquant sur les liens de désinscriptions présents dans chacun de nos emails. Pour plus d’informations, vous pouvez consulter l’intégralité de notre politique de traitement de vos données personnelles.

7 Commentaires

Bernard SPERANDIO sur 8 juin 2022 à 10 h 09 min

Bonjour Olivier

J’ai un big doute que Google sache détecter un contenu généré automatiquement par l’IA.
Mais comme le dit John Mueller, le principal est que le texte fourni réponde à l’intention de recherche de l’internaute.
S’il ne répond pas exactement, de toute façon, IA ou non IA, il ne sera jamais sur la 1ere page.
Ensuite, évidemment il ne faut pas faire un copier coller « bêtement » du rendu du générateur qui là clairement selon Google est du spam.

Ce générateur de contenu doit plutôt le prendre comme un outil d’aide à la rédaction, on y ajoute du texte personnalisé, on rajoute quelques liens et images.., bref on le personnalise.

Actuellement, je suis entrain de tester un de ses générateurs et j’avoue que c’est quand même bluffant.
Il trouve la trame de la page avec les les balises H2 , on peut à l’infini (selon option tarifaire bien sur), rajouter des paragraphes, mixer entre eux, et le résultat est quand même très bon.

On peut gagner sur une création d’un article je pense 2 bonnes heures.
Et surtout le rendu est largement meilleur, dans 90%, que le contenu créé par des personnes habitant hors UE , et cela pour un coût moindre.

Enfin, et surtout, cela ne remplacera jamais un contenu généré par un rédacteur web professionnel, mais à quel prix (que seul les grosses entreprises pourront se l’offrir).
Cela me rappelle une interview sur ce sujet qui date, entre Lucie Rondelet et vous même.

PS: je dirais pour conclure, que la génération de contenu par IA est identique à l’achat de backlinks, c’est strictement interdit par Google, mais tout le monde l’utilise avec des sociétés spécialisées sur cette thématique. Après il faut savoir les utiliser intelligemment, et cela est un autre problème…
Réponse
Pascal sur 14 avril 2022 à 8 h 09 min

Quand on voit qu’il y a certains de ces contenus qui apparaissent régulièrement dans Google Actus et les alertes Google il y a de quoi être dubitatif.
Réponse
Francois sur 13 avril 2022 à 10 h 59 min

Je fais du contenu généré automatiquement depuis 15 ans… et comme celui-ci répond parfaitement à des besoins, il n’y a jamais eu de problèmes…
Réponse
Jo sur 12 avril 2022 à 12 h 55 min

Quel cirque, cette communication de Google. La réalité est tout le contraire : les résultats de Google sont tellement ouverts aux contenus générés automatiquement qu’ils se multiplient de plus en plus. Le moteur de recherche est d’ailleurs leur seule raison d’être. C’est un fait que Google, lui-même, confirme lorsqu’il publie ses statistiques, toujours en hausse, de spams supprimés (bien trop tard) de son index.

Voyez par ex. votre propre article du 7 avril dernier sur les images dans la recherche universelle, c’est linguee (contenu généré automatiquement) qui apparaît en PERMIERE place sur la première capture d’écran.
Réponse
- JO sur 12 avril 2022 à 12 h 57 min
  
  lire: PREMIERE
  Réponse
Greg sur 11 avril 2022 à 23 h 10 min

et bimmm comme sur Bing qui annonce aussi la couleur sur sa page « Ligne directrices » de Help Webmaster :

« Contenu généré automatiquement : Le contenu généré par la machine est une information générée par un processus informatique automatisé, une application ou un autre mécanisme sans l’intervention active d’un humain. Le contenu comme celui-ci est considéré comme malveillant, et contient normalement du texte d’ordures qui n’a été créé que pour garnir un classement supérieur. Ce type de contenu entraînera des pénalités. «
Réponse
Grange sur 11 avril 2022 à 12 h 42 min

Désolé mais j’ai été pris pour une machine pour un commentaire élogieux sur une promenade en catamaran donc pour moi la machine n’est pas encore au point
Mon cerveau n’a pas de nano technologie et quand je dis m » » »e c’est bien français
Comme aurait dit Cambronne !!!
Réponse

Laisser un commentaire Annuler la réponse

Pour Google, le contenu généré automatiquement enfreint ses recommandations et est donc passible de pénalités

Google l'a répété une fois de plus : le contenu généré automatiquement par des algorithmes de type GPT-3 est considéré comme du spam et est donc pénalisable par le moteur de recherche. Tout est ensuite certainement affaire de nuances...

Articles complémentaires :

Google est poursuivi en justice pour vol de contenu pour former ses produits IA

Merchant Center dans Analytics 4 : les recommandations de Google