Ce qu'il faut retenir :
- Plus de 1 000 sites francophones générés par intelligence artificielle ont été recensés par Next & Libération, utilisant des techniques SEO pour capter l’audience et les revenus publicitaires.
- Les journalistes dénoncent des pratiques nuisant aux médias traditionnels par le détournement de leur trafic et l'exploitation de contenus parfois non sourcés ou plagiés.
- Les éditeurs dénoncent l'hypocrisie des rédactions : elle utilisent l'IA et l'automatisation pour investir des espaces en dehors de leurs lignes éditoriales tout en reprochant ces pratiques aux autres.
L'avis tranché des journalistes : les médias full-IA polluent le web
Le 6 février 2025, les médias Next et Libération ont publié deux articles, faisant suite à plusieurs mois d'enquête sur des médias francophones générés par IA, visiblement au nombre de 1000 et quelques : "un recensement forcément non exhaustif". Le postulat du journaliste Jean-Marc Manach, à l'origine de l'enquête : ces "faux" médias polluent le web et Google, prenant la place des "vrais" médias (comprendre : traditionnels) en les copiant et en les plagiant.
"Une nouvelle ruée vers l’or se déroule sur Internet. Des entrepreneurs rusés, profitant des coûts dérisoires et des performances de l’intelligence artificielle générative, inondent actuellement le web de petits «sites d’actualités» où sont publiés, de manière automatisée, des contenus tantôt paraphrasés, tantôt plagiés, quand ils ne sont pas simplement inventés." - Libération
Cette apparition d'une multitude de sites médias inquiète fortement la presse dite "traditionnelle". En effet, ces sites sont vraisemblablement créés par des référenceurs professionnels (ayant donc une meilleure compréhension que les journalistes du fonctionnement des moteurs de recherche). Ces entrepreneurs ne cherchent pas à partager de l'information mais à seulement tirer profit des bénéfices issus de leur trafic Google Discover (affiliation, vente de liens, etc.).
Une concurrence jugée déloyale par les journalistes des médias traditionnels, considérant ces sites comme des "parasites" (d'après Florent Rimbert, responsable du pôle développement numérique de l'Apig), volant une partie de leurs revenus et trafic :
"L’ampleur du manque à gagner est actuellement difficile à estimer. Si la majorité des sites fantoches identifiés dans le cadre de cette enquête semblent générer peu de trafic, une vingtaine de plateformes francophones engrangent chaque mois les clics des dizaines de milliers de visiteurs – des proportions qui rivalisent, voire surpassent, certains petits acteurs de la presse française." - Libération
Cette concurrence déloyale est aussi vecteur de désinformation selon les journalistes : en cumulant faux profils de rédacteurs et hallucinations des IA, certains sites ont diffusé de fausses informations. Il citent "Boris", un éditeur interviewé pendant leur enquête : «L’an dernier, s’amuse Boris, l’un de mes sites a mis en avant, photo à l’appui, une manifestation annuelle… qui ne s’était pas tenue depuis 2006. La maire de la ville concernée nous a contactés, en nous demandant comment il était possible que nous mettions en avant une photo d’un événement qui n’existait pas. Nous avons supprimé dans la foulée…»
Ces sites sont d'ailleurs mentionnés comme "sources" au sein même de Wikipédia :
"Nous leur avons depuis transmis à la liste des 1 066 sites GenAI identifiés à ce jour : 443 sont mentionnés comme « sources » et notes de bas de page sur Wikipédia, soit plus de 40 % du total. La liste de ces noms de domaine va désormais permettre aux contributeurs de l'encyclopédie de vérifier combien peuvent légitimement continuer à y figurer, ou pas (nous y reviendrons)." - Next
Mais cette guerre va plus loin qu'une simple opposition entre deux formes de rédaction - l'une journalistique, et l'autre IA. Jean-Marc Manach et Libération ont été jusqu'à contacter Google, pour leur fournir une liste des sites qu'ils avaient détecté comme générés par IA, attendant que la firme fasse un grand ménage dans les sites mis en avant :
"Il aura cependant fallu que nous lui [porte-parole de Google] mentionnions quelques sites repérés par Next et Libé dans le cadre de cette enquête pour que la modération s’opère." - Libération
Qu'en pensent les éditeurs de médias IA ?
Comme on s'en doute, cette enquête n'a pas été bien accueillie par les éditeurs de sites et les SEO. Interviewés à l'occasion de l'enquête de Libération, les éditeurs se défendent :
"Ce sont les médias traditionnels qui, les premiers, sont venus nous concurrencer sur nos métiers», s’agace un entrepreneur. Nombreux sont ceux qui citent le cas des articles de comparatifs conso, autrefois pré carré des petits éditeurs web, qui sont désormais publiés par des journaux et magazines établis, assumant même de toucher une commission sur certains liens. Du côté de Tremplin numérique, on va même plus loin : «On nous reproche de la paraphrase sans citation ? Mais les journaux le font chaque jour entre eux ! Il y a zéro plus-value journalistique là-dedans, mais les personnes dont le métier se résume à ça, dans les rédactions, ont quand même le droit à leur carte de presse.» Et d’enfoncer le clou : «Notre contenu n’apporte rien, et le leur non plus, mais nous, on l’assume". - Libération
Sur X (Twitter), d'autres ont pris la parole suite au thread publié par Jean-Marc Manach, relevant l'hypocrisie des journalistes et le fait que de nombreux médias utilisaient déjà l'IA pour générer du contenu avant les éditeurs de sites :
Jeter en pature et sans discernement des éditeurs de sites, avec les conséquences dramatiques que ça peut avoir, montre l'état d'esprit lamentable d'une profession en crise profonde, qui ne survit que grâce aux subventions publiques et aux mauvaises pratiques généralisées.… https://t.co/lsJHTjWBaG
— David Chelly (@onlinestratfr) February 8, 2025
La personne qui a écrit ça connaît très peu le business web pour ne pas se rendre compte que les grands sites (e-commerce, médias, etc.) utilisaient GPT2 bien avant les petits éditeurs de sites.
— Romain Lenglet 📈 (@RLglt) February 7, 2025
Tout aussi "bassement"
Par ailleurs son extension de détection sera 100% inefficace https://t.co/Bgk4ei7Bwn
Un petit peu de vrai et BEAUCOUP d'hypocrisie, car leur réel problème, c'est qu'ils ne veulent pas partager leur gâteau. https://t.co/hnzvop2GtB
— Raphael Doucet (@RaphSEO) February 7, 2025
La réponse de Clément Pessaux, éditeur et référenceur, qui vaut le détour
Clément Pessaux, expert Discover et SEO de longue date, a rédigé un article sur LinkedIn où il répond, point par point, aux différentes affirmations de Libération. Une réponse structurée et argumentée qui mérite d'être lue, que l'on soit d'accord ou non avec son propos.
Il aborde, notamment, la "mauvaise utilisation" du terme de concurrence déloyale, car l'audience des sites médias IA est insignifiante par rapport à celle des médias traditionnels, sans considérer la surproduction d'articles :
"Quand on parle de concurrence déloyale, c'est dans les faits une erreur flagrante, car il ne faut pas confondre le volume de production d'info via l'IA (les GenIA) et l'information visible ou lue. L'audience des sites IA sur l'actualité "pure" est totalement marginale. Voir un site produire 6000 articles par jour d'actualité est sans aucun doute problématique, mais si son audience est marginale le problème par essence n'existe pas. Il devient le bouc émissaire facile et caricatural alors que son impact réel est proche de zéro." - Clément Pessaux
Il continue en rappelant que l'information n'est plus exclusivement entre les mains des journalistes :
"[...] La gestion de l'actualité pour être valide doit passer par un journaliste sans quoi la légitimité et la crédibilité seront remises en cause. Il n'y a donc aucun "contre-pouvoir" ? Je ne vais pas nécessairement tomber dans la pensée de Gustave Le Bon (La psychologie des foules) et sa vision de la presse, lui qui considérait la presse comme un puissant outil de manipulation. Mais l'information, la communication, n'est pas l'apanage des journalistes, je trouve toujours dangereux ce discours qui pose le journalisme comme gardien du temple de certaines vérités (et l'article de Libération et celui de Next plongent dans ce travers) qui est lié avec le point suivant."
En conclusion, Clément reconnaît que la génération de contenu IA peut poser problème, mais que la presse a bien d'autres problèmes - plus importants - que lutter contre ces éditeurs :
"Je ne vais pas nier qu'il y a une vraie problématique au niveau de la génération de contenu d'actualité avec de l'IA. Cela pose des problèmes au niveau des droits d'auteur, c'est un fait et c'est même indéniable. Et oui, une certaine presse peut disparaître si et seulement si elle n'évolue pas et ce ne sera en aucun cas la faute de l'IA ou de quelques sites majoritairement insignifiants qui changeront quelque chose. J’en veux pour exemple un autre article “Quarante médias saisissent la justice pour bloquer «News DayFr», un des multiples «sites parasites» générés par IA” sur le fond on peut comprendre la démarche au vu du volume de contenu généré, sur la forme on parle ici d’un site qui fait 100K de trafic mensuel pour des revenus que l’on peut estimer, sans trop se tromper, à 300€ par mois. Il faut avoir des ennemis à la hauteur du conflit et ici ce n’est clairement pas le cas." - Clément Pessaux
Que penser de l'affaire ?
Nous choisissons de donner un droit de réponse aux référenceurs car il est important d'ouvrir ces débats : la place de l'IA dans l'édition, le risque de désinformation et la pérennité des médias (on vous conseille de lire également les commentaires sur l'article LinkedIn de Clément).
Chez Abondance, nous utilisons ChatGPT, Perplexity et Claude. L'IA est un outil, ce qu'on en fait relève de notre responsabilité. Si vous continuez à nous lire, c'est parce que nos articles sont utiles et pertinents. La valeur ne réside pas dans l'information mais dans la plus-value de l'éditeur.
Finalement, ce qui anime ce débat entre journalistes et éditeurs anime tous les référenceurs : comment me distinguer de mes concurrents ? comment apporter plus de valeur que les autres ? quel angle nouveau apporter à mes contenus ? comment inspirer confiance ? Abonnez-vous aux médias que vous estimez être de valeur. Chillez sur Discover. Développez votre esprit critique quand vous consommez un contenu. Bref, faites ce que vous voulez finalement. Nous, on continuera d'écrire des articles qui vous aident à apprendre le SEO.
J’ai du mal avec l’argument « eux ils le font alors pourquoi pas nous », que ce soit dans le cadre de « ouin-ouin les médias traditionnels viennent nous concurrencer sur le terrain des comparatifs » ou « ouin-ouin les médias traditionnels utilisaient déjà ChatGPT avant nous » ou encore « ouin-ouin notre contenu n’apporte rien mais le leur non plus », ça fait très enfantin. Ça me rappelle le « c’est ç’ui qui dit qui y’est » de notre enfance.
Dans le monde, il y a plein de gens qui font des choses néfastes pour autrui, est-ce pour autant qu’il faut faire de même ? Parce qu’à ce compte-là, pourquoi ne pas se lancer dans le détournement d’argent, le trafic de drogue, les assassinats ou le trafic d’êtres humains, parce que ça a l’air de rapporter. Il faut grandir un peu, au bout d’un moment. Des gonzes de 40 balais qui sortent ce genre d’arguments, c’est ras-les-pâquerettes quand même.
Faites des choses parce que vous pensez qu’elles sont bonnes pour les autres et pour la société, pas parce que le voisin fait pareil et gagne bien sa vie et que vous avez envie de vous en mettre plein les fouilles aussi.
Je ne défends pas becs et ongles la presse traditionnelle, attention ! Bien sûr qu’il y a des problèmes, des « vrais » journalistes qui ne font que publier des comparatifs avec des produits sponsorisés ou des critères d’évaluation peu pertinents, des articles qui ne font que se paraphraser entre eux, ou reprendre des communiqués de presse sans analyse ou mise en contexte. Oui, c’est vrai, ça arrive, c’est un problème qu’il faut régler. Mais l’argument du « ils font de la merde donc on peut faire de même » décrédibilise complètement les interlocuteurs qui l’utilisent.
Les tweets cités dans l’article sont contradictoires, ça montre bien le niveau de réflexion : selon l’un, la profession de journaliste est « en crise profonde », tandis que selon l’autre, les journalistes « ne veulent pas partager leur gâteau ». Faut choisir, les gars : les journalistes souffrent ou se régalent ? Quant au 3e commentaire, vu qu’il affirme de manière péremptoire que l’extension de NXi est « 100% inefficace » alors qu’elle l’est particulièrement au moins pour les poignées de gens qui la commentent sur les articles de NXi ou les stores d’extensions, ça n’enjoint pas plus à écouter les dires du bonhomme.
Regardons les dires de Clément.
– « voir un site produire 6000 articles par jour d’actualité est sans aucun doute problématique » : oui ça l’est, ça crée du « bruit » et gaspille de l’énergie électrique pour générer les contenus, les héberger, les promouvoir, et stocker les commentaires qu’ils suscitent. Pas besoin d’aller plus loin dans la phrase, ça ne fait particulièrement avancer le débat. Notons qu’il y a assurément d’autres sites qui sont tout aussi mauvais, voire pire : pas besoin de désigner du doigt le voisin, regardons déjà la paille dans notre propre œil.
– « la gestion de l’actualité pour être valide doit passer par un journaliste » ou « ce discours qui pose le journalisme comme gardien du temple de certaines vérités » : non, personne n’a jamais dit ça, ou alors de manière très minoritaire. C’est l’argument de l’homme de paille, comme dire que les écologistes veulent s’éclairer à la bougie. Il est seulement dit que les journalistes sont censés avoir été (notez bien les 3 mots précédents…) formés à la manière de présenter une info de manière neutre et factuelle et de creuser un sujet, contrairement à des experts SEO et prompt-engineers. Et oui, malheureusement, parfois la formation ne suffit pas, et les valeurs ou l’inclinaison d’un journaliste lui font traiter l’actualité de manière biaisée. Les journalistes sont des humains, il est impossible de traiter une information de manière 100% neutre. Mais on peut essayer de le faire, c’est à ça que servent les formations et cartes de presse.
– « n’y a-t-il aucun contre-pouvoir » : si, un même sujet peut être traité différemment selon les médias et les journalistes qui les écrivent, de par l »orientation d’un média ou les êtres humains qui les écrivent. Donc mauvaise compréhension du milieu du journalisme et de la presse par ce monsieur.
– NewsDayFR, victime d’un procès injuste, lui qui n’obtiendrait un bénéfice que de 300€ par mois. La valeur pécuniaire brute récoltée par la site est une chose, insignifiante effectivement. Je ne crois pas que les médias l’ayant attaqué le font pour se partager ses bénefs. Qu’en est-il de l’ombre qu’il fait aux véritables médias (tout visiteur voulant se renseigner sur un sujet et trouvant plus rapidement le sujet sur ce site n’ira pas forcément sur un autre site), et de la manipulation de la pensée que le site provoque chez ses lecteurs ? La GenAI peut « halluciner », inventer des choses, ou les synthétiser à outrance en omettant des détails et précisions pourtant essentielles.
– Et enfin, l’argumentaire cherchant à minimiser la problématique des médias GenIA, qui ne feraient que peu de bénef, que peu d’ombre aux médias traditionnels, n’obtiendraient que peu de visites, peu de lectures, sont « majoritairement insignifiants » ou des « ennemis pas à la hauteur »… Eh ben alors, si c’est débile et que ça sert à rien, autant arrêter tout ça vu que c’est tout nul, non ? Passé l’ironie de la chose, certes, à l’heure actuelle c’est peut-être tout petit. Ceux qui utilisent ce genre d’argument n’ont sans doute jamais dû entretenir un jardin et voir pousser une mauvaise plante : si on n’y fait rien, dans quelques années c’est tout un bosquet qui aura poussé, et dans une dizaine d’années, c’est toute une partie du jardin qui sera inaccessible, et le travail de nettoyage sera coûteux.
Non, franchement je cherche hein, mais j’arrive pas à trouver des arguments des défenseurs de « médias full-IA » ou « professionnels du SEO » qui valent la peine d’être écoutés, ou qui me ferait me dire « tiens, c’est peut-être pas con ce qu’il dit ». Faudrait peut-être qu’ils demandent à une IA de leur générer des arguments convainquants 😏
La GenAI un outil trop puissant et dangereux, et l’information correcte et aussi juste que possible des citoyens est un enjeu trop essentiel, pour laisser des experts du SEO et prompt engineers devenir le « contraire pouvoir de la presse traditionnelle » qu’ils souhaiteraient être, pour ceux qui ne cherchent pas juste à s’en mettre plein les fouilles. Oui à l’utilisation de l’IA comme outil pour certaines tâches ingrates ou rébarbatives (je l’utilise moi-même), non à son utilisation comme outil de génération de sites web et contenus. Ces derniers doivent rester produits par des humains pour s’assurer un traitement « réel » et ne pas finir avec un Internet fantôme d’ici quelques dizaines d’années.
Bref, merci pour l’article de présentation du contre-argumentaire, c’est édifiant !
Finalement, le commentaire de Philippe YONNET est le plus important dans cet article. Il ne s’agit pas d’un combat entre presse « traditionnelle » et référenceurs. Il s’agit de droits et obligations des médias et de responsabilité éditoriale : si on publie des informations relues, sourcées et validées humainement avec l’aide de l’IA, rien à redire. Si on utilise l’IA pour générer trois sous de manière irresponsable, c’est très problématique, car l’IA ressemble à quelque chose de vrai. Et c’est ça, pas son gagne pain, que la presse « traditionnelle » défend : un travail sérieux et vérifié…
Merci pour ton article Laura.
Mais avant de choisir un camp, il ne faut pas se tromper de débat.
Ce n’est pas un combat des « médias traditionnels » contre les contenus générés par IA qui est en cause ici, principalement. C’est un combat entre des producteurs de contenus qui croient en leur mission de journaliste et des acteurs qui s’affranchissent de toutes les règles éthiques et légales et utilisent l’IA à mauvais escient pour gagner deux fifrelins. Sans se soucier des conséquences.
Or aujourd’hui, les medias « full AI » utilisent des technos qui au mieux génèrent du « slot » (des contenus pourris) et au pire des contenus contenant des erreurs factuelles graves.
Au moins, quand nos amis blackhat généraient du « yaourt » à la place de textes normaux, personne ne se servait de leur pages de spam comme source d’information.
Là on génère des pages de sites d’actualités, dont les contenus remplis d’hallucinations ne sont contrôlés par personne. Avec un risque que ces contenus soient pris au sérieux.
Est-ce que l’on peut laisser faire cela sans réagir ? Non, ce n’est pas défendable.
Il y’a un changement d’échelle entre le « spam » à l’ancienne, et ce qui est permis par les IA génératives. Ce qui était gentiment irresponsable avant devient gravement irresponsable.
Tout éditeur de site a des droits, mais aussi des devoirs et doit respecter la réglementation et les règles du jeu économique, au risque sinon de se retrouver devant les tribunaux
Et tiens, c’est ce qui commence à arriver. Je trouve cela logique.
Je te rejoins. Et je ne pense pas que les éditeurs, dont Clément qu’on cite dans cet article, soient en désaccord avec la désinformation, la génération full-IA sans relecture, les hallucinations… Je te rejoins également sur le fait que, désormais, le risque est plus grand car les spammeurs disposent d’armes (e.g. Discover) à plus grande portée.
Mais la mesure reste de mise. Notre droit de réponse est aussi un moyen de rappeler qu’il ne faut pas « mettre tout le monde dans le même panier ». Des éditeurs full Disco, j’en connais plein, toi aussi, et ce ne sont pas tous des gens à l’éthique douteuse ou discutable.
PS : en réalité, au-delà du titre putaclic, je ne vois pas comment choisir un camp dans ce débat.
Vraiment très intéressant.
On dirait presque un match de boxe : d’un côté, la presse traditionnelle avec son expérience, de l’autre, l’IA qui enchaîne les uppercuts d’innovation. 😆
Plutôt qu’un combat, ce ne serait pas plus malin de voir une cohabitation intelligente ? Hâte de voir comment ça évolue. Merci pour cet article.