Ça n'aura échappé à personne : Google Discover est submergé de fausses informations. Face à l'ampleur du phénomène, Google a annoncé mi-novembre 2025 travailler activement sur un correctif pour éliminer ce type de spam qui pollue sa plateforme de recommandation. Il était temps, diront certains !

Ce qu'il faut retenir :

  • De faux articles massivement visibles : des contenus frauduleux générés par IA ont été vus par des millions d'utilisateurs, avec par exemple un article mensonger sur les licences TV gratuites au Royaume-Uni visible par 2,95 millions de personnes.
  • Une technique d'exploitation sophistiquée : les spammeurs rachètent des noms de domaine expirés ayant une autorité établie, puis y publient des contenus IA avec des titres sensationnalistes pour manipuler l'algorithme de Discover.
  • Un écosystème international de spam : plus de 8 300 faux sites générés par IA ont été recensés en français, 300 en anglais et 150 en allemand, selon le journaliste Jean-Marc Manach qui suit ce phénomène.
  • Google reconnaît le problème : le géant de la recherche a déclaré travailler sur une solution spécifique pour ce type de spam, tout en affirmant bloquer déjà « la grande majorité » des contenus frauduleux..

Une vague de fausses informations dans le fil d'actualité

Google Discover affiche désormais régulièrement des articles totalement inventés qui trompent des millions d'utilisateurs. Parmi les exemples récents au Royaume-Uni, un article prétendant que les personnes de plus de 60 ans pouvaient bénéficier d'une licence TV gratuite a atteint le sommet des classements Discover, visible par 2,95 millions de personnes. L'article, hébergé sur un site appelé « mountainbrooksolarproject », a été identifié comme entièrement généré par IA par l'outil de détection Pangram, et les informations qu'il contient sont totalement fausses.

Un autre article frauduleux affirmant des changements dans les règles d'utilisation des cartes de bus au Royaume-Uni a été consulté par 1,85 million d'utilisateurs. Ces contenus se retrouvent hébergés sur des sites aux domaines improbables : sites d'événements abandonnés, projets expirés, et même des sites d'écoles comme « Prashant High School ».

Exemple d'information inventée massivement diffusée sur Discover - Source : PressGazette

La stratégie des spammeurs décryptée

Les auteurs de ces contenus frauduleux utilisent une technique bien rodée, et bien connue des experts, pour contourner les filtres de Google. Selon Malcolm Coles, consultant britannique spécialisé dans la croissance d'audience pour les éditeurs, les spammeurs achètent des noms de domaine expirés qui bénéficiaient auparavant d'une bonne réputation auprès de Google. Cette technique d'exploitation abusive de domaines expirés est officiellement interdite par Google, qui la définit comme l'achat et la réutilisation d'un nom de domaine principalement pour manipuler le classement dans la recherche.

Une fois le domaine réactivé, les spammeurs y installent un thème WordPress optimisé pour les spécifications techniques de Google, notamment pour améliorer les performances sur mobile, puisque Discover n'est actuellement disponible que sur smartphones. Ils utilisent ensuite des titres délibérément alarmants ou pleins de promesses pour inciter au clic, accompagnés d'informations suffisamment détaillées pour paraître crédibles, alors que tout est faux.

Le journaliste français Jean-Marc Manach, qui traque de près ces sites frauduleux, a identifié une technique supplémentaire appelée « l'étincelle » (ou « spark » en anglais). Les spammeurs manipulent l'algorithme de Discover, qui se base en partie sur les clics des utilisateurs, en achetant du faux trafic via des fermes de clics ou en partageant leurs liens dans des groupes Facebook pour générer artificiellement de l'engagement.

Un phénomène massif à l'échelle européenne

L'ampleur du problème dépasse largement le Royaume-Uni. Jean-Marc Manach a constitué une base de données recensant plus de 8 300 faux sites générant des contenus par IA en français, 300 en anglais et 150 en allemand. Ces sites plagient des informations, fabriquent de fausses nouvelles et utilisent Google Discover comme une machine à cash pour générer des revenus publicitaires.

En France, le problème a été documenté dès septembre 2025, avec une enquête de NextInpact identifiant des milliers de faux médias inondant le web de textes issus d'IA générative. Reporters sans frontières a même appelé Google à renforcer les critères d'accessibilité à Discover pour favoriser les médias journalistiques authentiques, soulignant le danger que représente ce « mélange des genres mortifère pour l'information fiable ».

​La réponse de Google face à la crise

Face aux critiques croissantes, Google a publié une déclaration reconnaissant le problème. Un porte-parole de l'entreprise a affirmé les intentions de la firme américaines, sans toutefois préciser de calendrier pour le déploiement de cette solution.

« Nous maintenons la grande majorité du spam hors de Discover grâce à des systèmes robustes de lutte contre le spam et des politiques claires contre les nouvelles formes de contenu de faible qualité et manipulateur. Nous travaillons activement sur un correctif qui permettra de mieux traiter le type spécifique de spam référencé ici, en maintenant notre niveau d'exigence élevé pour la qualité dans Discover".

​L'entreprise affirme examiner régulièrement les sites signalés et prendre des mesures s'ils enfreignent ses politiques. Depuis mai 2025, des pénalités manuelles ont commencé à apparaître sur Discover, témoignant d'une volonté de Google de reprendre le contrôle de sa plateforme.

Un enjeu central pour les éditeurs légitimes

Pour les éditeurs de contenu authentiques, la prolifération du spam IA dans Discover représente une menace existentielle. Le fil de recommandation de Google est devenu une source de trafic majeure, notamment au Royaume-Uni où le groupe Reach l'a décrit fin 2024 comme son « principal générateur de trafic ». Selon des données de Chartbeat datant d'août 2024, plus des deux tiers du trafic Google vers les principaux sites d'actualités mondiaux provient désormais de Discover.

Les éditeurs légitimes se retrouvent donc en concurrence directe avec des sites frauduleux qui exploitent des failles techniques pour capter l'attention et les revenus publicitaires. Malcolm Coles estime que Google doit « soit revenir à l'affichage uniquement de domaines d'éditeurs de confiance dans Discover, soit mettre en place des filtres beaucoup plus robustes concernant l'exactitude factuelle et la fiabilité ». Il souligne notamment qu'il est « ridicule que des domaines nouvellement (ré)enregistrés soient autorisés dans Discover de cette manière ».

Les limites des politiques actuelles de Google

Les règles de contenu de Google pour Discover interdisent les contenus haineux, explicites et publicitaires insuffisamment identifiés, ainsi que les contenus trompeurs. Cependant, ces standards ne mentionnent pas spécifiquement les contenus générés par IA. Cette absence crée une zone grise que les spammeurs exploitent massivement.

Dans ses règles concernant le spam dans la recherche web, Google interdit pourtant explicitement l'utilisation abusive de domaines expirés, définissant cette pratique comme l'achat et la réutilisation d'un nom de domaine expiré principalement pour manipuler le classement en hébergeant des contenus sans intérêt pour les utilisateurs. Le problème réside dans l'application de ces règles à Discover, qui semble moins stricte que pour la recherche classique.

Un porte-parole de Google a précisé que Discover affiche un mélange de contenus basé sur les intérêts des utilisateurs, pouvant inclure des publications sur les réseaux sociaux, des vidéos courtes et bien plus, sans se limiter aux éditeurs de presse traditionnels. Cette ouverture, couplée à des mises à jour récentes privilégiant davantage les contenus de créateurs et de réseaux sociaux, a potentiellement facilité l'intrusion du spam IA.