Une analyse portant sur plus de 10 millions de requêtes montre que ChatGPT bascule massivement ses recherches internes (query fan-out) vers l’anglais, même lorsque la question est posée dans une autre langue. Résultat : des leaders locaux comme Allegro en Pologne ou des marques espagnoles disparaissent derrière des géants mondiaux, avec un impact direct pour le SEO et la visibilité des entreprises non anglophones.

Ce qu'il faut retenir :

  • 43 % des requêtes de recherche en arrière-plan (« fan-outs ») de ChatGPT pour des prompts non anglophones sont effectuées en anglais.
  • 78 % des sessions non anglophones incluent au moins une requête de recherche en anglais, aucun marché non anglophone n’étant en dessous de 60 %.
  • Des acteurs locaux dominants (Allegro en Pologne, logiciels allemands, marques espagnoles) sont ignorés ou relégués au profit de plateformes et marques globales.
  • Pour exister dans ces réponses, les marques non anglophones doivent penser stratégie de contenu en anglais et présence dans les sources que ChatGPT cite réellement.

ChatGPT cherche en anglais, même quand la requête ne l’est pas

Peec AI, une plateforme d’analytics dédiée à la recherche via l’IA, a analysé plus de 10 millions de prompts ChatGPT et environ 20 millions de requêtes de recherche en arrière-plan (« fan-out queries »). Pour rappel, les fan-outs sont les sous-requêtes que ChatGPT génère pour trouver des sources avant de composer sa réponse.

En se concentrant uniquement sur les sessions où la langue du prompt et le pays de l’IP concordaient (par exemple, polonais depuis la Pologne, allemand depuis l’Allemagne, espagnol depuis l’Espagne), Peec AI a constaté que 43 % des fan-outs déclenchés par des prompts non anglophones étaient en anglais. Autrement dit, près d’une étape de recherche sur deux se fait sur le web anglophone, même quand l’utilisateur parle une autre langue.

L’étude montre également que 78 % des sessions non anglophones comprennent au moins une requête en anglais, avec un minimum de 60 % pour toutes les langues étudiées. Les requêtes en turc sont les plus « anglicisées »: 94 % incluent au moins un fan-out en anglais, tandis que l’espagnol est en bas de l’échelle, mais encore à 66 %. Côté France, pr§s de 82 % des requêtes en français génèrent au moins un fan-out en anglais.

Pourcentage de requêtes qui génèrent au moins un fan-out en anglais - Peec AI

Des leaders locaux invisibles dans leurs propres marchés

Les exemples donnés par Peec AI illustrent très clairement l’impact de ce biais linguistique.

  • En Pologne : pour une requête en polonais depuis une IP polonaise du type « Jakie są najlepsze portale aukcyjne ? » (« quels sont les meilleurs portails d’enchères ? »), Allegro.pl, pourtant décrit comme la plateforme e-commerce dominante du pays, est soit absente, soit reléguée derrière eBay et d’autres plateformes globales.
  • En Allemagne : pour une question en allemand sur les « meilleures entreprises de logiciels » depuis l’Allemagne, la réponse met en avant des entreprises reconnues… mais aucune n’est allemande, alors que l’écosystème local est particulièrement riche.
  • En Espagne : pour « Quelles marques de vêtements sont recommandées ? », ChatGPT cite bien Zara et Mango, mais les sources sous-jacentes sont exclusivement anglophones (blogs et sites en anglais), centrées sur des marques globales. Pour une requête sur les « meilleures marques de cosmétiques », aucun acteur espagnol n’apparaît, ce que Peec AI relie au fait que les fan-outs ont privilégié l’anglais et la notion de « global ».

Dans l’exemple espagnol sur les cosmétiques, Peec AI montre que le premier fan-out généré par ChatGPT est en anglais (« best cosmetic brands skincare makeup top brands »), ce qui favorise mécaniquement les sources globales anglophones. Le second fan-out, en espagnol, ajoute le qualificatif « globales » (« Mejores marcas de cosméticos globales alta calidad »), terme que l’utilisateur n’avait jamais utilisé, ce qui restreint encore davantage la visibilité des marques locales.

Ce schéma ne se limite pas au commerce : pour des requêtes politiques en polonais, allemand ou français, Peec AI observe que ChatGPT cite fréquemment des médias publiant en anglais (par exemple Deutsche Welle ou Fiveable), en s’appuyant sur leurs contenus anglophones plutôt que sur des sources locales dans la langue de l’utilisateur.​

Comment fonctionne ce biais dans les fan-outs

Pour comprendre cette dérive, il faut se pencher syr la mécanique de recherche propre à ChatGPT. Quand un utilisateur pose une question, ChatGPT Search ne se contente pas d’un seul appel brut au web : il reformule et décompose la requête en plusieurs sous-requêtes ciblées, les fameux fan-outs. Ces requêtes sont envoyées à différents partenaires de recherche, et de nouvelles requêtes peuvent être ajoutées ensuite pour affiner la réponse.​

Selon Peec AI, ChatGPT commence en général par des fan-outs dans la langue de l’utilisateur, puis introduit des fan-outs en anglais au fur et à mesure de la construction de la réponse. Ce mélange fait qu’un utilisateur allemand, espagnol ou polonais voit un résultat final qui semble « localisé », mais dont une partie des sources a été sélectionnée à partir de requêtes anglaises.

Statistiquement, 43 % des étapes de recherche pour des prompts non anglophones se déroulent sur le web anglophone, et dans 78 % des sessions non anglophones, au moins un fan-out bascule en anglais. Comme le résume la synthèse de Peec AI, ce n’est pas un cas limite, mais un mode de fonctionnement courant : aucune langue non anglophone étudiée ne passe sous la barre des 60 % de sessions contenant au moins un fan-out en anglais.

Pourquoi ChatGPT privilégie l’anglais ?

L’étude propose deux grandes explications, qui tiennent autant à la structure du web qu’aux choix de conception de l’IA.​

  1. Les signaux d’autorité favorisent les contenus globaux.
    Les pages en anglais obtiennent en moyenne plus de backlinks et de citations, ce qui en fait des candidates naturelles pour être considérées comme « fiables » ou « d’autorité » par les modèles d’IA. Quand ChatGPT doit choisir rapidement des sources, il est statistiquement plus simple de trouver des sites anglophones cochant ces critères qu’un acteur local moins lié ou moins cité dans sa langue.​
  2. Minimisation du risque de mauvaise réponse.
    Environ la moitié du contenu disponible en ligne est en anglais, ce qui signifie que chercher en anglais augmente mécaniquement la probabilité de tomber sur des informations jugées pertinentes ou complètes. Pour une IA conçue pour assurer le coup, basculer vers l’anglais est une stratégie rationnelle : plus de contenu, plus de signaux, moins de risque perçu de manquer une source clé.​

Peec AI rappelle aussi que l’IA combine systématiquement les fan-outs locaux et anglais pour les utilisateurs non anglophones, alors que les utilisateurs anglophones ne bénéficient que d’un seul côté de ce mélange. Les contenus en anglais sont donc éligibles partout, tandis que les contenus en allemand, polonais ou espagnol ne sont vraiment pris en compte que sur leurs marchés d’origine.

Quelles conséquences pour le SEO dans les marchés non anglophones ?

Pour les équipes SEO et les marques locales, ce biais linguistique crée un désavantage structurel qui ne se reflète pas forcément dans les signaux classiques de Google. Les fan-outs en anglais filtrent en amont les sources candidates : seules les ressources déjà bien présentes sur le web anglophone ont une chance d’être considérées, avant même que les signaux de qualité ou de popularité ne soient évalués.

Les résultats observés par Peec AI montrent que :

  • Des leaders locaux comme Allegro en Pologne peuvent être devancés par des plateformes globales dans les réponses de ChatGPT, même si leur domination sur le marché national est nette.
  • Des marques nationales, notamment dans des secteurs très concurrentiels comme les cosmétiques ou le prêt-à-porter, peuvent disparaître complètement lorsqu’un fan-out interprète la requête comme une recherche de « meilleures marques globales ».
  • Sur des sujets sensibles comme la politique, l’IA peut privilégier des médias anglophones, ce qui implique un angle éditorial et un contexte culturel spécifique qui ne reflètent pas toujours les débats locaux.​

Plusieurs analyses SEO récentes, notamment dans Search Engine Journal, soulignent que cette dynamique pourrait conduire les équipes à intégrer explicitement la production de contenu en anglais dans leurs stratégies d’AI search optimization, au-delà du référencement classique.

Comment les marques non anglophones peuvent s’adapter ?

L’étude insiste sur un point : traduire tout son site en anglais n’est ni réaliste ni forcément efficace. L’enjeu est d’identifier le type de contenu qui est réellement cité par ChatGPT dans une catégorie donnée, et les sources anglophones qui servent le plus souvent de point d’appui.

Plusieurs pistes ressortent :

  • Cartographier les sources que ChatGPT cite déjà.
    Il s’agit d’analyser, par catégorie, les sites et formats de contenus mis en avant par l’IA (Reddit, Wikipédia, blogs experts, comparateurs, listes « top X », etc.). L’idée est de voir où vos concurrents sont présents en anglais… et où vous êtes absents.​
  • Prioriser quelques contenus clés en anglais.
    Plutôt qu’une traduction massive, l’étude encourage à produire des versions anglaises ciblées de pages produits stratégiques, de guides, de comparatifs ou de pages marque qui ont un fort potentiel d’être citées. Ce sont ces contenus qui ont le plus de chance d’entrer dans le champ des fan-outs en anglais.​
  • Chercher à apparaître dans les « listicles » et comparatifs anglophones.
    Comme beaucoup de fan-outs ressemblent à des requêtes du type « best X brands », « top Y tools », être mentionné dans des listes et articles comparatifs en anglais devient un levier très concret de visibilité.
  • Mesurer en continu sa visibilité dans les IA de recherche.
    Peec AI met en avant la nécessité de suivre l’évolution de sa présence dans les réponses des assistants (ChatGPT, Perplexity, Claude, Gemini), pour détecter les lacunes et prioriser les contenus à créer ou à adapter.

L’idée centrale : il ne s’agit plus seulement de faire du SEO pour Google dans sa langue, mais aussi de penser à la place de la marque dans l’écosystème d’IA qui, lui, fonctionne en grande partie en anglais.

Un problème structurel qui ne disparaîtra pas tout seul

L’étude de Peec AI et les reprises par Search Engine Journal ou d’autres observateurs dressent un constat sans ambigüité : les grands modèles d’IA, conçus et entraînés principalement aux États-Unis, produisent un biais systémique en faveur de l’anglais et des marques globales. Ce n’est pas présenté comme une volonté de nuire, mais comme la conséquence combinée de la dominance de l’anglais sur le web, des signaux d’autorité utilisés et des choix implicites dans la manière dont les fan-outs sont générés.

Pour Peec AI, le véritable correctif passe par un investissement massif dans des modèles multilingues pensés dès le départ pour servir équitablement les marchés européens, latino-américains, asiatiques ou africains, avec des corpus, des signaux et des logiques de recherche centrés sur leurs langues et leurs contextes.

En attendant, les entreprises des marchés non anglophones doivent accepter cette réalité : pour ne pas rester invisibles dans les réponses des IA, elles doivent comprendre ce biais, suivre leur visibilité et adapter de façon stratégique une partie de leur contenu et de leurs relations média à l’écosystème anglophone.