Fuite du système de Claude 4 : comment l’IA choisit ce qu’elle montre (ou pas)

Johan Sellitto / 02 Juin 2025 à 15h02

Temps de lecture : 7 minutes

Partagez l'article

Un document interne massif de Claude 4, l’assistant IA d’Anthropic, a fuité sur le réseau social X, dévoilant les coulisses de son fonctionnement. À la clé : une meilleure compréhension de ses critères de recherche, de citation et de lien, un enjeu central pour les professionnels du SEO, mais aussi pour quiconque veut comprendre comment les IA redessinent l’accès à l’information.

Ce qu'il faut retenir :

Claude ne cherche sur le web que s’il ne connaît pas la réponse. Si la réponse est dans sa mémoire, il ne consulte aucun site, et donc ne génère aucun lien cliquable.
Les sites ne sont cités que dans deux cas : faits récents ou requêtes complexes. Les contenus intemporels ne déclenchent aucune recherche.
Pour être visible, un contenu doit être unique, structuré et difficile à paraphraser. Les outils interactifs, les bases de données ou les analyses originales ont le plus de chances d’être cités.
Claude privilégie la correspondance exacte entre le contenu de la page et la requête de l’utilisateur

Une fuite rare qui ouvre la boîte noire de l’IA

C’est un fichier de plus de 60 000 caractères qui a fuité le 22 mai 2025, publié par le compte @elder_plinius sur X. Il s’agit du prompt système complet de Claude Sonnet 4, une des versions du modèle Claude 4 développé par Anthropic, concurrent d’OpenAI. Ce prompt, sorte de mode d’emploi interne dictant le comportement de l’IA, dévoile en détail comment Claude traite les requêtes des utilisateurs, décide de faire appel (ou non) à un moteur de recherche, et choisit s’il faut ou non mentionner ou lier une source.

Un comportement de recherche structuré par cas d’usage

Le document révèle que Claude ne dispose pas d’un index de sites web à l’image de Google. Il fonctionne à partir de sa mémoire entraînée jusqu’à janvier 2025. Il génère des liens uniquement lorsqu’il utilise un outil externe de recherche (comme un moteur web), et cela ne se produit que dans des cas bien précisément définis, divisés en quatre catégories :

never_search : Claude ne cherche jamais pour les faits stables (ex. : « Quelle est la capitale de la France ? »). Il répond directement, sans citation ni lien.
do_not_search_but_offer : Claude connaît la réponse, mais l’information peut avoir évolué (ex. : « Population de l’Allemagne ? »). Il répond d’abord, puis propose de chercher si besoin.
single_search : Faits récents ou actualité (ex. : « Qui a gagné le match hier ? »). Claude lance une seule recherche et fournit un lien.
research : Requêtes complexes, comparatives ou stratégiques (ex. : « Analyse concurrentielle du produit X »). Claude lance entre 2 et 20 recherches et synthétise les résultats.

C’est seulement dans les cas 3 et 4 que les contenus web ont une chance d’être vus, cités et liés.

🌊 SYSTEM PROMPT LEAK 🌊

Just WOW...Claude 4 has one helluva prompt! An absolute behemoth weighing in at over 60,000 characters 🤯

Obviously not going to fit in an X post, so I'll post as much as will fit here and then a link to the full thing on GitHub below. Enjoy!

PROMPT:…
— Pliny the Liberator 🐉󠅫󠄼󠄿󠅆󠄵󠄐󠅀󠄼󠄹󠄾󠅉󠅭 (@elder_plinius) May 22, 2025

Un peu plus d’infos sur la gestion des liens dans Claude

Contrairement aux moteurs de recherche classiques, Claude ne génère donc pas de liens systématiquement. Même lorsqu’il effectue une recherche web, il ne cite une source que si cela est strictement nécessaire.

Voici les éléments clés à connaître :

Pas de lien si Claude peut répondre seul : Si l’IA dispose déjà de l’information en mémoire, elle répond directement, sans chercher et sans citer. Même si elle fait une recherche, elle ne met un lien que si l’information ne peut pas être paraphrasée sans perte.
La pertinence prime sur la notoriété : Claude ne privilégie pas les grands noms par défaut. Ce qui compte, c’est la correspondance exacte entre le contenu de la page et la requête de l’utilisateur, ainsi que la clarté de la structure. Un site de niche bien rédigé peut l’emporter sur un média d’envergure.
Les contenus trop génériques sont ignorés : Claude évite les pages vagues, sur-optimisées ou mal structurées. Pour être « citables », les contenus doivent être concise, structurés, modulaires, avec des données concrètes, des outils interactifs ou des analyses originales.
Le lien, comme marque d’irréductibilité : Si Claude peut résumer ou reformuler un contenu, il ne cite pas la source. Le lien n’apparaît que si l’original apporte une valeur ajoutée impossible à reproduire autrement. C’est un filtre puissant et une opportunité pour les créateurs de contenu qui parviennent à se différencier !

L’impact pour le SEO : priorité au contenu difficile à résumer

Pour espérer être mentionné ou lié, un site doit proposer quelque chose que Claude ne peut pas « reconstruire » de mémoire ou paraphraser facilement. Cela inclut :

Des outils interactifs (simulateurs, calculateurs, etc.) ;
Des données actualisées (tableaux de prix, comparateurs) ;
Des avis individuels ou du contenu localisé ;
Des analyses originales ou des approches éditoriales avec valeur ajoutée.

À l’inverse, les articles généralistes ou les pages optimisées pour des mots-clés génériques risquent de rester invisibles dans un monde où l’IA est l’intermédiaire principal de l’information.

Claude, ChatGPT et Gemini : mêmes logiques, nuances d’usage

Même si le document porte sur Claude, les mécanismes décrits s’appliquent en grande partie à d’autres IA comme ChatGPT (OpenAI) ou Gemini (Google). Elles partagent trois grandes caractéristiques :

Elles ne créent pas de liens si la réponse est déjà connue.
Elles ne stockent pas d’URLs de manière exploitable comme pour le moteur de recherche Google.
Elles favorisent les contenus structurés, clairs et synthétiques, bien plus que les longues pages SEO.

Avec la montée en puissance des interfaces conversationnelles, le SEO traditionnel centré sur le mot-clé cède sa place à une nouvelle discipline : l’optimisation pour l’IA générative. Il ne suffit plus d’être bien positionné, il faut désormais être citable et aligné sur les logiques internes du modèle.

Une IA formatée pour protéger l’utilisateur… et les ayants droit

Le prompt dévoilé insiste également sur les restrictions de Claude :

Il ne peut pas reproduire plus de 20 mots consécutifs d’une source externe.
Il paraphrase ou résume toujours les contenus pour éviter toute violation de droit d’auteur.
Il filtre les demandes jugées dangereuses, illégales ou nuisibles (ex. : fabrication d’armes, logiciels malveillants, etc.).

Il agit aussi selon des règles strictes de ton : jamais de flatterie, un style empathique mais sobre, et une préférence pour le format paragraphe sans listes en dehors des cas techniques.

1 Commentaire

Thibault sur 3 juin 2025 à 14 h 08 min

Merci pour ce récap. Dans le cas des « do_not_search_but_offer », je pense que si on demande à Claude d’approfondir la recherche, sa réponse comportera des sources et donc des liens. Par conséquent, hormis dans le cas des « never search », les LLM auront quand même tendance à citer leurs sources.
Cette manière de classifier les questions rappelle ce que l’on peut lire dans les guidelines des quality raters de Google, les « never search » ressemblent fortement aux Know Simple Query par exemple. On n’est pas trop dépaysés en tant que SEO c’est bien lol
Réponse

Laisser un commentaire Annuler la réponse

Fuite du système de Claude 4 : comment l’IA choisit ce qu’elle montre (ou pas)

Ce qu'il faut retenir :

Une fuite rare qui ouvre la boîte noire de l’IA

Un comportement de recherche structuré par cas d’usage

Un peu plus d’infos sur la gestion des liens dans Claude

L’impact pour le SEO : priorité au contenu difficile à résumer

Claude, ChatGPT et Gemini : mêmes logiques, nuances d’usage

Une IA formatée pour protéger l’utilisateur… et les ayants droit

Articles complémentaires :

Claude 4 : la nouvelle version qui redéfinit les limites du codage et de l’autonomie

Claude (Anthropic) intègre la recherche web… mais pas avec Google

Claude AI va bientôt parler. Voici pourquoi les SEO doivent écouter !

Claude pense-t-il vraiment ? Ce que nous révèle le « microscope » d’Anthropic

Une fuite révèle le vrai plan d’OpenAI : mettre ChatGPT au cœur de votre vie numérique

L’IA va-t-elle remplacer le SEO ? Google répond et nuance le débat