spider indexation

Information étonnante de la part de John Mueller la semaine dernière : Google pourrait ne plus indexer un contenu 'potentiellement visible' (accessible suite à un clic : onglets, listes déroulantes, etc.) et se limiter à celui visible 'par défaut' sur une page web. Décision valable de la part du moteur de recherche ou aveu d'impuissance face au spam ?...

Google demande, dans ses recommandations techniques aux webmasters, à ne pas cacher un texte aux internautes tout en le montrant aux moteurs de recherche. Cette notion de "texte caché", était la base des techniques "black hat" de la préhistoire (on se souvient du "texte en blanc sur fond blanc", ou dans des balises "noscript" ou ailleurs, il y a plus de 10 ans de cela, permettant d'indiquer du texte dans le code HTML, mais non visible dans un navigateur).

Jusqu'à maintenant, le texte "potentiellement visible", c'est-à-dire affiché suite à un clic de l'internaute (contenu déroulant, onglet, etc.) était tout à fait admis par le moteur de recherche. Exemple sur l'aide en ligne de Google avec ce choix :

texte-non-visible-1

Source de l'image : Abondance

Qui se déroule lorsqu'on clique sur le signe "+" ou la ligne choisie :

texte-non-visible-2

Source de l'image : Abondance

Ou encore un jeu d'onglets qui affiche le premier par défaut, comme ici sur le site God Save The Kids :

texte-non-visible-3

Source de l'image : Abondance

Un clic sur un autre onglet affichant son contenu (le contenu des trois onglets se trouvant dans le même code HTML) :

texte-non-visible-4

Source de l'image : Abondance

Tout cela était donc, jusqu'à maintenant, tout à fait "licite" selon Google. Jusqu'à maintenant... Car il semblerait que, selon John Mueller, qui a évoqué ce fait dans un récent Hangout (voir ci-dessous à partir de la minute 52), ce type de contenu "potentiellement visible" ne serait plus indexé par le moteur de recherche. Selon lui, "si un contenu est important pour vos visiteurs, il doit être visible sur la page sans nécessiter une action supplémentaire. Vous pouvez aussi créer un lien vers une autre page, dans laquelle ce contenu sera visible !"

Cette communication est étonnante et, surtout, aberrante. Que des sites soient pénalisés pour abus dans le fait de cacher certains contenus "non avouables" à des fins de spam du moteur, on peut le comprendre aisément. C'est même tout à fait normal. Mais, dans 99% des cas, ces systèmes sont là pour apporter une meilleure expérience utilisateur (ce qui est, nous semblait-il jusqu'à maintenant, l'un des objectifs de Google, non ?). L'argument de Google est le suivant : "nous ne désirons pas renvoyer l'internaute vers une page où il ne trouvera pas le texte recherché sans cliquer ou effectuer une action précise".

L'argument est certes recevable, mais est-ce une raison valable pour ne plus indexer des tonnes de contenus très pertinents ? N'est-ce pas, une fois de plus, un aveu de faiblesse de la part de Google face au spam de son moteur de recherche ? Ne pas indexer un contenu plutôt que de lutter de façon efficace contre les mauvaises pratiques de certains, n'est-ce pas là un véritable aveu d'impuissance ?



Source de l'image : YouTube