Quelques infos sur Google (et Bing parfois) et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec au programme cette semaine quelques réponses à ces angoissantes questions : Peut-on faire plusieurs demande de réexamen à la suite lors d'une action manuelle ? Googlebot tente-t-il encore de remplir des formulaires sur un site web ? Que se passe-t-il lorsqu'un site web tombe en panne pendant plusieurs jours ? Que faire si on détecte beaucoup de Soft 404 dans la Search Console ?

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, forums, conférences, etc.). Donc "gossips" (rumeur) + Google = "Goossips" 🙂

La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

 
Demande de Réexamen
Lorsqu'un site a été la cible d'une action manuelle de la part de Google, John Mueller a indiqué sur Twitter qu'il n'y avait aucun intérêt à faire plusieurs demandes de réexamen à la suite, tant qu'on n'avait pas reçu la réponse à la première. Lorsqu'une multiple demande de réexamen est effectuée avant de recevoir une réponse, seule la première est gardée, les suivantes sont de toutes façons rejetées automatiquement. Cela ne sert donc à rien de la doubler, tripler ou plus...
Source : Search Engine Roundtable
Taux de fiabilité :
Ça semble effectivement logique comme mode de fonctionnement. Le SEO est une grand école de la patience :-)...
 
Formulaires
John Mueller a expliqué dans un hangout qu'aujourd'hui, il était extrêmement rare que Googlebot tente de remplir et soumettre un formulaire sur un site "pour voir où il va dans ce cas". John a expliqué que si on constate ce type de comportement du robot, c'est qu'a priori, le site a un problème de navigation et de maillage interne à régler...
Source : Search Engine Roundtable
Taux de fiabilité :
John Mueller l'avait déjà dit en 2015. C'était une pratique pus courante il y a de nombreuses années de cela de la part de Googlebot de tenter de remplir et soumettre des formulaires identifiés, mais les sites sont globalement mieux conçus dorénavant et la nécessité de tester les formulaires est moins forte aujourd'hui pour Googlebot...
 
Site HS
John Mueller a expliqué sur Twitter que, si un site web est "down" (HS) suite à une panne, le moteur de recherche testera l'accès à ses pages un certain nombre de fois, puis commencera à désindexer les contenus (page par page et non pas tout le site d'un seul coup) au bout de 2 jours...
Source : Search Engine Roundtable
Taux de fiabilité :
Matt Cutts en avait parlé en 2013 avec la même conclusion. Une panne temporaire (quelques heures) n'a normalement aucun impact sur le moteur. Mais, clairement, au bout de deux jours, certains problèmes peuvent arriver et l'utilisation d'un code 503 avec un champ d'en-tête Retry-After est recommandée. Ceci dit, lorsque le site redémarrera, les pages seront à nouveau crawlées; Mais cela peut à nouveau prendre un peu de temps...
 
Soft 404 et Search Console
John Mueller a expliqué sur Twitter que si, dans la Search Console (rapport "Couverture"), vous avez beaucoup de "Soft 404" (page générant un code 200 mais avec un comportement de 404), c'est que vous avez peut-être un problème de maillage interne avec des liens qui pointent de façon trop importante vers ce type de page...
Source : Search Engine Roundtable
Taux de fiabilité :
Les Soft 404 sont le plus souvent des pages sans intérêt qu'il vaut mieux désindexer, et très souvent des pages sans (ou avec très peu de) contenu textuel. Mais on y trouve aussi, de façon assez étrange, des pages qui ne semble pas avoir de problème spécifique, même si ce n'est pas la majorité, loin de là. Quoi qu'il en soit, une vérification s'impose car, pour un site donné, les Soft 404 correspondent le plus souvent à un type de page bien déterminé (exemple : page de rupture de stock sur un site e-commerce) qu'il faut traiter...

Goossips : Réexamen, Formulaires, Panne et Soft 404
Goossips : Réexamen, Formulaires, Panne et Soft 404. Source de l'image : Google