Quelques infos sur Google (et Bing parfois) et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours. Au programme, cette semaine : le blocage des résultats de recherche internes vides, SafeSearch sur Discover et le nouveau robot GoogleOther.

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, forums, conférences, etc.). Donc « gossips » (rumeur) + Google = « Goossips » 🙂

La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

Bloquer les résultats de recherche internes “No result found”
Sur Reddit, John Mueller a écrit “Si vous ne pouvez pas sélectionner les pages de résultats de recherche internes qui devraient être indexables, vous devriez toutes les bloquer. Utilisez la directive disallow sur le fichier robots.txt ou noindex dans la balise meta robots”.
Source : Search Engine Roundtable
Taux de fiabilité :
Dès 2007, Google a demandé aux éditeurs de site d’empêcher l’indexation des résultats de recherche interne. Effectivement, ce ne sont pas des pages très utiles à crawler pour les robots, il vaut donc mieux les bloquer - ou au moins les résultats de recherche vides.

SafeSearch s’applique à Discover
En réponse au tweet de @lilyraynyc, qui se demandait si les sites avec quelques contenus pour adultes pouvaient être entièrement exclus de Discover, le compte Google SearchLiaison a déclaré : “Il est fort probable que SafeSearch s’applique à Discover, donc oui. Je ferai une mise à jour plus tard si ce n’est pas le cas”. Elle demande ensuite si le formulaire de la page SafeSearch pouvait être utilisé pour y remédier, et voici la réponse de Google : “Si quelqu’un pense que ce contenu ne devrait pas être filtré par SafeSearch, oui ce formulaire peut être utilisé. Mais nos systèmes, dont Discover, n’affichent généralement pas de contenu explicite ou choquant, dans des situations où les utilisateurs ne s’y attendent pas”.
Source : Twitter
Taux de fiabilité :
Il n’y a en effet aucune raison que SafeSearch ne s’applique pas à Discover. On voit mal des contenus pour adultes s’afficher dessus, alors que les utilisateurs n’en recherchent pas spécifiquement.

Le nouveau robot d’exploration GoogleOther
Gary Illyes a déclaré sur LinkedIn qu’un nouveau robot d’exploration, GoogleOther, avait été ajouté à la liste de crawlers qui soulagent Googlebot. Selon lui, ça ne change pas grand chose mais c’est intéressant de le savoir. GoogleOther va notamment s’occuper des crawls R&D, pour libérer plus de capacité de crawl à Googlebot. Il utilise la même infrastructure que Googlebot et a donc les mêmes fonctionnalités et limites. “C’est Googlebot sous un nom différent”, conclut-il.
Source : LinkedIn
Taux de fiabilité :
Le fait que Google ait lancé un nouveau robot ne devrait pas induire de changements. En ce qui concerne l’appellation “crawl R&D”, il ne s’agit pas de recherche et développement. En commentaire, Gary Illyes a expliqué que c’était simplement un crawler à usage général, utilisé pour à peu près tout ce qui nécessite du crawl, sauf la création d’index de recherche Google.