Quelques infos sur Google (et Bing parfois) et son moteur de recherche, glanées ici et là de façon officieuse ces derniers jours, avec au programme cette semaine quelques réponses à ces angoissantes questions : Le fait que certaines balises Hn soient doublées (Desktop + Mobile) dans un code source pose-t-il problème ? La pratique du "self-canonical" est-elle recommandée par Google ? Une page peut-elle se positionner uniquement grâce aux attributs Alt de ses images ? Un contenu dans un accordéon ou un onglet peut-il s'afficher dans un featured snippet ? Une URL bloquée par le fichier robots.txt peut-elle impacter le budget crawl du site ?

Voici une petite compilation des informations fournies par les porte-paroles officiels de Google ces derniers jours sur différents réseaux informels (Twitter, Hangouts, Google+, forums, conférences, etc.). Donc "gossips" (rumeur) + Google = "Goossips" 🙂

La communication du moteur de recherche étant parfois plus ou moins sujette à caution, nous indiquons, dans les lignes ci-dessous, le niveau de confiance (taux de fiabilité) que nous accordons à l'information fournie par Google (de 1 à 3 étoiles, 3 étoiles représentant le taux de confiance maximal) - et non pas à la source qui en parle.

 
 Balises Hn doublées
Nous avons remarqué, en analysant certains sites, que certains templates et CMS (notamment lorsqu'on a utilise un "builder") créent des balises Hn en double : une version pour le desktop, l'autre pour le mobile. Nous avons donc posé la question à Vincent Courson pour savoir si cela pouvait poser problème en termes de SEO Il a répondu en indiquant que "ce qui est rendu par Googlebot mobile est ce qui sera indexé. Si c'est en double, ce sera donc compris par le bot mobile, donc intégré. Je ne crois pas que ce soit fait avec visée de faire du spam, donc ça me paraît ok."
Source : Twitter
Taux de fiabilité :
Pas de problème a priori donc, même si on ne peut que conseiller de ne pas avoir à gérer ce type de problème et de ne pas choisir de thèmes, par exemple sur WordPress, qui génère ce type de doublons...
 
Self Canonical
John Mueller a indiqué lors d'un hangout pour webmasters que si la technique de "self canonical" (mettre en place une balise "canonical" vers l'URL de la page elle-même pour éviter le DUST) n'était pas totalement obligatoire, elle pouvait aider Google dans ses analyses. Et que c'était donc une bonne pratique...
Source : Search Engine Journal
Taux de fiabilité :
C'est une pratique que nous encourageons systématiquement : chaque page d'un site web doit avoir une balise "canonical". Si elle est dupliquée, la balise pointe vers l'URL canonique, et si elle est canonique, elle pointe vers elle-même.
 
Attribut Alt
John Mueller a indiqué sur Twitter qu'une page peut tout à fait se positionner sur le moteur de recherche avec un mot clé qui n'est affiché que dans l'attribut Alt d'une image au sein de son code source...
Source : Search Engine Roundtable
Taux de fiabilité :
Sur le principe, oui, bien sûr, puisque le contenu de l'attribut Alt d'une image est un critère de pertinence du moteur. En revanche, il faudra certainement que la requête en question soit sacrément peu concurrentielle pour que cela arrive...
 
Contenu semi-caché et Featured Snippets
John Mueller a expliqué sur Twitter qu'un contenu présent dans un accordéon ou un onglet (et donc potentiellement visible sur action de l'internaute mais caché par défaut) pouvait apparaître en featured snippet (alors que ce n'est a priori pas le cas dans le texte de description de la page dans les SERP). Certains webmasters ont également donné des exemples confirmant ce point...
Source : Search Engine Roundtable
Taux de fiabilité :
Ce n'est cependant clairement pas une bonne pratique que de proposer dans un onglet ou un accordéon un contenu qui a vocation à apparaître dans les featured snippets. Un texte visible par défaut sera toujours préférable...
Robots.txt et Crawl Budget
Gary Illyes a indiqué sur Twitter (et mis à jour un document qu'il a mis en ligne à ce sujet) que le fait d'indiquer une URL dans le fichier robots.txt d'un site web n'affectera pas le budget crawl du moteur pour le site en question...
Source : Search Engine Roundtable
Taux de fiabilité :
Cela semble logique. A partir du moment où une URL est bloquée par le robots.txt, elle ne sera pas crawlée. L'absence d'impact sur le budget crawl est donc cohérent...
Goossips : Balises Hn en Doublon, Self-Canonical, Attribut Alt, Contenu Semi-Caché et Featured Snippets, Robots.txt et Budget Crawl
Goossips : Balises Hn en Doublon, Self-Canonical, Attribut Alt, Contenu Semi-Caché et Featured Snippets, Robots.txt et Budget Crawl. Source : Google