Version mobile, Taille de l'index, Authorship : Quelques infos en direct de Google

Le salon SMX Advanced à Seattle continue de nous distiller quelques infos sur Google : où l'on parle du fonctionnement plus ou moins complémentaire de l'algorithme Web/mobile, de la taille de l'index du moteur et d'un Authorship 'nouvelle vague'...

On sait que le salon SMX Advanced a lieu actuellement à Seattle et, cette année, c'est le googler Gary Illyes (voir photo ci-dessous) qui y distille les informations au sujet du moteur de recherche. Hier, on apprenait que Panda et Penguin ne tournaient pas en temps réel, mais avaient vocation à fonctionner ainsi à terme. Aujourd'hui, trois nouvelles infos ont été "dévoilées" :

- Tout d'abord, le fait que Google utilise souvent les données du site web pour juger la pertinence du site mobile. En clair, imaginons que vous fassiez du "dynamic serving" (même URL pour le site web et le site mobile, mais codes HTML différents). Dans ce cas, pour analyser la pertinence de la page mobile, Google utilisera le contenu de la page web, même s'ils sont (plus ou moins) différents. Ce fonctionnement étrange peut certainement donner des résultats étonnants sur le moteur mobile.

Gary Illyes a d'ailleurs expliqué que les équipes de Mountain View avaient mis en place un système de détection du spam pour vérifier si quelques webmasters ne se servaient pas de cette pratique à des fins malhonnêtes (un contenu de qualité sur le site web et de la vente de viagra sur le site mobile, par exemple). Mais ils ont été très étonné de s'apercevoir finalement que, non, cette pratique n'était pas utilisée (il se pourrait qu'il doivent lancer quelques tests supplémentaires dans les prochaines semaines 🙂 ).

Le googler a indiqué qu'il s'agissait là d'un argument pour créer un index mobile séparé de l'index web, mais que pour l'instant, aucune décision n'avait été prise en interne à ce sujet.

- Gary Illyes a également expliqué que Google connaissait l'existence de 30 000 milliards (30 trillion en anglais) d'URL mais qu'il ne les indexait pas toutes ... Google avait même risqué le nombre de 60 trillion il y a quelques temps. Mais il est clair qu'une énorme majorité de ces URL sont certainement sans intérêt et Google se préoccupe plus d'indexer les pages ayant une réelle pertinence, même minime.

- Enfin, le googler aurait indiqué que, malgré la fin de l'Authorship, Google n'avait pas renoncé à détecter l'auteur d'un contenu sur le Web. Un point qui, aujourd'hui, nous semble évident pour l'avenir du moteur.

gary-illyes-google

Source de l'image : Search Engine Land