Google a lancé le site Under The Hood ("sous le capot"), qui propose de nombreuses informations sur la façon dont le moteur de recherche et son algorithme de pertinence fonctionnent...

Google propose le site Under the hood (que l'on peut traduire par "sous le capot") qui a pour ambition de fournir des informations plus précises (sans, bien sûr, révéler la recette de la "potion magique") sur le moteur de recherche, son algorithme de pertinence et ses changements de critères et signaux utilisés au quotidien.

Pour l'anecdote, le site indique quelques chiffres et statistiques assez étonnants sur son moteur :

- La gestion/maintenance de l'index du moteur demande 1 million d'heures de calcul !

- Google répond à plus d'1 milliard de requêtes chaque jour.

- Depuis 2003, le moteur a répondu à 450 milliards de requêtes nouvelles (qui n'avaient jamais été demandées auparavant).

- Plus de 1 000 années/homme ont été nécessaires pour développer l'algorithme de pertinence du moteur.

- 20% des requêtes envoyées par les internautes sur Google sont nouvelles (elles n'ont jamais été demandées auparavant) chaque jour.

- Le trajet entre la requête saisie et l'obtention de la réponse (en transitant via les serveurs de Google) est d'environ 1 500 miles (2 414 kilomètres).

- L'index Caffeine contient plus de 100 millions de Gigaoctets.

Le site Under the hood propose également des expérimentations en cours sur le moteur, ainsi qu'une vidéo qui explique le processus de tests et d'expérimentation des nouveautés au travers des "quality raters" et d'un système de "sandbox" de test. En 2010, Google a lancé plus de 20 000 test de cette façon, expliquée ici :


Source de l'image : Google