Google a lancé le site Under The Hood ("sous le capot"), qui propose de nombreuses informations sur la façon dont le moteur de recherche et son algorithme de pertinence fonctionnent...
Google propose le site Under the hood (que l'on peut traduire par "sous le capot") qui a pour ambition de fournir des informations plus précises (sans, bien sûr, révéler la recette de la "potion magique") sur le moteur de recherche, son algorithme de pertinence et ses changements de critères et signaux utilisés au quotidien.
Pour l'anecdote, le site indique quelques chiffres et statistiques assez étonnants sur son moteur :
- La gestion/maintenance de l'index du moteur demande 1 million d'heures de calcul !
- Google répond à plus d'1 milliard de requêtes chaque jour.
- Depuis 2003, le moteur a répondu à 450 milliards de requêtes nouvelles (qui n'avaient jamais été demandées auparavant).
- Plus de 1 000 années/homme ont été nécessaires pour développer l'algorithme de pertinence du moteur.
- 20% des requêtes envoyées par les internautes sur Google sont nouvelles (elles n'ont jamais été demandées auparavant) chaque jour.
- Le trajet entre la requête saisie et l'obtention de la réponse (en transitant via les serveurs de Google) est d'environ 1 500 miles (2 414 kilomètres).
- L'index Caffeine contient plus de 100 millions de Gigaoctets.
Le site Under the hood propose également des expérimentations en cours sur le moteur, ainsi qu'une vidéo qui explique le processus de tests et d'expérimentation des nouveautés au travers des "quality raters" et d'un système de "sandbox" de test. En 2010, Google a lancé plus de 20 000 test de cette façon, expliquée ici :
Source de l'image : Google |
@TomHtml : la meilleure source, la plus fiable, est celle qui cite… ses sources 🙂
Bonne journée !
a+
Daniel, j'estime être une source sufisamment fiable, mais pour satisfaire ta curiosité voici la source officielle : http://www.google.com/ads/answers/numbers.html : "We've never seen 16% of the queries we see every day.".
Ouais bref, aucune source donc aucun intérêt…
Ça a été lancé le même jour que "Inside Search" et "Google Search by Image" http://googleblog.blogspot.com/2011/06/go-inside-search-to-get-most-out-of.html (une recherche google sufisait à retrouver l'article…)
Quant aux chiffres, là tout de suite je n'ai plus la source sous les yeux mais je l'avais posté sur Twitter : https://twitter.com/#!/Zorgloob/status/120829190546268160
Ouf 20% >>> 16 % , ça commence à baisser.
Perso, je suis tout prêt à croire @TomHtml sur parole.
Mais bien sur, en bon veilleur, je préfère qu'il me dise où il a trouvé ça 😉
David @SEOEuro
Bon ce serait sympa que TomHtml donne ses sources sinon à quoi ça sert de balancer des chiffres sortis de n'importe où dans les coms des blogs ? Nul…
Bonjour
Oui ça m'interesse aussi de savoir la source de chiffre de 16%. Merci à TomHtml de bien vouloir faire passer l'info ici !
a+
@Bmoinet : ahhhh ma dyslexie du clavier, grrr… Merci de l'avoir signalé, c'est corrigé 🙂
cdt
Petite faute d'orthographe (j'ai cru à un verbe que je ne connaissais pas sur le coup ;o) : préondu => répondu
@ TOMHTML : intéressant mais ça aurait été encore plus intéressant de citer la source de tes infos 🙂
Cette page date de juin dernier. Les chiffres ne sont même plus à jour : le nombre de requêtes inédites au quotidien est passé de 20% à 16% depuis.
des statistiques assez étonnants par Google ! le chiffre de 20% montre que les internautes aussi pousse google a changer son algorithme plusieurs fois afin de suivre les changement des requêtes des internautes.
Informations statistiques intéressantes qui peuvent nous donner des idées sur nos stratégies de référencement… Surtout si les comportement des internautes sont aussi surprenant :
– 20% des requêtes envoyées par les internautes sur Google sont nouvelles (elles n'ont jamais été demandées auparavant) chaque jour.