Depuis de très nombreuses années et quasiment depuis que les moteurs de recherche existent, je lis des études menées sur une donnée très répandue, à savoir le nombre de résultats retournés par les moteurs de recherche.

En effet, lorsque vous saisissez une requête dans le formulaire de recherche d'un moteur, ce dernier vous indique, sur sa page de résultats, le nombre de documents qui répondent à cette demande. Or, historiquement, il a le plus souvent été admis que cette indication n'était fournie que de façon approximative (notez, d'ailleurs, le "environ" utilisé par Google et Yahoo!) et, il faut bien le dire, parfois très farfelue...

Cette raison fait qu'il me semble réellement difficile de se baser sur cette donnée pour mettre en place des études savantes la prenant en compte, car ces travaux seraient immanquablement bâtis sur du sable, les informations de départ n'étant pas fiables. Je me souviens même d'une époque où le nombre retourné par un moteur de recherche majeur (mais dont l'aura a quelque peu décliné depuis) était à la limite de l'aléatoirité... Nous n'en sommes, heureusement, plus là aujourd'hui, ceci dit, on cotoie parfois quand même le "grand n'importe quoi" sur la plupart des moteurs actuels à ce sujet (même si certains semblent plus fiables que d'autres)...

Ce qui me gène, c'est que je ne comprends pas pourquoi les moteurs ne fournissent pas une donnée exacte... Bien sûr, certains argumenteront sur le fait que la plupart des moteurs limitent le nombre maximal de résultats affichés (1 000 pour Google) pour une requête donnée et que, après tout, si ce nombre global est de 6 ou 7 millions, quelle importance cela peut-il avoir, puisqu'on ne peut pas voir tous résultats ? Certes, mais est-ce une raison pour ne pas bien faire son travail ?

Cette approximation peut, à mon avis, venir de deux raisons fondamentales :
- Des raisons techniques, les moteurs préférant garder de la "charge machine" pour d'autres tâches plus importantes. Si cet argument tient pour des requêtes complexes, contenant de nombreux mots clés ou utilisant une syntaxe avancée (site:, link:, etc.), le fonctionnement interne d'un moteur de recherche, sur la base d'index inversés*, devrait faire en sorte que sur des mots clés génériques, ou sur des requêtes à un seul terme, un nombre exact de résultats devrait être disponible "sans effort". Ce qui n'est pas le cas.
- Des raisons concurrentielles, les moteurs fournissant un nombre de résultats supérieur à celui de leurs concurrents, sur la base d'un benchmark effectué au préalable. La course au plus gros index peut rendre fou 🙂 Peu probable, mais après tout, pourquoi pas ?

Bref, l'inexactitude parfois flagrante de cette donnée retournée par les moteurs de recherche reste un mystère pour moi. Pourquoi oeuvrer à une pertinence toujours meilleure et, en même temps, retourner une info parfois très éloignée de la vérité en ce qui concerne le nombre de résultats identifiés ? Si quelqu'un peut m'aider dans mes réflexions, je suis preneur... 🙂

* Les abonnés à la lettre "Recherche & Référencement" du site Abondance pourront se référer à l'article "Comment fonctionne un moteur de recherche ?" du mois de mars 2005 à ce sujet.