En plus de ses 22 millions de fichiers PDF, Google vient d'annoncer qu'il indexait dorénavant les fichiers Word (.doc), Excel (.xls), Powerpoint (.ppt), Rich Text Format (.RTF) et PostScript (.ps). Google est le premier moteur de recherche majeur à prendre en compte ce type de fichiers, la plupart des moteurs se contentant d'indexer jusqu'à maintenant uniquement des fichiers HTML statiques ou dynamiques. Google renforce ainsi encore un peu plus son image d'outil de recherche innovant. Ceci dit, la masse de documents à ces nouveaux formats étant assez importante sur l'Internet, il risque de se poser pour le moteur un problème de masse critique à un moment ou à un autre. Et on peut penser qu'il faudra bien, très rapidement, penser non plus en termes quantitatifs mais plutôt qualitatif ("documents utiles" plutôt que "documents lambda") sous peine d'être noyé par le nombre de résultats pour un mot clé donné....
http://www.google.com/
Source : SearchEngineWatch