> > Il est frais mon spider, il est frais !

Il est frais mon spider, il est frais !



 
Il est frais mon spider, il est frais !
Notez cet article

Vous le savez certainement, Google affiche parfois dans ses résultats une date à droite de l'url de la page proposée. En règle générale, cette date correspond au jour de dernière indexation du document par Googlebot, le robot de Google et n'est affichée que si elle est récente. Jusqu'à maintenant, elle était proposée la plupart du temps avec 48h de retard. En d'autres termes, si on était le 15 mai, la date affichée était le plus souvent celle du 13 mai. Il y avait 2 jours de décalage entre cette date et le jour en cours, ce qui correspondait certainement à un temps de traitement entre la découverte par le spider du document et sa disponibilité dans l'index du moteur.

Or, depuis quelques temps, je voyais des résultats gratifié d'une date correspondant à la veille, avec donc un décalage d'un jour seulement... Je me disais que Google faisait un effort sur la "fraîcheur" des informations qu'il crawle. Et puis, ce matin, 17 juillet 2007, le résultat sur la page d'accueil de mon site, est indiqué avec une date d'indexation au... 17 juillet 2007 !

Qu'est-ce à dire ? Plusieurs interprétations sont possibles à mon avis :

- Google fait un gros effort actuellement de façon générale pour indexer plus rapidement les pages web.

- La page d'accueil du site Abondance.com ayant été quelque peu remaniée cette semaine, Googlebot revient plus souvent pendant quelques jours car il a détecté une "rupture" sur la "vie normale" de cette page et veut comprendre ce qu'il se passe.

- Un bug, toujours possible. En effet, la version en cache de la page indique : "Voici la version Google de la page mise en cache de http://www.abondance.com/ extraite le 16 juil 2007 07:22:22 GMT". La date n'est donc plus ici au 17, mais au 16 juillet matin... Difficile à comrpendre, alors, d'où sort la date du 17 juillet affichée dans les résultats.

Quoi qu'il en soit, c'est un "phénomène" à observer de plus près dans les jours qui viennent...
Je vous tiens au courant si je vois cette date fluctuer à l'avenir, mais si vous avez des idées, je suis preneur...

Commentaires : 11
  1. Anonymous 17 juillet 2007 at 13 h 50 min

    Il même très frais le spider. Je viens de mettre il y a deux heures un article sur un blog, et l'article est déjà indexé dans Google. Le blog en question n'a qu'une vingtaine d'articles et Google ne les indexait que sous 1 ou 2 jours. Là ça a été d'une rapidité fulgurante. J'ai fait le test avec d'autres blog et ça marche aussi.

  2. Thibault 18 juillet 2007 at 5 h 54 min

    Google semble avoir introduit ces derniers jours une dose de son Universal Search en France : ainsi, les blogs par exemple sont indexés en quasi temps réel par les spiders de Google Blog Search et apparaissent dans les résultats de recherche globaux avec une excellente fraîcheur.

    Par ailleurs, Google continue d'investir massivement dans de nouveaux datacenters, officiellement pour diminuer le temps de réponse des requêtes, mais beaucoup plus probablement pour améliorer encore plus la fraîcheur de ses résultats en multipliant le nombre de spiders actifs.

  3. Aurélien 18 juillet 2007 at 17 h 02 min

    Bonjour,

    J'ai fais la même constatation hier et tenté de faire croire à un ami que j'avais accès à "l'admin de Google" 🙂

  4. DavidD [1ère Position] 18 juillet 2007 at 23 h 45 min

    Bonjour,

    Je confirme également et je trouve vraiment incroyable, mais vrai !

    Récemment un copain me disait que Google était maintenant capable de recalculer en 14 minutes le ranking de l'ensemble de son index.

    J'espère que l’arrivé du temps réel dans les SERPs permettra, une bonne fois pour toute, d’enterrer et d’arrêter l'absurdité et le mensonge marketing des garanties de positions 😉

    Demain ce sont des pages de résultats propres à nos besoins, nos envies, nos humeurs, et toutes différentes, avec des positions différentes par profil et fluctuants selon le contexte et l'environnement de la recherche.

    C'est donc plutôt une très bonne nouvelles pour nos clients, car cela signifie aussi des résultats plus rapides, incite nos clients à bloggeur pour partager plus de contenus pertinents et finalement je pense même que cela peut limiter le spam en augmentant le coût notamment humains des spammeurs pour réussir à contrer les analyses comportementales de Google dorénavant en temps réel !

    Google et le SEO a encore de beaux jours et de nouveaux challenge à relever 🙂

  5. Régis'blog 19 juillet 2007 at 8 h 42 min

    J'avais constaté, il y a quelques temps une accélération de l'indexation... mais là, c'est vraiment très rapide !

  6. David Eichholtzer 19 juillet 2007 at 10 h 13 min

    Je constate cela depuis plusieurs semaines également notamment avec l'un de mes clients e-commerçants.

    A plusieurs reprises, nous avons mis en ligne de nouvelles pages optimisées ou des pages modifiées le matin et l'après midi elles étaient présentes dans l'index de Google, mieux elles étaient déjà positionnées !
    J'ai néanmoins remarqué (confirmez vous ?) que dans ce cas d'indexation très rapide (ou en temps réel pour cité David D.), Google ne propose pas de version "cache", l'onglet "cache" disparaît.

    C'est une nouvelle importante pour la qualité des résultats d'une part mais surtout imaginez-vous l'impact pour un e-commerçant, cela agit directement sur le CA de l'annonceur... ce n'est pas rien ! ça donne des idées qui vont au delà de ce que l'on pouvait imaginer dans le projet de référencement jusque là. Cela touche directement l'organisation interne..., plus vite on prend une décision / la mise en ligne de produits, plus vite on peut en percevoir les résultats... La place du référenceur est primordiale et se renforce dans l'organisation interne.

    Le référencement n'a en effet pas fini d'évoluer et c'est tellement passionnant !

    David E.

  7. Maurice 19 juillet 2007 at 14 h 23 min

    tous ces sites ont ils une balise meta du type :

    meta name="date-revision-yyyymmdd" par exemple ?

    tous ces sites ont il un système d'affichage de la date du jour sur leurs pages en java ou pas ?

    Sachant qu' à 15 Heures en France il est neuf heures aux Etats Unis et précisément à New York, donc prise de service des salariés et lancement des indexations manuelles des intervenants Google, n'y a t il des lors pas un rapprochement à faire entre une page modifiées le matin et affichées avec la bonne date l'aprés midi ?

    Ce phénomêne existe, semble-t-il depuis plusieurs années sous réserve de contre information.

    amicalement Maurice

  8. Kilroy 21 juillet 2007 at 17 h 54 min

    A mon avis, les cas d'indexation express sont limités. Seuls certains sites peu nombreux et très populaires en bénéficient.
    Les tests que j'ai pratiqués sur un site montrent que Google est plutôt moins rapide que Yahoo et MSN pour rafraîchir les pages ou en prendre en compte de nouvelles.
    Même si le PR des sites n'est pas le seul facteur, il doit quand même pas mal jouer.

  9. DavidD [1ère Position] 26 juillet 2007 at 9 h 55 min

    Une précision importante : pour réaliser les tests j'ai utilisé un site dont le nom de domaine à moins de 2 mois et le site de test n'a pas encore de PR (barre grisée) !

    Le site utilisé pour le test : http://www.passion-radio.org/

  10. denichetout 12 septembre 2007 at 6 h 44 min

    Bonjour,

    Que dois je penser de mon agence de referencement qui m'avait projeté des résultats entre deux et six mois pour mon site http://www.chouett-vacances.com
    Merci d'avance...

  11. Abondance 12 septembre 2007 at 7 h 11 min

    Bonjour
    Euh, qu'entendez-vous par "projeté des résultats entre deux et six mois" ??
    Merci pour cette précision.
    Cordialement

Un site du Réseau Abondance | Olivier Andrieu | Contact | Publicité sur le site