
Toute personne qui s'intéresse de près ou de loin au SEO (et pas seulement) a certainement, un jour ou l'autre, utilisé la Wayback Machine ou Archive.org, qui sauvegarde des milliards de pages web depuis plus de 25 ans. Mais connaissez-vous toutes les fonctionnalités de cet outil et les différentes façons de s'en servir ? Voici un guide des différents trucs et astuces pour garder la mémoire alerte...
La WayBack machine est un excellent outil pour retrouver des contenus perdus ou d’anciennes versions de ces derniers. On peut aussi facilement l’utiliser dans une optique de veille concurrentielle ou de monitoring. Mais comment et quand l’utiliser dans nos actions de référencement naturel ? Voici un guide des différents atouts de cet outil Open Source.
Qu’est-ce que la WayBack Machine ?
La WayBack Machine est un organisme à but non lucratif ayant pour objectif de constituer la plus grande archive mondiale des contenus du Web. Depuis 1996, ils sauvegardent des millions de contenus textes, mais aussi des livres, des vidéos ou encore des fichiers audio.
Ainsi, à n’importe quel moment, vous pouvez demander à l’outil de vous donner les différentes sauvegardes d’une URL précise. Vous aurez alors un historique de différentes versions disponibles, le tout accessible avec un simple clic sur la partie calendrier.
Dans l’exemple ci-dessous, on demande ainsi les différentes sauvegardes de la page d’accueil du site SeoMix.fr. On voit alors la première sauvegarde fin 2009, et l’on ensuite accès à 660 versions du contenu concerné.

Un exemple des sauvegardes disponibles pour la page d’accueil de SeoMix.fr
Lorsque vous cliquez sur l’un des liens dans le calendrier, vous afficherez alors la sauvegarde du contenu concerné :

Un exemple de sauvegarde au 01 Janvier 2021
Un outil faillible
Gardez en tête que cet outil peut être très utile, mais qu’il n’est pas fiable à 100%, loin de là. Et il n’est pas forcément exhaustif sur la liste complète de vos URL. En effet, cet outil n’archive pas 100% des pages, et ne va pas archiver tous les changements survenus dans vos contenus. Certaines URL seront ainsi sauvegardées régulièrement, d’autres quasiment jamais.
...
[Cet article est disponible sous sa forme complète pour les abonnés du site Réacteur. Pour en savoir plus : https://www.reacteur.com/2022/01/comment-utiliser-la-wayback-machine-en-seo.html]

Un article écrit par Daniel Roch, consultant WordPress, Référencement et Webmarketing chez SeoMix.
Le contenu de ces pages tombées dans l’oubli sont réutilisables du coup ?
Si on utilise du contenu trouvé sur le wayback machine et que l’on s’en sert pour son propre site web. Est ce considéré comme du duplicate content ?
Si ce contenu est indexé, oui.
Cela fait quelques années maintenant que j’utilise WayBack et dernièrement pour récupérer le site d’un client qui avait omis de renouveler son ndd et qui a perdu tout le contenu de son site finalement. J’ai pu ainsi retrouver les éléments textes et photos pour refaire son site à l’identique, encore un client heureux ! 😉
Merci pour cet article
Guy LINIER
Directeur Agence Arkenciel