Comme je l’ai évoqué dans un billet précédent , cet été j’ai rédigé des articles rémunérés pour “Wikio expert” ( MAJ Nov 2012 : Wikio exper...
Comme je l’ai évoqué dans un billet précédent, cet été j’ai rédigé des articles rémunérés pour “Wikio expert” (MAJ Nov 2012 : Wikio expert n’existe plus). Ce qui était marrant c’est qu’ils proposaient de rédiger des articles dans la catégorie “high tech” sur des services ou des sites internet qui n’existaient même plus. No comment…
En tout cas, l’intérêt que j’avais à faire des revues de sites internet c’est que c’était facile et rapide à rédiger et donc rentable en terme de ratio “temps de rédaction/rémunération”. Par contre , quand le site n’existait plus c’était plus compliqué mais pas impossible. En effet il existe un service d’archive du web qui comme son nom l’indique archive les pages internet et permet de les retrouver telles qu’elles étaient à une date antérieure (enfin je crois que l’on ne peut pas remonter avant 1996).
Le service en question est waybackmachine. Vous tapez l’URL qui vous intéresse dans le champs de recherche et vous sélectionnez ensuite la date que vous souhaitez dans un calendrier. Bon parfois ça plante et on a un message du style :
Mais la plupart du temps cela fonctionne bien! Voici une copie d’écran de l’apparence de mon blog au 31 mars 2011 par exemple :
Voila, plus besoin de Delorean ni de physicien fou pour remonter le temps ;-)
Je testerais mais il existait aussi archives web .org ( me souviens plus de l'adresse exacte). Waybackmachine est il mieux ?
RépondreSupprimer@fos24
Waouh ! Ce que je cherchais, et on peut récupérer le code du site ? Hein ? J'en demande trop ?
RépondreSupprimerEn tout cas, je m'en vais de ce pas tester ça !
La wayback machine est un super outil, bien pratique comme tu le dis pour retrouver des pages du début du web. Allez jeter un coup d'oeil sur voila.fr par exemple, ça vaut le détour. Par contre, le seul souci, c'est qu'il y a beaucoup de sites qui ont interdit au crawler de passer via le robots.txt :
RépondreSupprimerUser-agent: ia_archiver
Disallow: /
Par exemple, yahoo.fr. M'enfin, y'a déjà de quoi s'amuser !
Il y a aussi le cache de Google (dans la barre de recherche, taper cache: devant l'URL du site désiré). Mais pas que :
RépondreSupprimerFirefox possède d'ailleurs un extension pour chercher dans le cache de ces sites, en cas de page non trouvée : Resurrect Pages. Qui propose le cache de Google, celui de Bing et de Yahoo!, ainsi que coralcdn.org, www.archive.org, www.gigablast.com et webcitation.org