L'info est-elle périmée? Comment identifier la date de publication d'une page web?
L'info est-elle périmée?
Chercher une information à jour sur le web relève parfois du parcours du combattant. Périmés, datés, plus d’actualité les résultats de nos requêtes nous laissent parfois perplexes… Malgré la puissance présumée des algorithmes de recherche, Google et consorts privilégient de temps en temps des contenus super-optimisés (SEO) mais pas toujours pertinents.
Le pire c’est lorsque l’on tombe pour une requête spécifique sur une page intemporelle sans moyen pour identifier sa date de publication. Le contenu semble intéressant mais est-il encore vrai au moment où on le lit?
Dans un tout autre domaine, on peut être amené à rechercher une information sur une entreprise, une personnalité et tomber sur une page intemporelle… Peut-on s’y fier?
Comment identifier la date de publication d'une page web?
Dans ces cas comme dans d’autres il y a plusieurs moyens de déterminer plus ou moins précisément cette date de publication :
- Examiner l'URL
Parfois c’est indiqué dans l’URL. En fonction du paramétrage du CMS qui propulse la page, l’adresse de la page contient parfois le mois et l’année de publication.
C’est le cas pour mon blog par exemple où mes URLs sont sous la forme www.crack-net.com/année/mois/titre.html
C’est le cas pour mon blog par exemple où mes URLs sont sous la forme www.crack-net.com/année/mois/titre.html
- Effectuer une recherche sur Google en filtrant les résultats par date
On peut aussi effectuer une recherche en filtrant les résultats les plus récents (moins d’une semaines, moins d’un mois…).
Il est même possible de préciser une période de recherche personnalisée pour des résultats plus précis. Mais pour dater une page spécifique intemporelle cette méthode reste assez empirique.
- Utiliser WayBackMachine
Pour ma part, j’utiliserais un outil que j’avais déjà décrit sur crack-net : WayBackMachine.
Ce service d’archive d’internet crawl régulièrement le web en sauvegardant des copies des pages des sites qu’il visite et on peut ainsi afficher une page web telle qu’elle était à une date antérieure. Voici donc par exemple, à quoi ressemblait Google à ses débuts en 1998 lorsque le moteur de recherche était encore en Beta :
Ce service d’archive d’internet crawl régulièrement le web en sauvegardant des copies des pages des sites qu’il visite et on peut ainsi afficher une page web telle qu’elle était à une date antérieure. Voici donc par exemple, à quoi ressemblait Google à ses débuts en 1998 lorsque le moteur de recherche était encore en Beta :
Mon article sur WayBackMachine dont l’URL est : http://www.crack-net.com/2011/10/afficher-un-site-internet-qui-nexiste.html remonte à octobre 2011 comme vous pouvez le voir.
On peut recouper la vérification en effectuant une recherche sur le service d’archive du web en tapant dans sa barre d’adresse : http://web.archive.org/web/*/www.crack-net.blogspot.com/2011/10/afficher-un-site-internet-qui-nexiste.html (soit : http://web.archive.org/web/*/www.site.com)
On constate qu’en effet cette page a été crawlée pour la première fois en 2011 et qu’elle apparaît au mois d’octobre avec un peu de décalage par rapport à la date de rédaction exacte (1/10/2011) en raison de la fréquence de scan du web qui ne doit pas être quotidienne :
Attention au contenu non daté sur internet
Pour conclure, j’avoue ne pas m’attarder sur les pages intemporelles sauf si j’en connais l’auteur et qu’il est fiable. En effet, produire du contenu non daté, fourre tout est une technique bien connue des blogueurs.
Par exemple, pour pouvoir fournir du contenu à fréquence régulière, même en périodes de “syndrome de la page blanche”, on a tendance à rédiger des articles à l’avance, déconnectés de l’actualité et donc à très longue “date limite de consommation”.
Sauf que certains poussent le vice jusqu’à ne faire que ça, en payant des rédacteurs d’articles intemporels, en privilégiant l’aspect quantitatif de leur publication. On les reconnait entre autre par le fait que les articles/pages ne sont jamais daté(e)s. Le but? Avoir un site mis à jour régulièrement bien qu’artificiellement ce qui avec une bonne optimisation des mots clés, un bourrinage de netlinking et un peu de spam sur les réseaux sociaux fini par payer tant et si bien qu’on les retrouve en pôle position dans les SERP (résultats de recherche). C’est du boulot, mais ça marche!
En matière de recherche sur le web donc, pour avoir du contenu pertinent fait prioritairement pour être lu par des humains et non optimisé pour apparaître en haut des résultats de recherche je vous conseille d’aller au delà des 2-3 premières lignes et vous y verrez peut être apparaître mon blog si vous lancez une requête sur ma thématique… Et oui, tout ça pour ça ;-) Vous n’êtes pas obligé d’appliquer ce conseil… Sauf lorsque mon blog apparaît au delà des 1ères lignes… HiHi!
Au passage, cet article est un exemple typique de contenu intemporel dont le contenu restera vrai tant que Waybackmachine existera et que les moteurs de recherche fonctionneront comme je l’ai évoqué… Mais cet article est daté et croyez le, rédigé du jour, vue que je n’ai pas un seul article d’avance. Mais rien ne m'empêchera de le republier dans quelques années, puisqu'il sera toujours d'actualité ;-)
COMMENTS