Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Tous les outils pour rechercher dans les archives du Web

Carole TISSERAND-BARTHOLE
Bases no
400
publié en
2022.02
2429
Tous les outils pour rechercher dans les archives du Web Image 1
Tous les outils pour rechercher dans les archives du Web Image 1

Le Web change à vive allure et les sites Web que l’on voit aujourd’hui n’ont plus grand-chose à voir avec ceux d’il y a 5, 10 ou 20 ans. Si cette évolution est bien normale, elle pose un important problème en termes de conservation des données : tous les contenus qui se trouvaient sur ces sites qui ont disparu sont aujourd’hui inaccessibles directement sur le Web ou les moteurs. Et il n’existe que peu de moyens pour les retrouver.

Pour le professionnel à la recherche de contenus anciens (même s’il ne s’agit que de remonter quelques années en arrière), cette quête peut vite devenir compliquée, voire même perdue d’avance.

On a d’un côté les médias qui conservent dans la plupart des cas leurs archives Web. Ainsi une recherche d’antériorité sur ces contenus reste relativement simple. Les médias sociaux quant à eux conservent l’ensemble des contenus (sauf ceux supprimés volontairement par l’utilisateur), comme Twitter par exemple qui permet de rechercher jusqu’en 2006, année de son lancement. Là aussi, une recherche d’antériorité ne pose pas de problème majeur.

Mais pour de nombreux autres sites comme les sites d’entreprises, les sites institutionnels, les sites personnels, il ne subsiste rien quand le site fait peau neuve ou disparaît.


Lire aussi :

Comment retrouver de vieux articles de presse ?

Conseil Veille du 12 mai 2021 pour naviguer dans les archives d’un site web

Outils de recherche sur les contenus audios : un segment encore pauvre


Les professionnels de l’information et de la veille connaissent bien la Wayback Machine proposée par Internet Archive depuis de nombreuses années et qui permet de retrouver les archives d’une page Web à condition que la page ait bien été indexée par Internet Archive. Cet outil est très utile et permet de répondre à certains besoins ponctuels. Mais on sait également que malgré toutes ses qualités, la Wayback Machine ne fait pas de miracles. Il subsiste encore de très nombreux cas où l’on n’arrive pas à retrouver ce que l’on cherche.

De nouveaux acteurs ont fait leur apparition au cours des dernières années. Sont-ils capables de répondre à des besoins informationnels pour lesquels Internet Archive nous conduit à une impasse ?

Dans cet article, nous dressons un panorama des outils et ressources disponibles aujourd’hui pour explorer les archives du Web et nous analysons leurs capacités et complémentarités avec la Wayback Machine.

tags

Déjà abonné ? Connectez-vous...

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...