Le terme data est à la mode. Big data, smart data, datajournalisme, small data, datasets sont autant de mots que l’on voit s’afficher au quotidien sur nos écrans.
Nous avons choisi ici de nous intéresser spécifiquement aux datasets, aussi appelé en français « jeux de données » car leur intérêt dans un contexte de recherche d’information et de veille est croissant. Google vient même de leur dédier un nouveau moteur appelé Google Dataset Search.
Qu’est-ce que les termes datasets ou jeux de données englobent réellement ? En quoi ces données peuvent-elles avoir un intérêt pour la recherche d’information et la veille ? Comment les identifier et quelles sont les principales sources et méthodes à connaître ?
Lire aussi dans ce dossier :
Google Dataset Search : peut-il devenir le Google Scholar des données ?
Les données de la recherche : un nouveau pan de la recherche d’information scientifique et technique
Quelques rappels sur l’open data au service de la recherche d’information
Si pendant longtemps, la recherche d’information se basait essentiellement sur des contenus textuels comme les articles de presse, articles scientifiques, brevets, rapports, études, pages Web textuelles, etc., les choses évoluent rapidement.
L’image, la vidéo ou encore le son prennent une place de plus en plus importante avec notamment l’essor de la recherche visuelle, vocale, la reconnaissance de logos ou de texte dans les images. On parle de plus en plus d’un univers « post-texte ».
Au-delà du développement de ces contenus multimédias, on assiste également à un autre mouvement intéressant : un intérêt et une valorisation croissante pour les données en tant que telles, comme les données publiques et les données de la recherche scientifique et académique.
Elles s’extraient progressivement de leurs supports traditionnels comme les articles scientifiques, les rapports, les études et autres publications pour devenir des objets et informations à part entière qui sont partagés librement sur le Web et donc deviennent potentiellement « recherchables ».
Et ces changements impactent bien évidemment les professionnels de l’information qui doivent adapter leur façon de rechercher et intégrer de nouvelles sources et contenus.
Déjà abonné ? Connectez-vous...