Lors de recherches ou de veilles sur le Web, il n’est pas rare de rencontrer des documents ou des pages Web comportant un gros volume de données chiffrées que l’on souhaite récupérer. Il peut s’agir par exemple de tableaux sur un site internet, d’informations au sein d’un fichier PDF protégé, etc.
Malheureusement, il est souvent impossible de copier-coller l’ensemble de ces données de façon simple et rapide.
S’ensuit alors une longue séance de Ctrl C-Ctrl V pour extraire manuellement les informations utiles... Mais ce temps peut être considérablement réduit grâce à un outil d’extraction de données.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Comment rechercher des données chiffrées sur Google et moteurs de recherche généralistes ?
Trouver des informations financières : un exercice de recherche coûteux en efforts et en ressources
TENDANCES • Veille et recherche : le retour de la sélectivité face à la quantité
AGENDA • MasterClass Search & Veille 2020
METHODOLOGIE • Comment trouver des outils de recherche d'information thématiques ?
PANORAMA • Open data : les outils de recherche issus des données de data.gouv.fr
OUTILS DE VEILLE • Ces nouveaux outils qui surfent sur la sélectivité des sources
METHODOLOGIE • Comment construire ses propres outils de recherche d'information thématiques ?
Le besoin de sélectivité et de qualité de l’information et des sources plutôt que de la quantité fait un retour sur le devant de la scène, et ce, pour plusieurs raisons.
Dans un contexte de surinformation croissante, il y a tout d’abord une prise de conscience qu’il est contre-productif de vouloir tout surveiller et qu’on se retrouve juste noyé sous l’information. D’autre part, la mise en lumière de la désinformation et des fake news a fait prendre conscience que toutes les sources d’information n’ont pas la même valeur.
Les médias comme Le Monde, The Guardian ou encore le Times ont récemment annoncé avoir revu courant 2019 leur stratégie éditoriale pour produire moins de contenus, mais de meilleure qualité, ce qui leur avait permis d’augmenter leur audience et leurs ventes.
Instagram vient tout juste d’annoncer une fonctionnalité pour faire le tri dans ses abonnements.
Google lui-même n’a pas abandonné ses verticales thématiques comme Google Scholar ou Google Actualités. Il a même choisi de créer une nouvelle verticale avec Google Datasets (jeux de données issues de l’open data et des données de la recherche) qui vient tout juste de sortir de sa version bêta et propose de nouvelles fonctionnalités. Enfin, il vient également d’ajouter un moteur de recherche à son interface Google Podcasts.
Lire aussi :
Comment trouver des outils de recherche d’information thématiques ?
Open data : les outils de recherche issus des données de data.gouv.fr
Ces nouveaux outils qui surfent sur la sélectivité des sources
Comment construire ses propres outils de recherche d'information thématiques ?
Les données en open data sont une mine d’or pour la recherche et la veille professionnelle. Seul problème, la très grande majorité des moteurs et plateformes d’open data ne permettent que de rechercher sur les métadonnées, ce qui ne permet pas d’exploiter tout leur potentiel.
Fort heureusement, de plus en plus d’acteurs créent des outils de recherche (moteur, base de données interrogeable, carte interactive) à partir des données disponibles sur les plateformes d’open data. Et ces outils peuvent être d’une aide précieuse.
Lire aussi :
Comment trouver des outils de recherche d’information thématiques ?
Veille et recherche : le retour de la sélectivité face à la quantité
Ces nouveaux outils qui surfent sur la sélectivité des sources
Comment construire ses propres outils de recherche d'information thématiques ?
Il y a un besoin croissant d’outils de recherche thématiques pour la recherche d’information professionnelle. Et fort heureusement, de nombreux outils thématiques se développent depuis quelques années. Dans un article paru en 2017 dans BASES « L’avenir de la recherche sera-t-il thématique ? » - BASES n°351, septembre 2017, nous avions évoqué cette tendance.
Deux ans et demi après, elle se confirme et de nouveaux outils de recherche thématiques continuent de voir le jour. Pour autant, identifier ces outils n’est pas toujours évident, car ils n’ont pas la même visibilité ni la même force de frappe que les grands outils de recherche sur le marché.
Lire aussi :
L’avenir de la recherche sera-t-il thématique ?
Open data : les outils de recherche issus des données de data.gouv.fr
Veille et recherche : le retour de la sélectivité face à la quantité
Ces nouveaux outils qui surfent sur la sélectivité des sources
Comment construire ses propres outils de recherche d'information thématiques ?
Alors que la majorité des grandes plateformes de veille sur le marché intègrent toujours plus leurs contenus et des types de sources de plus en plus diversifiées (sites, Web, médias sociaux, littérature scientifique, presse payante, vidéos, etc.), d’autres acteurs choisissent le chemin inverse à l’image de DeepNews et ses newsletters de veille thématiques.
Deepnews est à la base un projet lancé en 2016, mais ce n’est qu’au début de l’année 2020 que l’entreprise a lancé ses premiers produits publics : des newsletters en anglais en grande partie automatisées sur un sujet donné.
Chaque newsletter regroupe une sélection d’articles de presse, à valeur ajoutée, de qualité et jugés les plus pertinents sur un sujet donné. L’utilisateur dispose du titre des articles, du nom de la source, du lien vers l’article, d’une indication sur le caractère gratuit ou payant de l’article, d’un extrait pertinent en quelques lignes et, pour certains articles, d’un commentaire de l’éditeur avec des éléments de contexte sur la source ou sur le contenu.
Lire aussi :
La curation pour les managers : le sens de l’information vu par Curation Corp
Ces start-ups qui investissent le champ de l’évaluation des sources et contenus
Open data : les outils de recherche issus des données de data.gouv.fr
Veille et recherche : le retour de la sélectivité face à la quantité
Comment construire ses propres outils de recherche d'information thématiques ?
Dans un contexte de surinformation, les outils de recherche généralistes ne sont pas en mesure de répondre seuls à des besoins d’information complexes qui nécessitent d’avoir une vision d’ensemble d’un sujet.
Google effectue une sélection de 100 à 200 résultats qu’il juge les plus pertinents. Les agrégateurs de presse ne disposent pas de toutes les sources pertinentes sur une thématique ou un secteur d’activité. Les plateformes de veille ont une antériorité limitée et ne sont pas conçues pour être des outils de recherche, même si cela évolue un peu depuis quelques années.
Quand on travaille sur des sujets, thématiques ou secteurs d’activité récurrents, on a donc intérêt à se créer ses propres outils de recherche thématiques que l’on peut aller interroger dès qu’une question ponctuelle ou une étude se présente.
Lire aussi :
ILI 2019 : une vision anglo-saxonne de l’avenir des professionnels de l’information
La curation pour les managers : le sens de l’information vu par Curation Corp
Ces start-ups qui investissent le champ de l’évaluation des sources et contenus
Open data : les outils de recherche issus des données de data.gouv.fr
Veille et recherche : le retour de la sélectivité face à la quantité
Ces nouveaux outils qui surfent sur la sélectivité des sources
TENDANCES • La révolution multimédia bouscule la veille
PANORAMA
• Outils de recherche de vidéos : des métadonnées au speech to text
• Outils de recherche sur les contenus audios : un segment encore pauvre
• Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
METHODOLOGIE • Mettre en place une veille sur les contenus multimédias
OUTILS DE VEILLE • Comment valoriser les contenus multimédias dans un livrable de veille ?
INDEX • Index NETSOURCES 2019
La veille ou la recherche de contenus connaît certainement aujourd’hui un réel bouleversement qu’il est encore difficile de bien mesurer : la présence de plus en plus forte de vidéos, podcasts, infographies comme médias d’information à part entière.
Coexistant à côté des sources d’information traditionnelles, ou encore, cas plus complexe, intégrés dans ces mêmes médias traditionnels, de plus en plus de journaux, surtout dans la sphère économique, sociale et politique, en créent et diffusent (incluent) dans leur version numérique.
Les veilleurs et plus généralement tous les professionnels de l’information, traditionnellement orientés vers la recherche et l’analyse de contenus textuels, vont devoir rapidement se préoccuper de l’intégration de ces nouveaux réservoirs d’informations pour au moins deux raisons.
- D’une part, les données présentes dans ces vidéos, podcasts ou encore infographies risquent de ne pas se retrouver sur les supports textuels.
- D’autre part, ces nouveaux formats sont plus que de simples supports, ils constituent, du fait de leur professionnalisation, de plus en plus des moyens d’information à part entière, avec leurs propre dynamiques, recherches et analyses.
Lire aussi :
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche sur les contenus audios : un segment encore pauvre
Outils de recherche d’images : vers la reconnaissance de texte, objet et visage
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Intéressons-nous maintenant à la recherche d’images. Nous avons choisi ici de nous focaliser sur la recherche d’images pour trouver des informations ou répondre à une question dans un cadre professionnel.
Nous n’aborderons pas la question des images libres de droits ou photos de stocks pour illustrer ses livrables.
La recherche d’images est plus complexe qu’elle n’y paraît au premier abord, car il coexiste différentes façons de rechercher :
il y a tout d’abord la recherche classique par mot-clé où la recherche porte sur des métadonnées ou - c’est encore très rare - sur du contenu textuel présent dans des images ;
la recherche inversée par l’image où le point de départ est une image et non du texte et où l’on recherche des images identiques ou similaires.
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche sur les contenus audios : un segment encore pauvre
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?