La veille ou la recherche de contenus connaît certainement aujourd’hui un réel bouleversement qu’il est encore difficile de bien mesurer : la présence de plus en plus forte de vidéos, podcasts, infographies comme médias d’information à part entière.
Coexistant à côté des sources d’information traditionnelles, ou encore, cas plus complexe, intégrés dans ces mêmes médias traditionnels, de plus en plus de journaux, surtout dans la sphère économique, sociale et politique, en créent et diffusent (incluent) dans leur version numérique.
Les veilleurs et plus généralement tous les professionnels de l’information, traditionnellement orientés vers la recherche et l’analyse de contenus textuels, vont devoir rapidement se préoccuper de l’intégration de ces nouveaux réservoirs d’informations pour au moins deux raisons.
- D’une part, les données présentes dans ces vidéos, podcasts ou encore infographies risquent de ne pas se retrouver sur les supports textuels.
- D’autre part, ces nouveaux formats sont plus que de simples supports, ils constituent, du fait de leur professionnalisation, de plus en plus des moyens d’information à part entière, avec leurs propre dynamiques, recherches et analyses.
Lire aussi :
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche sur les contenus audios : un segment encore pauvre
Outils de recherche d’images : vers la reconnaissance de texte, objet et visage
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
En pratique, cela reste souvent plus facile à dire qu’à faire.Faire de la veille ou des recherches sur des contenus multimédias reste aujourd’hui bien plus compliqué et « frustrant » que sur des contenus textuels classiques. On ne recherche bien souvent que sur des métadonnées, ces contenus peuvent être très mal mis en valeur, décrits et indexés par leurs auteurs et on peut difficilement passer en revue un contenu audio ou vidéo comme on le ferait pour un texte en lecture rapide.
Certaines initiatives prometteuses de recherche d’information multimédia grand public et gratuites, développées il y a quelques années, sont en voie de disparition.
Par exemple le moteur de speech to text Voxalead vient de fermer ses portes après des années d’abandon et Telescoop, l’excellent moteur du contenu télé, dont nous avions parlé il y a quelques années existe toujours, mais ne permet plus de faire grand chose.
Pourtant, les technologies existent et ne cessent de s’améliorer grâce aux progrès de l’intelligence artificielle : il est ainsi possible de transcrire en texte les contenus audio des vidéos et podcasts grâce aux technologies de speech to text. Il est possible de repérer des logos ou encore d’identifier des visages dans des images et vidéos, . Malheureusement, bon nombre de ces technologies ne sont pas accessibles en ligne pour l’internaute lambda et sont réservées aux clients d’outils spécialisés qui requièrent un budget conséquent.
C’est à toutes ces questions que nous avons choisi de répondre de ce numéro de NETSOURCES.
Déjà abonné ? Connectez-vous...
Intéressons-nous maintenant à la recherche d’images. Nous avons choisi ici de nous focaliser sur la recherche d’images pour trouver des informations ou répondre à une question dans un cadre professionnel.
Nous n’aborderons pas la question des images libres de droits ou photos de stocks pour illustrer ses livrables.
La recherche d’images est plus complexe qu’elle n’y paraît au premier abord, car il coexiste différentes façons de rechercher :
il y a tout d’abord la recherche classique par mot-clé où la recherche porte sur des métadonnées ou - c’est encore très rare - sur du contenu textuel présent dans des images ;
la recherche inversée par l’image où le point de départ est une image et non du texte et où l’on recherche des images identiques ou similaires.
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche sur les contenus audios : un segment encore pauvre
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Parmi les moteurs d’images, on retrouve les moteurs classiques comme Google Images, Bing Images, Qwant images, DuckDuckGo images, Yandex Images.
On trouve également des moteurs comme Creative Commons Search (https://search.creativecommons.org) ou Flickr mais ils sont tout de même rarement utiles pour trouver des informations dans un cadre professionnel, car il s’agit souvent de photos personnelles. Néanmoins, on gardera en tête que certaines entreprises, associations, organisations utilisent Flickr pour stocker les photos de leurs événements et on pourra s’en servir dans certains cas précis.
Nous avons repris notre exemple sur le marché des chèques cadeaux en France pour tester ces différents moteurs et leurs forces et faiblesses dans un contexte de recherche professionnel.
Nous avons entré sur tous ces moteurs la requête marché des chèques cadeaux en France
(voir figure 1.)
Figure 1. Performance des différents moteurs d’images concernant la requête « Wedoogift »
Moteur | Pertinence des résultats | Fonctionnalités de recherche |
Google Images | +++ | +++ |
Bing Images | + | +++ |
Yandex Images | 0 | +++ |
Qwant Images | ++ | ++ |
DuckDuckGo Images | ++ | ++ |
Déjà abonné ? Connectez-vous...
On ne recherche pas des vidéos comme on recherche des images ou des contenus audio. Chaque type de contenus multimédias dispose de ses propres outils et il y a finalement assez peu d’outils qui englobent toutes ces dimensions.
Pour rechercher des vidéos, il existe trois grandes catégories de sources et d’outils :
d’une part les moteurs de vidéos développés par les grands acteurs du Web comme Google, Bing, Qwant, Yandex, etc. ;
il y a ensuite les grandes plateformes d’hébergement de vidéos comme YouTube, Dailymotion (de moins en moins utilisé) ou encore Vimeo qui disposent tous trois de leurs propres moteurs internes.
enfin, il existe toute une panoplie de petits outils plus confidentiels et spécialisés à connaître et à savoir mobiliser dans certains cas précis.
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche sur les contenus audios : un segment encore pauvre
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Nous sommes tout d’abord allés interroger les différents grands moteurs : Google Vidéos, Bing Vidéos, Yandex, Qwant Vidéos, DuckDuckGo Vidéos ainsi que les plateformes d’hébergement de vidéos YouTube, Dailymotion et Vimeo.
Pour nos tests, nous avons repris notre exemple déjà utilisé dans les précédents articles sur le marché des chèques cadeaux en France. Nous avons ici opté pour une requête simple avec le nom d’une startup spécialisée sur le marché des chèques cadeaux appelée Wedoogift
(voir tableau en figure 1.). Contrairement aux grands acteurs du secteur, cette startup avait l’avantage de générer un volume faible de résultats, de fait plus faciles à analyser.
Déjà abonné ? Connectez-vous...
La recherche d’information professionnelle de contenus audio va essentiellement porter sur les émissions radios et podcasts d’information.
Pour rechercher sur des contenus radios et podcasts, on retrouve tout d’abord quelques outils communs à la recherche vidéo :
- les sites d’archives audiovisuelles comme l’INA;
- Internet Archive;
- les agrégateurs de presse qui indexent des contenus télé et radio. On notera que Newsdesk propose également des podcasts (1000 au total, mais seulement 3 pour la France).
Lire aussi :
La veille face aux nouveaux médias : podcasts, Stories, Lives, etc.
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Pour la recherche de radio et podcasts en ligne, il existe plusieurs outils de recherche :
Déjà abonné ? Connectez-vous...
Comme nous avons pu le voir, rechercher des contenus multimédias est déjà un défi en soi. Mettre en place une veille sur ces contenus en est un autre.
Les outils de recherche de vidéos, d’images, ou de contenus audio proposent très rarement des fonctionnalités d’alertes et les flux RSS se font plutôt rares ou alors sont très bien cachés.
Sur Dailymotion, les flux RSS existaient il y a encore peu de temps, mais ils étaient bien cachés.
Il suffisait d’ajouter /rss après www.dailymotion.com. Malheureusement, nos récents tests montrent que cela ne fonctionne plus...
Lire aussi :
La veille face aux nouveaux médias : podcasts, Stories, Lives, etc.
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Outils de recherche sur les contenus audios : un segment encore pauvre
Comment valoriser les contenus multimédias dans un livrable de veille ?
Sur Instagram, pas de flux RSS, mais il existe un outil Queryfeed permettant de créer un flux RSS sur Instagram. La fonctionnalité qui était disponible en version gratuite est devenue payante depuis août dernier.
Sur Pinterest, il est possible de créer des flux RSS sur l’actualité d’un utilisateur ou son board. Mais pas sur des requêtes par mots-clés.
Soundcloud le permet également. On trouvera la méthode sur le blog Keep it simple : https://www.keepitsimple.fr/liste-rss
Sur Vimeo, il suffit d’ajouter /videos/rss à la suite de l’URL.
Sur YouTube, il est possible de récupérer un flux RSS pour les dernières vidéos :
Mais depuis 2015, il n’est plus possible de suivre une requête par mot-clé.
Déjà abonné ? Connectez-vous...
Une fois les vidéos, images ou contenus audios identifiés dans le cadre d’une veille ou d’une recherche d’information, il n’est pas si simple de les valoriser et notamment d’analyser, sauvegarder, utiliser et retranscrire ces contenus dans ses livrables.
D’une part parce qu’il s’agit souvent de contenus éphémères qui peuvent disparaître du jour au lendemain sans laisser de traces.
Et d’autre part parce qu’il est très difficile de retranscrire ces contenus de manière intelligible et efficace dans un livrable.
Il est en effet peu satisfaisant de transmettre un simple lien vers une vidéo ou un podcast en indiquant que le passage intéressant se situe à la 75e minute...
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Outils de recherche sur les contenus audios : un segment encore pauvre
Mettre en place une veille sur les contenus multimédias
Il est de plus en plus fréquent de collecter des vidéos, images, graphiques, dataviz, podcasts dans le cadre de ses veilles, mais, comme pour les contenus textuels, il est impératif d’évaluer la provenance de ces contenus et leur fiabilité. Les contenus multimédias ne sont pas épargnés par la désinformation ou les analyses biaisées ou trop hâtives.
Il n’est ainsi pas rare de trouver des infographies ou dataviz qui compilent des données émanant de sources sérieuses, mais qui ne sont en réalité par comparables. Et cela, fausse ainsi complètement l’analyse.
Même s’il existe des outils aidant à évaluer l’origine et la fiabilité de ces contenus, cela reste avant tout un processus humain.
Pour une infographie ou une dataviz par exemple, il va falloir regarder si les sources sont citées et aller regarder ces sources pour vérifier que l’analyse n’est pas faussée.
Sur le sujet de l’analyse d’images, on conseillera le visionnage du webinaire de Serge Courrier à l’EEIE qui est très complet : https://www.eeie.fr/webinar-eeie-01-analyse-dimage-geoint-imint.
Pour les vidéos, on pourra avoir recours à l’outil Invid, aujourd’hui le plus recommandé pour l’analyse de vidéos : https://www.invid-project.eu.
Pour le moment, il y a peu d’information sur la vérification de contenus audio notamment de podcasts.
Déjà abonné ? Connectez-vous...
TENDANCES
• Rechercher différemment
METHODOLOGIE/PANORAMA
• Tracer ses recherches pour gagner en expertise et en productivité
OUTILS DE RECHERCHE
• Trois nouveaux outils de recherche au banc d’essai
METHODOLOGIE
• La recherche d’information par géolocalisation
Déjà abonné ? Connectez-vous...
La recherche d’information sur le Web en 2019 n’est pas une sinécure et rester à jour sur cette question est un véritable challenge. Ce que l’on croyait acquis il y a 6 mois peut être balayé d’un simple coup de vent, car les méthodes et outils évoluent, changent et disparaissent plus vite que jamais.
Il faut sans cesse se remettre en question, s’informer, se former.
Lire aussi :
Tracer ses recherches pour gagner en expertise et en productivité
Trois nouveaux outils de recherche au banc d’essai
La recherche d’information par géolocalisation
Pour rester à jour et réaliser des recherches performantes et à valeur ajoutée, il faut aussi explorer sans cesse de nouveaux modèles qu’ils s’agissent de méthodes ou d’outils plus inattendus qui pourraient venir enrichir les pratiques de recherche et par la suite l’analyse et les prises de décision.
Nous avons donc décidé de consacrer ce numéro de NETSOURCES aux méthodes et outils de recherche qui sortent de l’ordinaire et qui bénéficient de positionnements de niche :
Quand on effectue des recherches d’information dans un cadre professionnel, il ne subsiste bien souvent que le livrable final qui ne contient que les informations jugées pertinentes à un instant T pour un sujet donné. Ce livrable est généralement conservé, archivé et on peut dans ce cas le retrouver et effectuer des recherches sur son contenu si besoin est.
Mais la recherche représente bien plus que cela et ne peut se limiter à ce document final et ce qu’il contient : en amont, il y a différentes requêtes testées sur différents outils de recherche, des sites et pages Web visités, des informations et sources mises de côté, d’autres éliminées, une navigation de site en site, de page en page ou de document en document, etc.
Il est de plus en plus rare de garder des traces précises, détaillées et structurées de tout le cheminement de la recherche. Cheminement qui est d’ailleurs de moins en moins linéaire et de plus en plus « brouillon » ou, du moins, qui fonctionne de plus en plus par tests et investigations successives. Il y a bien eu une époque où les stratégies et résultats de recherche étaient sauvegardés et capitalisés dans des bases de données internes. Mais personne n’y allait jamais et ces projets ont généralement été abandonnés.
Lire aussi :
Rechercher différemment - Dossier Spécial
Trois nouveaux outils de recherche au banc d’essai
La recherche d’information par géolocalisation
Des semaines, mois ou années plus tard, il est fréquent d’avoir besoin de remettre la main sur certains de ces sites, pages et documents. On se souvient d’avoir déjà vu cette information quelque-part, d’avoir déjà identifié une source sur ce sujet, mais on a beau tester plusieurs requêtes sur Google, explorer des sites que nous pensions être les bons, impossible de remettre la main dessus. Cela prend parfois un temps considérable pour y parvenir et dans certains cas, cette recherche s’avère même vaine, car le site ou la page a tout simplement disparu.
Dans un contexte de veille, il peut être également intéressant de pouvoir utiliser son historique de recherche et de navigation :
Effectuer des recherches d’information sur le Web au présent est une chose, mais revenir sur des recherches antérieures en est une autre. Et cela peut vite se transformer en chasse au trésor !
Dans cet article, nous avons choisi d’explorer les méthodes et solutions aujourd’hui disponibles pour remonter le fil de ses stratégies de recherche d’une part (mots-clés utilisés, requêtes précises) et de sa navigation sur le Web (pages visualisées, sites consultés, documents ouverts).
Nous verrons tout d’abord à travers différents exemples méthodologiques comment il est possible de remonter sur les traces de ses recherches et navigations antérieures.
Nous dresserons ensuite un panorama des outils utiles pour tracer ses requêtes et navigations, qu’il s’agisse de solutions manuelles ou automatiques.
Déjà abonné ? Connectez-vous...
Si la recherche d’information actuelle reste grandement tributaire des mots-clés, il existe d’autres méthodes plus ou moins nouvelles pour faire ressortir des informations utiles et complémentaires : recherche par l’image grâce à des outils de recherche inversée, recherche de logo dans des images ou vidéos, recherche à partir d’une URL ou encore recommandations de contenus à partir des autres contenus visualisés par les utilisateurs, etc.
Il en existe une autre, liée à l’avènement des médias sociaux que l’on pourrait qualifier de recherche par géolocalisation, que nous n’avions pas encore eu l’occasion d’aborder dans le détail. L’idée est ici de récupérer et retrouver tous les contenus publiés à un endroit précis grâce aux coordonnées géographiques (latitude et longitude) et données GPS souvent associés aux contenus.
Lire aussi :
Rechercher différemment - Dossier Spécial
Trois nouveaux outils de recherche au banc d’essai
Tracer ses recherches pour gagner en expertise et en productivité
Déjà abonné ? Connectez-vous...