Les podcasts ont une place particulière dans le monde de la veille. C’est un type de sources qui a, sur certains sujets, une valeur inestimable. Ils peuvent en effet proposer des informations que l’on ne retrouve pas ailleurs, offrir de l’analyse et de la profondeur difficile à obtenir dans des contenus plus courts comme des articles par exemple, etc. De plus, les podcasts sont souvent gratuits, ce qui ne nécessite pas une souscription à un abonnement supplémentaire.
Mais choisir d’intégrer des podcasts à sa démarche, c’est aussi beaucoup d’embûches en perspective et à tous les niveaux : ils sont difficiles à identifier et à mettre en veille de manière automatisée, ils sont longs à écouter et à analyser, mais ils sont aussi compliqués à intégrer aux livrables (voir notre article Comment intégrer les podcasts à ses livrables de veille ?).
Dans cet article, nous avons choisi de nous focaliser exclusivement sur la phase d’identification de podcasts : comment identifier des podcasts pertinents à intégrer à son sourcing ? Quels outils et méthodes utiliser pour y parvenir ?
Nous nous intéressons ici aux podcasts au sens large : podcasts journalistiques et podcasts de marques ou amateurs, à l’exception des replays d’émissions qui existent déjà sous un autre format. La méthode proposée permet d’identifier des podcasts français mais elle fonctionne aussi pour des podcasts réalisés dans d’autres pays et dans d’autres langues.
L’actualité politique est un jeu de ping-pong. Elle est faite de prises de position, et en retrouver l’origine permet de couvrir ses rebonds avec précision et fiabilité. Mais qu’il s’agisse de débats, d’interviews ou de discours, la surveillance et la vérification des interventions publiques constituent une vraie difficulté technique pour les professionnels de l’information.
Premièrement, car ce type de contenu est en grande partie diffusé dans un format audiovisuel, alors que les méthodes et les outils des professionnels de la veille reposent surtout sur du texte. Et même quand ces discours, interviews et citations existent au format textuel (dans des articles de presse par exemple), ils restent très difficiles à identifier et il est nécessaire d’avoir recours à des requêtes longues et complexes pour explorer tout le champ lexical de la prise de parole. Pour savoir comment rechercher des déclarations au format textuel, on pourra se référer à l’article « Retrouver les déclarations d’une personnalité : sources et méthodes » BASES n° 341 - Octobre 2016 qui reste encore d’actualité pour ce qui est des méthodes proposées.
Deuxièmement, parce que ces sources audiovisuelles restent difficiles à intégrer dans un livrable de veille. Cette étape peut alors nécessiter une écoute longue et minutieuse, une transcription parfois coûteuse, quand il ne s’agit pas de faire soi-même un montage pour en supprimer des extraits… Et tout cela, pour en tirer une ou deux lignes de citations pertinentes, généralement, donc… au format écrit.
Retrouver des discours et déclarations de personnalités publiques issues de sources audiovisuelles représente donc un double défi !
Lire aussi :
Retrouver les déclarations d’une personnalité : sources et méthodes
Contenu d’un nouveau type, parfois éphémère, mais qui s’affirme comme un media d’information « puissant », le podcast d’information est issu à 65 % de la presse écrite. Il est alors conçu soit comme un canal complémentaire, soit comme un véritable produit d’information avec un contenu original (dit natif), que l’on ne retrouve nulle part ailleurs.
En tant que professionnel de l’information, le veilleur est à l’affut de toute information, quel que soit son format. Avec le podcast, il se heurte à une variété de contenus et d’accès dont dépendra la collecte.
Il faut non seulement le collecter, mais aussi le traiter et l’intégrer à sa production documentaire ou à son livrable de veille.
Voir « Les nouveaux formats des médias appellent de nouvelles méthodes et outils de recherche », NETSOURCES n°150, janvier-février 2021
Nous apprenions il y a quelques jours dans un communiqué de presse de l’Union Européenne de Radio-Télévision (UER) que les adresses internet avec une extension
.radio
allaient être mises sur le marché en 2017.
Cela va se faire selon plusieurs vagues successives.
Le but : fédérer la communauté des 65 000 radios hertziennes et des 60.000 webradios dans le monde. A noter qu'une radio devra débourser 200 euros pour acquérir cette extension.
En février et mars 2017, l’UER va sélectionner 80 radios dans le monde parmi celles ayant fait une demande et leur attribuer une extension .radio
. Ce n’est qu’en mai et juin que les autres radios pourront à leur tour postuler.
La veille radio/TV est très différente de la veille Web et presse classique
Réaliser une veille ou une recherche d’informations sur des sources Web, des sites d’actualités ou les réseaux sociaux avec des outils gratuits ou peu chers comme les lecteurs de flux RSS, les systèmes d’alertes Web ou les moteurs de recherche n’est pas une mission impossible.
Néanmoins, cela n’est pas nécessairement optimal notamment quand le volume d’information est important, le sujet ambigu ou que la thématique implique d’avoir accès à des sources payantes.
D’autre part, la légalité de la surveillance de certaines sources est parfois très discutable voire complètement illégal d’où l’intérêt de faire appel à des professionnels pour réaliser la veille ou la recherche d’informations.
Mais dès que l’on souhaite faire une recherche oumettre en place une veille sur des contenus radios ou télévisuels de manière artisanale avec des outils gratuits ou peu coûteux, le degré de difficulté atteint vite des sommets.
1. Lutter contre l’infobésité en privilégiant une sélectivité des sources;
2. Trouver des solutions pour intégrer les contenus multimédias à sa veille au même titre que les contenus textuels;
3. Tirer parti des évolutions de la traduction automatique pour renforcer sa veille sur des langues autres que l’anglais;
4. Accorder plus d’importance à la fiabilité des sources et informations et être vigilant sur la porosité de la frontière information/publicité;
5. Adapter ses livrables aux attentes et pratiques de son public et non l’inverse;
Si la société Mediatree a été créée dès 2007 et se proclame « leader de la veille audiovisuelle en France », elle reste pourtant méconnue des professionnels de l’information. Grâce à des technologies de pointe brevetées, cette société française est en mesure de capter et d’indexer en temps réel le contenu de plus de 5 000 chaînes de télévision et radio dans le monde.
Ses premiers clients furent des sociétés de production audiovisuelle désireuses de retrouver des extraits sonores ou vidéo et de pouvoir les réutiliser au sein d’émissions ou de documentaires. Mais ce service a très vite aussi intéressé les responsables de communication au sein de services gouvernementaux, de sociétés de grandes marques ou d’associations, qui souhaitaient disposer d’un outil leur permettant de couvrir les médias audiovisuels pour y réaliser toutes sortes de recherches, de veilles d’image ou de réputation.
Après les moteurs spécialisés sur le juridique, le recrutement ou la santé, il a également été question de nouveaux moteurs qui tirent parti des contenus multimédia.
On le sait, les contenus multimédia prolifèrent et il est de plus en plus important de les inclure dans son dispositif de veille et ses recherches d’information. Pourtant, ce sont des contenus difficiles d’accès car peu représentés dans les outils traditionnels et surtout peu « recherchables » car la recherche ne porte généralement que sur les métadonnées.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Le SEO et la veille au défi des moteurs
La veille ou la recherche de contenus connaît certainement aujourd’hui un réel bouleversement qu’il est encore difficile de bien mesurer : la présence de plus en plus forte de vidéos, podcasts, infographies comme médias d’information à part entière.
Coexistant à côté des sources d’information traditionnelles, ou encore, cas plus complexe, intégrés dans ces mêmes médias traditionnels, de plus en plus de journaux, surtout dans la sphère économique, sociale et politique, en créent et diffusent (incluent) dans leur version numérique.
Les veilleurs et plus généralement tous les professionnels de l’information, traditionnellement orientés vers la recherche et l’analyse de contenus textuels, vont devoir rapidement se préoccuper de l’intégration de ces nouveaux réservoirs d’informations pour au moins deux raisons.
- D’une part, les données présentes dans ces vidéos, podcasts ou encore infographies risquent de ne pas se retrouver sur les supports textuels.
- D’autre part, ces nouveaux formats sont plus que de simples supports, ils constituent, du fait de leur professionnalisation, de plus en plus des moyens d’information à part entière, avec leurs propre dynamiques, recherches et analyses.
Lire aussi :
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche sur les contenus audios : un segment encore pauvre
Outils de recherche d’images : vers la reconnaissance de texte, objet et visage
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
On ne recherche pas des vidéos comme on recherche des images ou des contenus audio. Chaque type de contenus multimédias dispose de ses propres outils et il y a finalement assez peu d’outils qui englobent toutes ces dimensions.
Pour rechercher des vidéos, il existe trois grandes catégories de sources et d’outils :
d’une part les moteurs de vidéos développés par les grands acteurs du Web comme Google, Bing, Qwant, Yandex, etc. ;
il y a ensuite les grandes plateformes d’hébergement de vidéos comme YouTube, Dailymotion (de moins en moins utilisé) ou encore Vimeo qui disposent tous trois de leurs propres moteurs internes.
enfin, il existe toute une panoplie de petits outils plus confidentiels et spécialisés à connaître et à savoir mobiliser dans certains cas précis.
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche sur les contenus audios : un segment encore pauvre
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
La recherche d’information professionnelle de contenus audio va essentiellement porter sur les émissions radios et podcasts d’information.
Pour rechercher sur des contenus radios et podcasts, on retrouve tout d’abord quelques outils communs à la recherche vidéo :
- les sites d’archives audiovisuelles comme l’INA;
- Internet Archive;
- les agrégateurs de presse qui indexent des contenus télé et radio. On notera que Newsdesk propose également des podcasts (1000 au total, mais seulement 3 pour la France).
Lire aussi :
La veille face aux nouveaux médias : podcasts, Stories, Lives, etc.
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Comme nous avons pu le voir, rechercher des contenus multimédias est déjà un défi en soi. Mettre en place une veille sur ces contenus en est un autre.
Les outils de recherche de vidéos, d’images, ou de contenus audio proposent très rarement des fonctionnalités d’alertes et les flux RSS se font plutôt rares ou alors sont très bien cachés.
Sur Dailymotion, les flux RSS existaient il y a encore peu de temps, mais ils étaient bien cachés.
Il suffisait d’ajouter /rss après www.dailymotion.com. Malheureusement, nos récents tests montrent que cela ne fonctionne plus...
Lire aussi :
La veille face aux nouveaux médias : podcasts, Stories, Lives, etc.
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Outils de recherche sur les contenus audios : un segment encore pauvre
Comment valoriser les contenus multimédias dans un livrable de veille ?
Une fois les vidéos, images ou contenus audios identifiés dans le cadre d’une veille ou d’une recherche d’information, il n’est pas si simple de les valoriser et notamment d’analyser, sauvegarder, utiliser et retranscrire ces contenus dans ses livrables.
D’une part parce qu’il s’agit souvent de contenus éphémères qui peuvent disparaître du jour au lendemain sans laisser de traces.
Et d’autre part parce qu’il est très difficile de retranscrire ces contenus de manière intelligible et efficace dans un livrable.
Il est en effet peu satisfaisant de transmettre un simple lien vers une vidéo ou un podcast en indiquant que le passage intéressant se situe à la 75e minute...
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Outils de recherche sur les contenus audios : un segment encore pauvre
Mettre en place une veille sur les contenus multimédias
Les médias traditionnels (presse écrite, web, TV, radio) représentent une source d’information incontournable pour la veille et la recherche d’information et cela n’est sûrement pas prêt de changer.
Mais dans un monde où tout évolue très vite, on voit sans cesse se développer de nouvelles formes de journalisme et nouveaux médias qu’il va falloir intégrer à sa démarche.
D’une part, les principaux acteurs traditionnels de la presse, TV ou radio explorent en permanence de nouveaux formats : Lives sur les médias sociaux, Stories, podcasts, etc.
D’autre part, de nouveaux médias, souvent innovants dans leur forme et dans leur contenu et/ou sur un marché de niche font également régulièrement leur apparition et peuvent proposer des informations stratégiques ou très informatives que l’on ne retrouve nulle part ailleurs : journalisme d’investigation locale, vulgarisation scientifique, etc.
Qui n’a jamais rêvé d’un outil de recherche ou de veille unique, multi sources et multi contenus qui, à partir d’une seule requête, fournirait l’intégralité des résultats utiles et pertinents sur un sujet donné ?
Si cette question occupe les outils de recherche et éditeurs de veille depuis des décennies, force est de constater que la possibilité de rechercher en un seul et même endroit sur des contenus toujours plus nombreux et disparates reste un idéal vers lequel la plupart cherchent toujours à tendre.
Lire aussi :
Google ajoute deux nouveaux opérateurs de recherche
Quand peut-on clore sa recherche l'esprit tranquille ?
Search Lab : 3 méthodologies clé en main
Comment détecter des innovations de marché ?
La recherche d information appliquée aux personnes
Véronique Mesguich est consultante-formatrice et auteur de l’ouvrage « Rechercher l’information stratégique sur le web : sourcing, veille et analyse à l’heure de la révolution numérique », DeBoeck, 2018
La veille concurrentielle fait appel aux images pour repérer de nouveaux produits, ou de nouveaux usages, notamment en b-to-c. Le repérage de tendances ou de phénomènes émergents s’appuie sur des images ou vidéos issues des réseaux sociaux, et notamment Pinterest.
La recherche d’experts se base entre autres sur des captations de conférences, ou interviews partagées sur YouTube et autres réseaux, mais aussi via des podcasts d’émissions de radio ou TV.
Lire aussi :
Presse, réseaux sociaux, contenus multimédia, littérature scientifique, données, etc. : rechercher sur des contenus très disparates
Google ajoute deux nouveaux opérateurs de recherche
Quand peut-on clore sa recherche l'esprit tranquille ?
Search Lab : 3 méthodologies clé en main
Comment détecter des innovations de marché ?
La recherche d information appliquée aux personnes
En janvier dernier, Digimind a annoncé avoir intégré à sa plateforme de Social Media Monitoring Digimind Social plus de 2 000 sources TV et radio françaises et internationales.
Jusqu’à présent, la plupart des outils de veille qui indiquaient surveiller les contenus TV et radio françaises et internationales ne surveillaient en réalité que les sites Web de ces sources et non les contenus des émissions elles-mêmes. A notre connaissance, le seul autre acteur permettant la surveillance de contenus d’émissions est Talkwalker. Nous les avons contactés mais, pour des raisons de confidentialité, ils n’ont pas souhaité s’exprimer sur le sujet.
La veille et la recherche d’informations audiovisuelles diffèrent considérablement des veilles presse ou Web et, ce en raison même du format de leur contenu.
Certes, les vidéos ou fichiers audio sont aujourd’hui légion sur le Web et il n’est pas difficile de rechercher et d’accéder à des vidéos gratuitement en interrogeant simplement le moteur de vidéos de Google.
Mais cela se complique considérablement quand on souhaite effectuer des recherches ou surveiller le contenu d’émissions ou de vidéos dans leur intégralité afin de savoir si un ou plusieurs termes y ont été cités. Effectuer une recherche textuelle sur du contenu qui ne l’est pas représente alors un véritable challenge...
Davantage présent aux débuts de l’internet, notamment en raison de sa taille limitée, le format audio est devenu depuis plusieurs années déjà le parent pauvre de la recherche d’information, chez les professionnels autant que pour le grand public.
L’explosion de la vidéo, permise notamment par l’augmentation exponentielle de la bande passante disponible, a accaparé l’attention, tandis que des outils de plus en plus efficaces de recherche d’images en ont fait un autre axe central des stratégies de veille (en permettant notamment de repérer des logos de marques dans des images à première vue anodines).
Le son, lui, est passé au second plan.
Du côté du géant américain Google, l’actualité ne manque pas aussi bien au niveau du moteur de recherche que de ses autres services.
L’entreprise travaille actuellement sur un algorithme pouvant deviner où une photo a été prise même quand l’utilisateur a désactivé la géolocalisation (et notamment supprimé les données exif qui fournissent ces informations de localisation). Pour le moment, le système arrive à reconnaître le continent dans 48% des cas, le pays dans 28 % des cas, la ville dans 10% et la rue dans 3.6% des cas. Il faudra encore un peu de travail avant que le concept présente un réel intérêt.
Sur le moteur Google images, les internautes peuvent désormais bookmarker les images qui les intéressent (seulement aux Etats-Unis pour le moment).
Enfin, YouTube a ajouté une nouvelle fonctionnalité permettant de flouter des zones sur une vidéo. Cette fonctionnalité n’est bien sûre accessible qu’aux personnes propriétaires de la vidéo souhaitant la charger sur YouTube.
On le sait, Google indexe les documents au format PDF, mais ce que l’on sait moins, c’est qu’il les met peu souvent à jour (c’est-à-dire qu’il ne retourne pas souvent pour crawler un même document) car il considère que les documents PDF sont des documents « stables » qui sont rarement modifiés ou mis à jour. Ce n’est donc pas en passant par Google que l’on pourra surveiller efficacement les changements sur un document PDF.
Les plateformes vidéos de type YouTube ou Dailymotion sont aujourd’hui des éléments incontournables de notre vie privée mais peuvent-elles réellement avoir un intérêt dans un cadre professionnel, notamment pour les professionnels de l’information ?
Quand on pense à YouTube, on pense plutôt clips de musiques, bandes annonces de films, rediffusions de programmes TV ou séries diffusées plus ou moins légalement, youtubers qui font des sketchs et vidéos humoristiques ou bien tutos beauté. Bref, on est très très loin de l’univers de l’entreprise...