Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Veille et recherche d’information audiovisuelle : panorama de l’offre

Carole Tisserand-Barthole
Bases no
349
publié en
2017.06
559
Veille et recherche d’information audiovisuelle : panorama ... Image 1
Veille et recherche d’information audiovisuelle : panorama ... Image 1

La veille et la recherche d’informations audiovisuelles diffèrent considérablement des veilles presse ou Web et, ce en raison même du format de leur contenu.

Certes, les vidéos ou fichiers audio sont aujourd’hui légion sur le Web et il n’est pas difficile de rechercher et d’accéder à des vidéos gratuitement en interrogeant simplement le moteur de vidéos de Google.

Mais cela se complique considérablement quand on souhaite effectuer des recherches ou surveiller le contenu d’émissions ou de vidéos dans leur intégralité afin de savoir si un ou plusieurs termes y ont été cités. Effectuer une recherche textuelle sur du contenu qui ne l’est pas représente alors un véritable challenge...

Nous avions consacré un article à « la recherche d’information audio sur le Web » dans le n° 343 de BASES (décembre 2016) mais nous avions volontairement mis de côté la recherche de mots-clés au sein d’émissions de télévision ou radio.

Dans cet article, nous avons choisi d’explorer les différentes possibilités pour réaliser des veilles et recherches d’informations au sein des contenus d’émissions de télévision ou de radio. Est-il possible de la faire de manière gratuite ou presque ou bien est-il forcément nécessaire de recourir à des prestataires et outils spécialisés ? Quelles méthodes adopter ? Que trouve-t-on en la matière chez les agrégateurs de presse traditionnels comme Pressedd, Europresse, Factiva ou LexisNexis ? Quels sont les prestataires spécialisés en France et vers qui se tourner dans le cas de besoins à l’international ?

Au préalable

Pour pouvoir effectuer une recherche textuelle au sein de contenus audiovisuels, cela suppose que l’éditeur des contenus ou un prestataire externe mette à disposition des transcriptions écrites (transcripts en anglais) sous la forme de contenu html, fichier texte, word ou pdf par exemple ou bien propose un outil/moteur recourant à la technologie du speech to text.

« La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale ou speech to text) est une technique informatique qui permet d’analyser la voix humaine captée au moyen d’un microphone pour la transcrire sous la forme d’un texte exploitable par une machine. » (Source : Wikipédia).

A titre d’exemple, CNN propose les transcripts de ses émissions au format html : http://transcripts.cnn.com/TRANSCRIPTS.

La chaîne de télévision M6 propose, quant à elle, un moteur spécialisé utilisant la technologie du speech to text permettant d’effectuer des recherches sur le contenu de ses émissions et de visualiser l’extrait où apparaît le mot-clé (https://www.m6videobank.fr).

Autre préalable : l’antériorité. S’agit-il de surveiller les nouveaux contenus citant un mot, une marque, etc. ou bien d’effectuer des recherches sur des contenus récents ou datant de plusieurs dizaines d’années ? Et l’on constatera au long de cet article que rechercher au sein d’émissions de télévision et radio anciennes est souvent bien plus compliqué que pour du contenu récent.

Enfin, pour le cas de solutions payantes, il faudra bien se renseigner sur ce que la « surveillance des vidéos, radios et TVs » englobe réellement.

La majorité des outils de recherche et de veille indiquent disposer de vidéos, radios et TV dans leur corpus. En réalité, peu d’entre eux sont réellement capables de surveiller des mots-clés au sein d’une émission de télévision ou radio. La plupart se contentant de surveiller le contenu textuel du site Web des radios et TVs ou les métadonnées des vidéos (titre de la vidéo, descriptif, date de publication, etc.).

tags

Déjà abonné ? Connectez-vous...

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...