Parmi les outils IA, ceux qui proposent la fonctionnalité de Text-to-Speech (ou Text to Voice) représentent un gain de productivité. On les utilise pour écouter ses sources, ou pour faire écouter son livrable en format audio.
Nous en avons sélectionné quatre, en accès gratuit ou freemium, parmi une vingtaine d’outils explorés.
Nous les avons choisis pour la qualité du son généré par IA, c’est-à-dire le plus proche possible de la voix humaine, et pour la richesse de ce qu’ils offrent déjà dans leur version gratuite.
L’actualité politique est un jeu de ping-pong. Elle est faite de prises de position, et en retrouver l’origine permet de couvrir ses rebonds avec précision et fiabilité. Mais qu’il s’agisse de débats, d’interviews ou de discours, la surveillance et la vérification des interventions publiques constituent une vraie difficulté technique pour les professionnels de l’information.
Premièrement, car ce type de contenu est en grande partie diffusé dans un format audiovisuel, alors que les méthodes et les outils des professionnels de la veille reposent surtout sur du texte. Et même quand ces discours, interviews et citations existent au format textuel (dans des articles de presse par exemple), ils restent très difficiles à identifier et il est nécessaire d’avoir recours à des requêtes longues et complexes pour explorer tout le champ lexical de la prise de parole. Pour savoir comment rechercher des déclarations au format textuel, on pourra se référer à l’article « Retrouver les déclarations d’une personnalité : sources et méthodes » BASES n° 341 - Octobre 2016 qui reste encore d’actualité pour ce qui est des méthodes proposées.
Deuxièmement, parce que ces sources audiovisuelles restent difficiles à intégrer dans un livrable de veille. Cette étape peut alors nécessiter une écoute longue et minutieuse, une transcription parfois coûteuse, quand il ne s’agit pas de faire soi-même un montage pour en supprimer des extraits… Et tout cela, pour en tirer une ou deux lignes de citations pertinentes, généralement, donc… au format écrit.
Retrouver des discours et déclarations de personnalités publiques issues de sources audiovisuelles représente donc un double défi !
Lire aussi :
Retrouver les déclarations d’une personnalité : sources et méthodes
Contenu d’un nouveau type, parfois éphémère, mais qui s’affirme comme un media d’information « puissant », le podcast d’information est issu à 65 % de la presse écrite. Il est alors conçu soit comme un canal complémentaire, soit comme un véritable produit d’information avec un contenu original (dit natif), que l’on ne retrouve nulle part ailleurs.
En tant que professionnel de l’information, le veilleur est à l’affut de toute information, quel que soit son format. Avec le podcast, il se heurte à une variété de contenus et d’accès dont dépendra la collecte.
Il faut non seulement le collecter, mais aussi le traiter et l’intégrer à sa production documentaire ou à son livrable de veille.
Voir « Les nouveaux formats des médias appellent de nouvelles méthodes et outils de recherche », NETSOURCES n°150, janvier-février 2021
Les contenus multimédias et notamment les vidéos et les podcasts continuent de se multiplier sur le Web et les réseaux sociaux, avec des contenus potentiellement pertinents et professionnels pour la veille et la recherche d’information, que l’on ne retrouve pas nécessairement sous un autre format.
Mais tous ces contenus restent difficiles à appréhender et à intégrer pleinement dans nos processus de veille ou de recherche. À tous les niveaux d’ailleurs, qu’il s’agisse du sourcing, de la collecte, de l’analyse ou de la diffusion.
Trouver ces contenus est un premier défi, car on ne recherche généralement que sur les métadonnées (titre, descriptif, tags), ce qui est très (trop) restrictif. Et les solutions qui indexent en texte intégral et permettent de rechercher efficacement sur le contenu sont généralement onéreuses.
Une fois que l’on a identifié des vidéos a priori pertinentes, les analyser et capitaliser sur leur contenu est un défi tout aussi grand.
C’est à cette phase que nous allons nous intéresser dans cet article avec un outil qui coche pratiquement toutes les cases : Azure Video Indexer qui est gratuit, performant et simple à utiliser.
Lire aussi :
Comment intégrer YouTube dans votre dispositif de veille
Avec le Live Streaming, les médias innovent mais le veilleur souffre
Recherche et veille Radio Télévision : les meilleurs outils
Mediatree veut faire profiter les veilleurs et professionnels de l’information de sa technologie de veille audiovisuelle
La révolution multimédia bouscule la veille
Nous apprenions il y a quelques jours dans un communiqué de presse de l’Union Européenne de Radio-Télévision (UER) que les adresses internet avec une extension
.radio
allaient être mises sur le marché en 2017.
Cela va se faire selon plusieurs vagues successives.
Le but : fédérer la communauté des 65 000 radios hertziennes et des 60.000 webradios dans le monde. A noter qu'une radio devra débourser 200 euros pour acquérir cette extension.
En février et mars 2017, l’UER va sélectionner 80 radios dans le monde parmi celles ayant fait une demande et leur attribuer une extension .radio
. Ce n’est qu’en mai et juin que les autres radios pourront à leur tour postuler.
La veille radio/TV est très différente de la veille Web et presse classique
Réaliser une veille ou une recherche d’informations sur des sources Web, des sites d’actualités ou les réseaux sociaux avec des outils gratuits ou peu chers comme les lecteurs de flux RSS, les systèmes d’alertes Web ou les moteurs de recherche n’est pas une mission impossible.
Néanmoins, cela n’est pas nécessairement optimal notamment quand le volume d’information est important, le sujet ambigu ou que la thématique implique d’avoir accès à des sources payantes.
D’autre part, la légalité de la surveillance de certaines sources est parfois très discutable voire complètement illégal d’où l’intérêt de faire appel à des professionnels pour réaliser la veille ou la recherche d’informations.
Mais dès que l’on souhaite faire une recherche oumettre en place une veille sur des contenus radios ou télévisuels de manière artisanale avec des outils gratuits ou peu coûteux, le degré de difficulté atteint vite des sommets.
Intégrer les émissions de radio et de télévision à la veille et aux recherches d’informations a toujours été un processus compliqué et souvent trop chronophage par rapport au gain observé. A tel point que pendant de longues années, ces contenus n’étaient souvent pas pris en compte dans les prestations de recherche et de veille ou faisaient l’objet de prestations à part.
La nature-même des émissions de radio et de télévision, c’est-dire des contenus multimédia (audio et vidéo) rendent ces contenus difficilement « recherchables ».
Si la société Mediatree a été créée dès 2007 et se proclame « leader de la veille audiovisuelle en France », elle reste pourtant méconnue des professionnels de l’information. Grâce à des technologies de pointe brevetées, cette société française est en mesure de capter et d’indexer en temps réel le contenu de plus de 5 000 chaînes de télévision et radio dans le monde.
Ses premiers clients furent des sociétés de production audiovisuelle désireuses de retrouver des extraits sonores ou vidéo et de pouvoir les réutiliser au sein d’émissions ou de documentaires. Mais ce service a très vite aussi intéressé les responsables de communication au sein de services gouvernementaux, de sociétés de grandes marques ou d’associations, qui souhaitaient disposer d’un outil leur permettant de couvrir les médias audiovisuels pour y réaliser toutes sortes de recherches, de veilles d’image ou de réputation.
La recherche d’information professionnelle de contenus audio va essentiellement porter sur les émissions radios et podcasts d’information.
Pour rechercher sur des contenus radios et podcasts, on retrouve tout d’abord quelques outils communs à la recherche vidéo :
- les sites d’archives audiovisuelles comme l’INA;
- Internet Archive;
- les agrégateurs de presse qui indexent des contenus télé et radio. On notera que Newsdesk propose également des podcasts (1000 au total, mais seulement 3 pour la France).
Lire aussi :
La veille face aux nouveaux médias : podcasts, Stories, Lives, etc.
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Comme nous avons pu le voir, rechercher des contenus multimédias est déjà un défi en soi. Mettre en place une veille sur ces contenus en est un autre.
Les outils de recherche de vidéos, d’images, ou de contenus audio proposent très rarement des fonctionnalités d’alertes et les flux RSS se font plutôt rares ou alors sont très bien cachés.
Sur Dailymotion, les flux RSS existaient il y a encore peu de temps, mais ils étaient bien cachés.
Il suffisait d’ajouter /rss après www.dailymotion.com. Malheureusement, nos récents tests montrent que cela ne fonctionne plus...
Lire aussi :
La veille face aux nouveaux médias : podcasts, Stories, Lives, etc.
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Outils de recherche sur les contenus audios : un segment encore pauvre
Comment valoriser les contenus multimédias dans un livrable de veille ?
En janvier dernier, Digimind a annoncé avoir intégré à sa plateforme de Social Media Monitoring Digimind Social plus de 2 000 sources TV et radio françaises et internationales.
Jusqu’à présent, la plupart des outils de veille qui indiquaient surveiller les contenus TV et radio françaises et internationales ne surveillaient en réalité que les sites Web de ces sources et non les contenus des émissions elles-mêmes. A notre connaissance, le seul autre acteur permettant la surveillance de contenus d’émissions est Talkwalker. Nous les avons contactés mais, pour des raisons de confidentialité, ils n’ont pas souhaité s’exprimer sur le sujet.
La veille et la recherche d’informations audiovisuelles diffèrent considérablement des veilles presse ou Web et, ce en raison même du format de leur contenu.
Certes, les vidéos ou fichiers audio sont aujourd’hui légion sur le Web et il n’est pas difficile de rechercher et d’accéder à des vidéos gratuitement en interrogeant simplement le moteur de vidéos de Google.
Mais cela se complique considérablement quand on souhaite effectuer des recherches ou surveiller le contenu d’émissions ou de vidéos dans leur intégralité afin de savoir si un ou plusieurs termes y ont été cités. Effectuer une recherche textuelle sur du contenu qui ne l’est pas représente alors un véritable challenge...
Davantage présent aux débuts de l’internet, notamment en raison de sa taille limitée, le format audio est devenu depuis plusieurs années déjà le parent pauvre de la recherche d’information, chez les professionnels autant que pour le grand public.
L’explosion de la vidéo, permise notamment par l’augmentation exponentielle de la bande passante disponible, a accaparé l’attention, tandis que des outils de plus en plus efficaces de recherche d’images en ont fait un autre axe central des stratégies de veille (en permettant notamment de repérer des logos de marques dans des images à première vue anodines).
Le son, lui, est passé au second plan.
Les plateformes vidéos de type YouTube ou Dailymotion sont aujourd’hui des éléments incontournables de notre vie privée mais peuvent-elles réellement avoir un intérêt dans un cadre professionnel, notamment pour les professionnels de l’information ?
Quand on pense à YouTube, on pense plutôt clips de musiques, bandes annonces de films, rediffusions de programmes TV ou séries diffusées plus ou moins légalement, youtubers qui font des sketchs et vidéos humoristiques ou bien tutos beauté. Bref, on est très très loin de l’univers de l’entreprise...
Poursuivant notre série d’articles sur les fonctionnalités originales et innovantes des différents serveurs d’information, nous avons choisi de nous attarder ce mois-ci sur la solution Europresse.com, proposée par la société CEDROM-SNI.
Créée en 1989, la société québécoise est présente en France depuis 1999. L’offre disponible sur son agrégateur Europresse vient utilement compléter ce qui est offert chez ses concurrents. Tous les continents sont couverts, avec notamment de nombreuses sources canadiennes, aussi bien francophones qu’anglophones, ce qui s’explique aisément puisque la maison-mère est localisée à Montréal. Europresse propose par ailleurs une grande diversité dans les types de contenus.