La possibilité de combiner les étapes de recherche est un outil très puissant, très utile pour des recherches complexes.
Cette fonctionnalité, longtemps et toujours présente sur les serveurs traditionnels, est aujourd’hui peu courante, voire inexistante, chez les agrégateurs de presse.
On peut certes toujours y utiliser parenthèses et opérateurs pour combiner différents concepts, mais cela s’avère rapidement compliqué.
Il est beaucoup plus simple, élégant et performant d’utiliser la combinaison d’étapes.
Comme nous l’avons vu dans le précédent post : "Veille à l’international : les bases de données spécialisées", effectuer des recherches d’information ou des veilles à l’international exige une connaissance précise des sources disponibles.
Après nous être intéressés aux bases de données fournies par les grandes organisations internationales, nous nous focalisons cette semaine sur les grandes sources et bases de données internationales payantes.
Il s’agit exclusivement d’entreprises privées qui produisent et surtout agrègent, grâce à de multiples partenariats, des données sur la plupart des pays du monde.
Rappelons que Factiva est un des principaux acteurs sur le marché des agrégateurs de presse. Il permet d'interroger plusieurs dizaines de milliers de titres de presse en France et à l'international ainsi que des sources Web (sites d'actualités, blogs, etc.) et est utilisé par un grand nombre de professionnels de l'information et de la veille dans le monde.
Lorsque l'on cherche dans Factiva les articles écrits par une personne donnée, il est extrêmement tentant de chercher le nom de cet auteur dans le filtre auteurs.
Et c'est là que se situe justement le piège! En effet, pour qu'une personne figure dans le filtre auteurs, il faut qu'elle ait écrit au moins quatre articles dans la même publication pendant une période de trente jours.
Cela limite donc de fait la liste à des journalistes professionnels ou à des chroniqueurs très réguliers.
On peut néanmoins rechercher tous les articles écrits par une personne donnée moins prolifique, il suffit pour cela d'écrire by=Prenom Nom.
Toujours bon à savoir pour éviter des désillusions inutiles.
Auteur : François Libmann, Directeur de Publication
Dans le cadre d’une recherche d’information dans un pays que l’on ne connait pas ou peu, la question du sourcing se pose inévitablement. Que l’on soit dans une recherche ponctuelle ou dans une démarche de veille, identifier les sources importantes est primordial et se fera en deux temps.
En effet, une première phase d’acquisition de connaissances inhérente au capital informationnel dudit pays est nécessaire avant de démarrer la construction de son corpus de sources.
Lire aussi :
Sourcing, de la théorie à l’épreuve de la pratique
Sourcing : peut-on faire l’impasse sur les recherches en langue locale ?
Comment identifier des sources d’information locales ?
Les obstacles à la recherche d’informations financières d’entreprises à l’étranger
L’acteur historique de l’accès numérique à la presse française a changé discrètement de nom courant mars. Mais ce changement de nom est le reflet d’une mutation plus profonde qui a démarré il y a plusieurs années.
Né en 1989 de la fusion de G.Cam serveur et Juridial, sous le nom de l’Européenne de Données à l’époque, il a été l’un des premiers à offrir un accès en ligne aux grands quotidiens comme Le Monde ou aux dépêches de l’AFP. Racheté en 1991 par ORT, il continue alors à être commercialisé sous sa marque. Lorsque Reuters rachète ORT en 1999, l’Européenne de Données ne fait pas partie du rachat et est reprise à titre personnel par les fondateurs d’ORT. C’est en 2004 que L’Européenne de Données adopte le sigle EDD, plus facile à utiliser.
Qu’il s’agisse de trouver des données macro-économiques, des statistiques, des données démographiques, etc., il est souvent préférable de débuter avec des sources et outils spécialisés sur ce type de données , comme nous avons pu le voir dans le précédent article « Méthodologie et outils pour la recherche de statistiques».
Malheureusement, ces grandes sources ne permettent pas toujours de répondre à l’ensemble des besoins informationnels. Des moteurs de recherche classiques peuvent guider l’internaute vers les données dont il a besoin ou bien il faut se tourner vers des sources bien plus spécialisées.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Trouver des informations financières : un exercice de recherche coûteux en efforts et en ressources
Economiser du temps grâce aux outils d’extraction de données
Le terme « agrégateur de presse » est indissociable de la recherche d’information presse mais il revêt aujourd’hui de multiples dimensions.
A l’origine, le terme faisait exclusivement référence aux agrégateurs de presse payants comme Factiva, Nexis, Press’edd, etc. qui fournissaient un outil de recherche mais également un accès au texte intégral à tous les articles de presse qu’ils indexaient.
Aujourd’hui, la grande majorité de ces acteurs intègrent des contenus plus larges (blogs, médias sociaux, sites, etc.) et se contentent pour certaines sources de crawler les sites Web sans donner accès au texte intégral.
Lire aussi :
Quelles alternatives crédibles à Google Actualités en 2020 ?
Les agrégateurs de presse payants ont-ils toujours de la valeur ?
Nous avons pu voir dans l’article « Google Actualités : la tendance n’est pas au beau fixe » de ce dossier spécial que Google Actualités s’avérait de plus en plus décevant dans un contexte professionnel et que de récentes annonces ne faisaient d’ailleurs que venir noircir un peu plus le tableau.
Des alternatives gratuites à Google Actualités existent depuis des années… mais jusqu’ici aucune n’était réellement satisfaisante.
Lire aussi :
Les agrégateurs payants ont-il toujours de la valeur ?
Google Actualités : la tendance n’est pas au beau fixe
Face à la dégradation de Google Actualités et à l’absence d’alternatives réelles en matière d’agrégateurs de presse gratuits, on pourrait être tenté de considérer que seuls les agrégateurs de presse payants peuvent permettre de réaliser de bonnes recherches d’information sur la presse.
Sur le papier, leurs corpus de sources continuent de s’enrichir et se diversifier avec les années et les fonctionnalités de recherche expertes restent présentes tandis que de nouvelles se développent.
Les agrégateurs de presse payants sont-ils aujourd’hui la seule solution pour réaliser des recherches d’information de qualité ? Ou bien à l’image des agrégateurs de presse gratuits, eux aussi seraient-ils en réalité sur une pente descendante ?
Lire aussi :
Google Actualités : la tendance n’est pas au beau fixe
Quelles alternatives crédibles à Google Actualités en 2020 ?
Presse, réseaux sociaux, contenus multimédias, littérature scientifique, données ... : rechercher sur des contenus très disparates
Newsdesk, le produit LexisNexis à mi‑chemin entre un agrégateur de presse et une plateforme de veille, change de nom et devient Nexis Newsdesk.
Ce changement est effectif depuis novembre.
Lire aussi :
BASES N°244 de Décembre 2007 à commander en direct en nous écrivant à : Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.
Alors que des services comme Netflix pour la vidéo à la demande ou Spotify pour la musique sont devenus incontournables auprès des internautes, cela fait des années que revient régulièrement l’idée d’un « service de streaming » de la presse, basé sur un abonnement mensuel low-cost avec un accès illimité à un grand nombre de titres de presse.
En France, l’idée n’est pas nouvelle et tout avait commencé il y a quelques années avec des kiosques numériques à l’image de lekiosque.fr (qui vient d’être rebaptisé Cafeyn), SFR Presse ou encore E-presse. Mais ces services avaient, à leurs débuts, vocation à vendre des numéros de journaux et magazines à l’image des kiosques à journaux physiques.
Toute bonne veille ou recherche d’information requiert un corpus de sources qualifiées et représentatives pour un sujet donné sous peine de réaliser des analyses biaisées.
Mais en matière de sources, rien n’est jamais acquis, du moins jamais pour très longtemps.
L’accès aux médias, notamment la presse économique et les revues scientifiques académiques, est de plus en plus « instable » pour les professionnels de l’information avec des modèles d’accès (gratuit, payant, freemium, ouvert, fermé, présent dans des agrégateurs et bases de données, etc.) qui ne cessent d’évoluer.
Lire aussi : Veille et recherche d'information : toutes les sources et tous les articles n ont pas la même valeur
La recherche d’information et notamment ses outils et méthodes, ne cesse d’évoluer. C'est le cas avec les outils gratuits dont nous avons fait un panorama dans le dernier BASES (la recherche d'information au mille visages). Il est temps maintenant d’aborder la question des outils de recherche payants comme les serveurs, bases de données ou agrégateurs de presse.
Car si le paysage des acteurs n’a pas tant changé au cours des dernières années, à l’exception des nouveaux outils liés à l’exploration du Web ouvert et des médias sociaux, les technologies et la façon d’utiliser les outils de recherche professionnels payants ont quant à elles beaucoup évolué.
Si la veille et la recherche d’information professionnelle restent avant tout des activités réalisées le plus souvent sur « grand écran » au bureau, il n’en reste pas moins que les pratiques évoluent vers plus de mobilité.
Les professionnels de l’information sont parfois amenés à devoir suivre en temps réel certaines problématiques sensibles ou à risque, et ce, quel que soit l’endroit où ils se trouvent.
D’autre part, pour réaliser sa propre veille métier, cruciale pour rester au courant des dernières tendances, des évolutions et des nouveautés liées à la veille, la recherche d’information ou plus largement tout ce qui a trait à l’infodoc, il n’est plus toujours possible de le réaliser sur son temps de travail au bureau. Ainsi, de nombreux lecteurs de BASES et NETSOURCES nous indiquent qu’ils lisent nos revues papier dans les transports en commun !
Lire aussi :
Recherche-t-on différemment à l’heure du « Mobile First » ?
Les challenges qui attendent les professionnels de la veille et de la recherche d’information en 2019
« Rechercher l’information stratégique sur le web » : votre nouveau guide au quotidien
Rechercher l’information stratégique sur le web
Aux antipodes de la plateforme MyTwip que nous avons présentée dans l’article précédent, LexisNexis Business Information Solutions (BIS) avec son produit Newsdesk propose également un positionnement original sur le marché de la veille.
Si, en apparence, la plateforme Newsdesk se rapproche le plus des plateformes de social media monitoring comme Digimind Social, Brandwatch, Visibrain et autres, elle occupe en réalité un positionnement unique qui s’explique en grande partie par son héritage historique.
L’interface de Google Actualités (https://news.google.fr) a été profondément remaniée au mois de mai.
L’occasion pour nous de présenter ces nouveautés et évolutions ainsi que leur impact sur la recherche d’information et la veille, en en pesant le pour et le contre du point de vue du professionnel de l'information, sur différents aspects : interface, intégration de l'intelligence artificielle, collection de contenus, accès direct au payant,...
Derrière cette nouvelle version, se cache-t-il un changement de stratégie ?
Pour répondre à la demande grandissante des utilisateurs en termes d’analyse de données et de représentation graphique de ces données (dataviz), les grands agrégateurs de presse ont depuis quelques années déjà, intégré des modules spécifiques dont le but revendiqué est de faciliter l’analyse quantitative d’un grand corpus d’articles sur des critères prédéfinis, et ce, en seulement « quelques clics ».
Ces fonctionnalités supplémentaires sont supposées apporter un vrai plus, en premier lieu par le gain de temps généré, mais également en terme de valorisation de l’information, avec un contenu attirant et immédiatement assimilable.
La recommandation de contenus prend une place toujours plus importante dans l’univers du Web avec l’accroissement de la recommandation humaine, lié d’une part, au développement des médias sociaux et des outils du Web 2.0 et d’autre part, à la multiplication des systèmes et algorithmes de recommandations automatiques, grâce aux progrès de l’informatique d’abord et plus récemment de l’intelligence artificielle.
Quand on pense aux systèmes de recommandations, on pense en premier lieu aux sites d’e-commerce tels que Amazon qui nous propose des produits similaires à ceux que nous consultons ou susceptibles de nous intéresser, Netflix qui nous recommande des séries et des films qui pourraient nous plaire ou encore Spotify qui nous signale des morceaux et artistes correspondant à nos goûts musicaux.
Mais aujourd’hui, la recommandation est partout et il ne se passe pas un mois sans que l’on ne voie surgir une nouvelle fonctionnalité ou de nouveaux outils grand public et professionnels nous promettant de nous faire découvrir automatiquement des contenus nouveaux qui pourraient nous intéresser et nous faire sortir de notre bulle informationnelle ou des contenus similaires à ce que nous consultons.
Les thèmes traités dans cet article sont :
Lire aussi dans notre dossier spécial :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web
Nous avons effectué récemment une recherche dans la presse française sur les tiques, des acariens plutôt désagréables, responsables en particulier de la transmission de la maladie de Lyme.
Pour chercher dans la plus large couverture de la presse française, nous avons utilisé Pressedd.
A notre surprise nous avons trouvé, pour la période du 1er au 30 juin 2017, 1 343 réponses, incluant d’éventuels doublons, de même que des articles identiques publiés dans différentes éditions de quotidiens régionaux.
La veille et la recherche d’informations audiovisuelles diffèrent considérablement des veilles presse ou Web et, ce en raison même du format de leur contenu.
Certes, les vidéos ou fichiers audio sont aujourd’hui légion sur le Web et il n’est pas difficile de rechercher et d’accéder à des vidéos gratuitement en interrogeant simplement le moteur de vidéos de Google.
Mais cela se complique considérablement quand on souhaite effectuer des recherches ou surveiller le contenu d’émissions ou de vidéos dans leur intégralité afin de savoir si un ou plusieurs termes y ont été cités. Effectuer une recherche textuelle sur du contenu qui ne l’est pas représente alors un véritable challenge...
Après avoir abordé la question de la formation, nous avons choisi d’explorer le monde professionnel pour mieux comprendre les évolutions majeures s’étant opérées au cours des dernières années autour de la question des bases de données professionnelles.
Pour cela, nous avons interrogé les éditeurs et producteurs de bases de données, les professionnels de l’information via un sondage en ligne, et enfin recueilli les témoignages de plusieurs managers aux seins de services d’information.
Quand on pense recherche d’informations ou veille, ce qui vient en premier lieu à l’esprit pour identifier ou interroger des sources, c’est souvent la stratégie suivante :
. recherche sur le Web sur le sujet et notamment sur Google
. interrogation et surveillance des médias sociaux pour repérer des informations et des sources non trouvées sur le Web
. interrogation des grandes sources d’informations payantes comme les agrégateurs de presse ou les bases de données professionnelles (Factiva, EBSCO, etc) qui permettent d’accéder à une grande partie des informations payantes sur le Web.
Dans le numéro de Bases de Septembre 2016 (n°340), nous avions abordé la question de l’évolution des modes de recherche sur Google ainsi que sur les autres moteurs de recherche.
Il en ressortait que quoi qu’en disent certaines personnes et experts, la recherche booléenne n’était pas encore morte mais que la façon d’interroger les moteurs de recherche web évoluait considérablement notamment suite au développement récent de la recherche sémantique.
Nous avons cherché à savoir si cette tendance s’appliquait également au monde des outils de recherche et de veille professionnels comme les serveurs, les agrégateurs de presse ou encore les plateformes de veille.
Retrouver les dernières déclarations d’une personnalité, rassembler les discours parus dans la presse sur une thématique précise, … voici des problématiques auxquelles peuvent être régulièrement confrontés les professionnels de l’information.
Pourtant, cette entreprise n’a rien d’aisé, loin de là. Même si les déclarations sont souvent mises entre guillemets et/ou en italiques dans les textes et articles qui les relatent, il n’existe pour autant aucun moyen simple et direct pour identifier ces éléments, que ce soit en utilisant des moteurs de recherche ou des bases de données et agrégateurs de presse.
Le 24 août dernier, Elsevier annonçait le lancement de Datasearch, un moteur de recherche de données scientifiques multisectoriel en libre accès. L’outil fonctionne comme un moteur classique et interroge des sources scientifiques et répertoires institutionnels. Elsevier explique avoir voulu aider les chercheurs à gagner du temps dans leurs recherches car les moteurs de recherche généralistes ne sont pas forcément les plus adaptés pour identifier de l’information très spécialisée et ne se limitent pas à des sources d’information qualifiées et reconnues.
Ainsi, Datasearch indexe pour le moment les tableaux, figures et données supplémentaires associées aux articles publiés sur ScienceDirect, arXiv et PubMed Central ainsi que le contenu de NeuroElectro, Dryad, PetDB, ICPSR, Harvard Dataverse et ThemoML.
Pour le moment Datasearch n’est pas un produit commercial mais Elsevier indique que le business model n’est pas encore finalisé. Impossible donc de savoir comment va évoluer le produit dans les mois et années à venir et s’il va rester en libre accès.
Factiva a récemment lancé une application Iphone permettant de suivre l’actualité en tout lieu et à tout moment. Cette application donne accès aux alertes, newsletters et actualités issues des titres présents dans Factiva. Il est possible de sauvegarder les articles pour les lire plus tard sans avoir de connexion internet.
La base de donnée Inspec (littérature scientifique et technique) est désormais accessible sur Proquest (nous rappelons qu’elle était déjà accessible depuis bien longtemps sur la plateforme Proquest Dialog et sur STN).
Proquest a également lancé récemment neuf bases de données régionales avec plus de
3 000 titres de revues académiques (business, science, sciences humaines et sociales, médecine, etc.). Les neuf bases sont les suivantes : Australie & Nouvelle Zélande, Europe continentale, Europe de l’Est & Europe Centrale, Asie de l’Est et du Sud, Inde, Amérique latine et péninsule ibérique, Afrique & Moyen-Orient, Turquie, Royaume-Uni & Irlande.
Pickanews a été créé en 2009 par Press Index, société qu’a rachetée Kantar Media en 2013.
Plateforme de veille d’information plurimedia, Pickanews a été disponible sans changement jusqu’à la fin juillet 2015 et était utilisée par des milliers de visiteurs.
Elle disposait d’une partie gratuite très controversée par les éditeurs du point de vue de la règlementation concernant les droits de copie. Elle permettait en effet de visualiser autour du terme de recherche, quelques lignes des articles répondant à la requête avec leur titre et date de publication ainsi qu’une vignette représentant l’ensemble de l’article mais de façon volontairement illisible.
Que ce soit pour une veille ou une recherche d’informations, la presse reste une source privilégiée.
Néanmoins, on constate fréquemment que de nombreux articles de presse se contentent de reprendre le contenu d’une dépêche ou d’un communiqué de presse soit à l’identique, soit en modifiant le titre et en reformulant quelques phrases.
Or, s’il peut être intéressant pour un service communication de visualiser l’ensemble des retombées sur un sujet (événement, actualités de l’entreprise, etc.), dans la majorité des autres cas, il n’y a aucun intérêt à visualiser des dizaines voire des centaines d’articles répétant strictement la même chose. C’est même une perte de temps…
Factiva vient d’annoncer que les recherches de tonalité (positive ou négative) d’un article étaient étendues à plusieurs langues.
Cette possibilité qui était jusqu’alors limitée aux documents en anglais est maintenant disponible pour le français, le russe, l’italien, l’espagnol et l’allemand.
Pour y accéder à partir de la recherche experte, il faut cliquer sur la flèche bleue devant « Recherche des Experts Factiva », puis sur le premier choix « Analyse de la tonalité des articles ».