Nous avons effectué récemment une recherche dans la presse française sur les tiques, des acariens plutôt désagréables, responsables en particulier de la transmission de la maladie de Lyme.
Pour chercher dans la plus large couverture de la presse française, nous avons utilisé Pressedd.
A notre surprise nous avons trouvé, pour la période du 1er au 30 juin 2017, 1 343 réponses, incluant d’éventuels doublons, de même que des articles identiques publiés dans différentes éditions de quotidiens régionaux.
En examinant les résultats, il est apparu qu’un très grand nombre, plus de 60 % (!), étaient tout à fait hors sujet : ils étaient en effet sélectionnés parce qu’un mot comme politique ou pratique était coupé en deux et apparaissait écrit de la façon suivante : «poli-tique» ou «pra-tique». On trouve ainsi 116 fois l’expression «poli-tique» et 84 fois l’expression «pra-tique» soit respectivement 8,64 % et 6,25 % du total, ce qui nous paraît tout à fait excessif surtout sur une période d’un mois.
Déjà abonné ? Connectez-vous...
Le gouvernement canadien propose un site terminologique qui vient en complément des nombreuses possibilités existantes comme, tout simplement, l’offre traduction de Google et les possibilités proposées par l’OMPI (Organisation Mondiale de la Propreté Intellectuelle) ou Worldnet.
Nous évoquions ce sujet dans notre article « Des outils pour enrichir le vocabulaire d’une recherche en anglais » (Bases n° 342, novembre 2016).
Pour en savoir plus : https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra
Nous avons décidé d’introduire dans chaque numéro de BASES une nouvelle rubrique « RETOUR D’EXPERIENCE » dans un but de partage d’expériences entre professionnels de l’information qui exercent un même métier mais avec des réalités très diverses et dans des secteurs très différents : évolutions du métier au travers d’une expérience concrète, innovations dans les pratiques, découvertes de nouvelles sources d’informations, astuces et méthodes de recherche et de veille, vision de l’avenir du métier, etc.
Pour ce numéro, nous avons interviewé Fanny Glassier, documentaliste/chargée de formation à KEDGE Business School à Bordeaux.
Après une licence en Sciences de l’Education, Fanny Glassier se tourne vers un DUT Documentation d’entreprise à Bordeaux il y a 20 ans et trouve rapidement un poste de documentaliste à BEM (Bordeaux Ecole de Management), aujourd’hui KEDGE Business School.
Après vingt ans au sein de la bibliothèque, elle consacre aujourd’hui 70 % de son temps à la formation. Il y a vingt ans, la bibliothèque ne proposait pas d’activité formation.
Sur les huit membres de l’équipe, elle gère seule le service formation de la Kedge Library.
Face aux besoins des utilisateurs en matière de formation documentaire et à la multiplication des bases de données spécialisées (l’école est aujourd’hui abonnée à une vingtaine de bases), Fanny Glassier travaille depuis une dizaine d’années au développement d’un catalogue de formations documentaires allant du généraliste au spécialisé. Il peut s’agir aussi bien de formations en groupes que de formations individualisées.
Au fil des ans, elle a suivi de nombreuses formations dédiées à la recherche d’information mais aussi à la formation de formateurs.
Elle dispense aujourd’hui une centaine d’heures de formation chaque année.
Déjà abonné ? Connectez-vous...
Claritive Analytics qui a racheté les activités Propriété Intellectuelle de Thomson vient d’acquérir Publons et sa plateforme à destination des chercheurs pour partager, discuter et mettre en valeur le travail des reviewers. Le CEO de Claritive a ainsi annoncé que l’entreprise souhaitait investir dans des solutions d’analytics et d’optimisation des workflows pour aider ses clients à accélérer leur processus d’innovation.
LexisNexis a récemment lancé une base de données appelée LexisNexis Media Contacts Solution qui recense plus de 800 000 contacts médias dans plus de 200 pays. Cette base permet ainsi d’identifier des journalistes et influenceurs.
Du côté de l’information business et financière, les opérations de rachat et partenariats se font nombreuses.
Nous apprenions récemment le rachat de Bureau Van Dijk (Orbis, Diane, Zehyr, etc.) par l’agence de notation Moody’s pour 3.3 milliards de dollars. Pour Moody’s, l’opération a pour but d’étendre ses activités « en services d’analyse de risques et d’évaluation analytique ».
Dun&Bradstreet vient d’annoncer un partenariat avec Microsoft afin de donner accès aux données de D&B via les services cloud de Microsoft et notamment Microsoft Dynamics 365.
L’éditeur de solutions prédictives SideTrade a racheté C-Radar, une start-up fondée en 2011 permettant d’identifier des entreprises et qualifier des prospects grâce à une base de 4.6 millions de sociétés.
Google vient d’annoncer l’arrêt d’Instant Search, qui permettait d’afficher à la volée les résultats de recherche au fur et à mesure de la saisie de la requête. L’intérêt pour les professionnels de l’information étant quasi-nul, on ne se désolera pas de cette disparition.
Le géant américain a également lancé un moteur dédié aux offres d’emploi appelé « Google Carrières » dans sa version française. Dans cette dernière, on ne trouve cependant que des offres émanant de Google pour le moment...
Enfin, le moteur d’images de Google propose depuis peu de nouveaux filtres de recherche dans sa version mobile et desktop. On pourra ainsi limiter aux dernières images ajoutées, aux formats GIFs ou Clip-art ou encore limiter aux images d’une certaine couleur.
Bing permet de sauvegarder des résultats de recherche pour les lire et consulter plus tard. Cela fonctionne pour les images et les vidéos. Il suffit pour cela de cliquer sur la petite icône + disponible sur chaque image et vidéo.
Facebook va proposer une nouvelle fonctionnalité, en test pour le moment, consistant à suivre des sujets (photographie, théâtre, etc.) et non uniquement des pages. Il semblerait que l’idée derrière cette fonctionnalité soit liée à la mise en lumière des « fake news » : en suivant une thématique, les internautes auraient ainsi accès à plusieurs articles sur un même sujet et potentiellement des articles avec des points de vue différents. De quoi développer l’esprit critique et sortir de sa bulle informationnelle...
Dans la gamme des outils de veille gratuits ou freemium, on notera le lancement de Custodee, un outil de surveillance de pages Web. L’outil permet de suivre les changements sur une page ou une zone spécifique sur la page. En plus de la réception d’alertes, il est possible d’exporter les résultats au format jpeg ou excel.
Lors de son lancement, l’outil proposait une version gratuite très limitée qui a d’ores et déjà disparu... 3 offres coexistent : 10$/mois pour 10 urls, 19$/mois pour 25 urls et 39$/mois pour 100 urls.
Du côté des grosses plateformes de veille, plusieurs actualités sont à noter :
PANORAMA • Veille et recherche d’information audiovisuelle : panorama de l’offre
RETOUR D’EXPÉRIENCE • De l’excellence opérationnelle à une externalisation maîtrisée
AGENDA • ICIC 2017 en octobre à Heidelberg
OUTILS DE VEILLE
• Collecter des informations dans les flux RSS : Inoreader vs Lexis Newsdesk, le match
BREVETS • L'INPI lance un service de cartographie des inventions
Déjà abonné ? Connectez-vous...
La veille et la recherche d’informations audiovisuelles diffèrent considérablement des veilles presse ou Web et, ce en raison même du format de leur contenu.
Certes, les vidéos ou fichiers audio sont aujourd’hui légion sur le Web et il n’est pas difficile de rechercher et d’accéder à des vidéos gratuitement en interrogeant simplement le moteur de vidéos de Google.
Mais cela se complique considérablement quand on souhaite effectuer des recherches ou surveiller le contenu d’émissions ou de vidéos dans leur intégralité afin de savoir si un ou plusieurs termes y ont été cités. Effectuer une recherche textuelle sur du contenu qui ne l’est pas représente alors un véritable challenge...
Nous avions consacré un article à « la recherche d’information audio sur le Web » dans le n° 343 de BASES (décembre 2016) mais nous avions volontairement mis de côté la recherche de mots-clés au sein d’émissions de télévision ou radio.
Dans cet article, nous avons choisi d’explorer les différentes possibilités pour réaliser des veilles et recherches d’informations au sein des contenus d’émissions de télévision ou de radio. Est-il possible de la faire de manière gratuite ou presque ou bien est-il forcément nécessaire de recourir à des prestataires et outils spécialisés ? Quelles méthodes adopter ? Que trouve-t-on en la matière chez les agrégateurs de presse traditionnels comme Pressedd, Europresse, Factiva ou LexisNexis ? Quels sont les prestataires spécialisés en France et vers qui se tourner dans le cas de besoins à l’international ?
Pour pouvoir effectuer une recherche textuelle au sein de contenus audiovisuels, cela suppose que l’éditeur des contenus ou un prestataire externe mette à disposition des transcriptions écrites (transcripts en anglais) sous la forme de contenu html, fichier texte, word ou pdf par exemple ou bien propose un outil/moteur recourant à la technologie du speech to text.
« La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale ou speech to text) est une technique informatique qui permet d’analyser la voix humaine captée au moyen d’un microphone pour la transcrire sous la forme d’un texte exploitable par une machine. » (Source : Wikipédia).
A titre d’exemple, CNN propose les transcripts de ses émissions au format html : http://transcripts.cnn.com/TRANSCRIPTS.
La chaîne de télévision M6 propose, quant à elle, un moteur spécialisé utilisant la technologie du speech to text permettant d’effectuer des recherches sur le contenu de ses émissions et de visualiser l’extrait où apparaît le mot-clé (https://www.m6videobank.fr).
Autre préalable : l’antériorité. S’agit-il de surveiller les nouveaux contenus citant un mot, une marque, etc. ou bien d’effectuer des recherches sur des contenus récents ou datant de plusieurs dizaines d’années ? Et l’on constatera au long de cet article que rechercher au sein d’émissions de télévision et radio anciennes est souvent bien plus compliqué que pour du contenu récent.
Enfin, pour le cas de solutions payantes, il faudra bien se renseigner sur ce que la « surveillance des vidéos, radios et TVs » englobe réellement.
La majorité des outils de recherche et de veille indiquent disposer de vidéos, radios et TV dans leur corpus. En réalité, peu d’entre eux sont réellement capables de surveiller des mots-clés au sein d’une émission de télévision ou radio. La plupart se contentant de surveiller le contenu textuel du site Web des radios et TVs ou les métadonnées des vidéos (titre de la vidéo, descriptif, date de publication, etc.).
Déjà abonné ? Connectez-vous...
Marie-Laure Chesne-Seck est actuellement consultante pour le cabinet Ourouk, spécialisé en management de l’information. Après une carrière de chercheur en biophysique, elle gère l’information scientifique, puis crée une fonction d’« Intelligence Scientifique » pour le public R&D d’un grand groupe pharmaceutique.
Au travers d’une série de trois articles, je souhaitais partager mon expérience de transformation de la fonction info-doc au sein de la R&D d’un grand groupe pharmaceutique.
Rappelons que la feuille de mission qui m’était confiée était large, et comportait notamment la gestion de la transition avec l’offre de service de l’ancienne fonction info-doc, en accompagnant l’autonomisation des publics, la mise en place d’une offre d’« Intelligence scientifique » en support de la prise de décision, l’AMOA1 et l’animation de systèmes d’information collaboratifs, et la gestion intelligente d’un budget destiné à l’outsourcing d’une partie de l’activité.
Lire aussi:
De la recherche d’information vers l’analyse à valeur ajoutée
Le « kit de départ » de la fonction « Intelligence Scientifique », qui m’avait été confié, comportait un budget à gérer pour activer des prestataires extérieurs si nécessaire, lesquels prestataires compléteraient mon « équipe », puisque je débutais seule sur la fonction. Dans mon cas, l’ensemble des motivations ci-dessus étaient présentes, puisqu’en plus de me trouver en situation d’effectif réduit, je devais créer une offre de services, tout en étant novice sur certains aspects.
Déjà abonné ? Connectez-vous...
La manifestation ICIC semble s’être fixée à Heidelberg … lieu de résidence de Christophe Haxel son organisateur.
L’édition 2017 qui se tiendra du dimanche 22 octobre au soir au mardi 24 est dans la ligne des précédentes éditions avec une conférence alternant présentations «scientifiques» et présentations de produits, sans sessions parallèles, le tout accompagné d’une petite exposition.
Les thèmes abordés dans la conférence concerneront le deep learning, l’intelligence artificielle, l’utilisation des brevets tant pour le développement que pour l’analyse.
Plusieurs conférences concerneront aussi spécifiquement la chimie avec des conférenciers issus d’acteurs connus comme ChemAxon, InfoChem ou Minesoft.
On notera, par ailleurs, que Christophe Haxel qui organise aussi la manifestation II SDV, dédiée au data mining et dataviz, lance une nouvelle manifestation en Inde à Bangalore les 2 et 3 novembre 2017 baptisée II-PIC 2017 qui signifie International Indian Patent Information Conference for Patent Information Professionals.
Lien : www.haxel.com
Le processus de veille s’appuie dans bien des cas sur une collecte multi-supports, impliquant une large variété de sources.
Cependant, une grande partie des informations est retrouvée dans des sources d’information de type presse/actualités qu’on peut classer globalement en deux grandes catégories de supports.
D’une part, les sources dites « PRINT », qui sont l’équivalent numérique de ce qui est publié sous forme papier et qu’on peut consulter et surveiller via des serveurs professionnels classiques comme Factiva, Pressedd, Europresse ou LexisNexis ; d’autre part, les sources « ONLINE » ou « WEB » parmi lesquelles on distingue notamment :
Ce contenu correspond à ce qui est diffusé en ligne, mais qui peut pour partie doublonner avec les médias imprimés (par exemple le contenu du quotidien Le Monde, et celui du monde.fr).
Pour capter ce contenu offert en ligne, plusieurs solutions s’offrent au veilleur :
Les outils ne manquent pas pour suivre les flux RSS, il existe en effet depuis de nombreuses années un choix important de lecteurs de flux offrant plus ou moins de possibilités. Cependant, au sein de cette offre pléthorique, deux systèmes innovants se distinguent à nos yeux, et ont de ce fait retenu notre attention :
Au-delà d’un constat de solutions technologiques très différentes, existe-t-il une valeur ajoutée à traiter les flux RSS de façon intégrée au sein d’un agrégateur comme LexisNexis ou bien est-il plus efficace et pratique de les analyser au sein d’un outil dédié tel que Inoreader ? Pour tenter d’apporter un éclairage, nous nous sommes focalisés plus précisément sur les facilités respectives des deux systèmes pour administrer ou gérer l’ajout de flux RSS, sur la comparaison des résultats générés par l’un ou l’autre moyen, et enfin sur l’aspect collaboratif.
Déjà abonné ? Connectez-vous...
L’INPI (Institut national de la propriété intellectuelle) a profité du salon Viva Tech pour lancer son nouveau service de cartographie des inventions.
Cette approche de création de paysages (exemple en Figure 1) avec montagnes, vallées, océans dans lesquels sont positionnés les brevets d’un secteur précis est loin d’être une nouveauté.
Figure 1. Exemple de « Patent landscape »
Cela fait, en effet, de nombreuses années que des serveurs comme Orbit Intelligence ou STN proposent de réaliser de tels paysages.
Déjà abonné ? Connectez-vous...