Avec les années, les réseaux sociaux prennent de plus en plus d’importance dans le processus de veille et de recherche d’information et Facebook ne déroge pas à la règle.
Seul problème, Facebook n’est absolument pas conçu pour la veille et la recherche professionnelle et s’avère beaucoup plus difficile à intégrer dans son process que certains de ses concurrents et notamment Twitter. En mars dernier, Facebook a lancé une nouvelle interface pour tous ses utilisateurs à travers le monde. Si le design et l’ergonomie ont bien évidemment évolué ce qui affectera peu le veilleur, quelques fonctionnalités de recherche et filtres ont également changé.
Lire aussi :
« Facebook incontournable pour la veille et la recherche ? Fantasme ou réalité ? »
Après plusieurs mois pendant lesquels le coronavirus occupait la majorité des actualités de la veille et de la recherche d’information avec de nouvelles ressources et de nouveaux outils dédiés, on sent bien que la vie professionnelle reprend progressivement son cours avec le lancement de nouveaux outils et de nouvelles fonctionnalités et l’aboutissement de projets en cours.
Il y a quelques mois, nous avions eu l’occasion de parler d’un nouvel outil 2D Search qui permet de créer ses requêtes sur des moteurs et bases de données en 2 dimensions. L’idée étant que les requêtes peuvent être parfois longues et complexes et sont propices aux erreurs. En créant sa requête sous forme de blocs combinables, la requête est plus lisible et plus facilement modifiable. À l’époque, l’outil intégrait déjà Google, Google Scholar (même si nous ne recommandions pas son utilisation sur la suite Google), Bing, Pubmed et quelques autres.
Lire aussi :
Des outils pour optimiser ses stratégies de recherche
Nous avions, avec Philippe Bodart (Total Research & Technology, Feluy-CFIB) déploré dans un précédent numéro de BASES la baisse régulière depuis plusieurs années du nombre d’articles d’origine asiatique référencés dans les bases de données/agrégateurs/serveurs occidentaux ».
Le producteur de Chemical Abstracts Services nous avait à cette occasion, expliqué que le nombre de brevets déposés dans cette zone croissait fortement et qu’ils avaient, au moins pour un temps, privilégié les brevets par rapport à la littérature. Les références à cette dernière étant supposées, à terme, ré-augmenter suite à l’embauche de nouveaux experts.
Nous avions annoncé alors que nous explorerions les bases de données de certains de ces pays avec l’aide du bureau Asie de l’OEB (Office Européen des Brevets) à Vienne que nous tenons à remercier ici.
Lire aussi :
Forte chute des références d’articles en langue asiatique dans Chemical Abstracts
DBpia (DataBase Periodical Information Academic - https://www.dbpia.co.kr ) a été lancée en octobre 1998 sous forme d’un CD-Rom mais est passée à Internet dès l’année suivante.
De nombreux développements ont été réalisés régulièrement. Le dernier en date (en 2019), a vu une réorganisation complète du site et le remplacement du moteur de recherche.
DBpia se présente comme la première base de données de contenus académiques d’origine coréenne à destination, en priorité, des universités coréennes.
La « Korean Association of Medical Journal Editors » (KAMJE) offre une série de services gratuits donnant accès au contenu de publications coréennes couvrant la médecine, les soins dentaires, les soins infirmiers, et les soins vétérinaires, ainsi que la nutrition.
On peut considérer que le point central est la base de données d’abstracts KoreaMed qui, en août 2017, référençait plus de 260 000 articles publiés par 256 éditeurs membres de KAMJE (derniers chiffres disponibles).
Pour l’année 2019, on trouve plus de 12 000 références dont environ 9 000 à des publications en anglais et environ 3 000 à des publications en coréen.
Dans KoreaMed, on dispose d’une recherche simple et d’une recherche avancée laquelle permet de combiner plusieurs lignes de recherche avec les opérateurs AND, OR ou NOT. Dans chaque ligne, on a le choix entre la recherche dans tous les champs ou bien de choisir dans une douzaine de champs. On dispose aussi de filtres, en particulier sur la langue de l’article, anglais ou coréen.
RISS International (http://intl.riss.kr/) est une banque de données produite par le KERIS (Korea Education and Research Information Service), un organisme appartenant au ministère coréen de l’Éducation.
Les missions du KERIS sont multiples autour d’un concept mêlant éducation et information numérique.La production et la diffusion de la banque de données RISS font partie de ses missions.
Elle propose plus de 6 millions d’articles dont près de 30% proviennent de KERIS même et les autres de « commercial vendors », principalement de DBpia, Scola, et Kiss, plus de 2 millions de thèses provenant de 227 universités coréennes, plus de 9 millions de livres, pas nécessairement d’origine coréenne, ainsi que quelques rapports de recherche.
Koreascience (Koreascience.or.kr) est produite par The Korea Institute of Science and Technology Information (KISTI). Celui-ci a beaucoup évolué depuis sa création en 1962 sous le nom de KORSTIC (Korea Center for Science and Technology Information).
Cet organisme met à disposition des Coréens la plateforme NDSL, qui propose environ 100 millions de documents de toutes natures et de toutes origines, tant au niveau des brevets non coréens, que de la littérature. Cela a donc peu d’intérêt pour des utilisateurs européens qui disposent de beaucoup d’autres sources plus faciles d’accès.
En cette période particulière, l’actualité de la veille et de la recherche d’information est très différente du paysage habituel. Une majorité des actualités et informations traitent des ressources d’information autour du coronavirus, la gratuité temporaire de certains outils et sources d’information ainsi que du thème du télétravail.
Knoema et Statista sont deux plateformes fournissant des quantités importantes de données statistiques issues de milliers de sources. Elles couvrent différents secteurs, marchés ou encore pays.
Les deux plateformes se positionnent à première vue sur un même marché similaire. Pourtant, il existe entre elles des différences non négligeables et elles ne répondent pas aux mêmes besoins.
Les professionnels de l’information sont souvent à la recherche de données chiffrées, qu’il s’agisse de données financières, de tarifs, de statistiques, de données douanières, de taille ou capacité de production d’usines, de données démographiques, de données géographiques, etc.
Ces données souvent cruciales ne sont pas simples à identifier et éparpillées à travers le Web sur une grande diversité de supports.
Dans ce numéro de NETSOURCES, nous avons choisi de nous intéresser exclusivement aux données chiffrées et de faire le point sur ce type de recherche un peu particulier :
Lire aussi :
Comment rechercher des données chiffrées sur Google et moteurs de recherche généralistes ?
Trouver des informations financières : un exercice de recherche coûteux en efforts et en ressources
Economiser du temps grâce aux outils d’extraction de données
Depuis deux ou trois ans, le nombre de nouveaux outils pour la recherche d’information scientifique et technique est en nette progression, ce qui est une bonne nouvelle. Et cerise sur le gâteau, la majorité de ces outils fonctionne sur un modèle de gratuité.
La principale raison de cette prolifération d’outils est simple : il y a d’une part le développement de l’open science (articles scientifiques en open access, ouvertures des données de la recherche) qui fournit une matière précieuse au développement de nouveaux projets et outils et d’autre part les récentes avancées de l’IA qui permettent de proposer des outils d’un nouveau genre.
En 2020, la trajectoire semble se confirmer et de nouveaux outils de recommandation automatique de contenus appliqués à l’IST ont récemment fait leur apparition.
Nous avons choisi dans cet article de faire le point sur ces nouveaux outils de recommandation de contenus en l’occurrence Meta, Scitrus, Sparrho et CoCites.
Lors de recherches ou de veilles sur le Web, il n’est pas rare de rencontrer des documents ou des pages Web comportant un gros volume de données chiffrées que l’on souhaite récupérer. Il peut s’agir par exemple de tableaux sur un site internet, d’informations au sein d’un fichier PDF protégé, etc.
Malheureusement, il est souvent impossible de copier-coller l’ensemble de ces données de façon simple et rapide.
S’ensuit alors une longue séance de Ctrl C-Ctrl V pour extraire manuellement les informations utiles... Mais ce temps peut être considérablement réduit grâce à un outil d’extraction de données.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Comment rechercher des données chiffrées sur Google et moteurs de recherche généralistes ?
Trouver des informations financières : un exercice de recherche coûteux en efforts et en ressources
Pour interroger le Web visible, les professionnels de l’information continuent d’utiliser principalement Google, tout simplement parce que la pertinence des résultats reste bien supérieure à celles de ses concurrents.
La majorité des alternatives apparues au cours des dernières années se concentrent sur le respect de la vie privée à l’image de Qwant, DuckDuckGo, Ecosia, etc. Et malheureusement pour les professionnels de l’information, aussi intéressant que cela puisse être, cela n’améliore en rien la qualité et la pertinence des résultats. C’est même plutôt l’inverse...
Mais Google de son côté, même s’il reste meilleur, change très rapidement et ne cesse de se dégrader du point de vue de la recherche d’information professionnelle. Il faut bien l’admettre, nous ne sommes pas et ne serons jamais son public cible !
Il est donc crucial de continuer à chercher des alternatives ou du moins des compléments à nos outils actuels et notamment Google pour interroger le Web de surface, mais aussi accéder au Web profond.
Sur ce sujet, la France n’est pas la plus mal lotie avec de nouveaux outils venant se positionner sur de nouvelles façons de rechercher de l’information. Au cours des derniers mois, nous en avons repéré trois nouveaux, très différents dans leurs approches, stratégies et modèles économiques : Geotrend, Needle, Netguide.
Lire aussi :
Rechercher différemment - Dossier Spécial
La recherche d’information par géolocalisation
Tracer ses recherches pour gagner en expertise et en productivité
Quand il s’agit d’effectuer des recherches bibliographiques ou de réaliser une revue de littérature, Google Scholar apparaît généralement en tête de liste chez les chercheurs, universitaires, étudiants et même certains professionnels de l’information.
Une réalité qui est particulièrement surprenante, la rigueur de la démarche de recherche scientifique semblant a priori incompatible avec le mode de recherche très pauvre, proposé par Google Scholar dans des amas d’informations non structurées, et dont on ne connaît pas les contours.
Lire aussi dans ce dossier :
La perversité de Google Scholar
Recherche et veille sur la littérature scientifique et académique : nouveaux entrants et ressources-clés
L’interface de Google Actualités (https://news.google.fr) a été profondément remaniée au mois de mai.
L’occasion pour nous de présenter ces nouveautés et évolutions ainsi que leur impact sur la recherche d’information et la veille, en en pesant le pour et le contre du point de vue du professionnel de l'information, sur différents aspects : interface, intégration de l'intelligence artificielle, collection de contenus, accès direct au payant,...
Derrière cette nouvelle version, se cache-t-il un changement de stratégie ?
Les plateformes de recherche d’art antérieur en matière de brevets ne manquent pas, qu’elles soient payantes ou gratuites, mais la plupart ne proposent que des informations sur les brevets déposés dans la plupart des offices de brevet dans le monde et dans la très grande majorité des cas, il n’y a pas de contenu non brevet (NPL pour Non Patent Literature), sauf éventuellement dans les références citées qui peuvent parfois servir de clés de recherche ( par exemple préfixe /REF qui n’est pas dans le menu déroulant dans Orbit).
Bien sûr, cette littérature non brevet est par ailleurs largement accessible sur certains serveurs de littérature scientifique et technique comme Proquest Dialog ou STN, mais il n’y a pas vraiment d’intégration entre les deux types d’information même si l’on peut utiliser le même langage de requête sur la même plateforme.
L’habitude est prise par beaucoup de démarrer une recherche sur un sujet scientifique non familier dans Wikipedia, et plus généralement sur le Web l'éditeur Elsevier a lancé récemment ScienceDirect Topics pour proposer une alternative.
Cette «couche» créée par Elsevier, ajoutée à son produit ScienceDirect vise à répondre à ces questions de premier niveau qui ne sont en général pas traitées dans les articles scientifiques disponibles sur la plateforme car ils sont trop pointus. Elsevier considère, en effet, que ces réponses de premier niveau peuvent plutôt se trouver dans des chapitres de sa collection d’e-books constituée, en particulier d’encyclopédies et d’ouvrages de référence.
Lighthouse IP est une société néerlandaise créée en 2006 ayant de nombreux bureaux dans le monde. Son objectif est d’être la plus exhaustive possible dans le recensement de l’information sur les brevets et les marques.
En matière de brevets, Lighthouse IP couvre en texte intégral plus de 65 offices dans le monde. Ce texte intégral est dans la langue d’origine accompagné de traductions machine en anglais. Les deux versions sont « recherchables ».
La couverture inclut, en particulier, l’essentiel des offices asiatiques et sud américains.
Le Portail de l’IE, « centre de ressources et d’information sur l’intelligence économique et stratégique » a mis en ligne mi-janvier un comparatif des logiciels de veille disponibles sur le marché français. Cette initiative est intéressante à plus d’un titre...
Créé par le Club Webtechno de l’AEGE (Anciens de l’Ecole de Guerre Economique) sous la houlette de Guillaume Sylvestre et Antoine Violet-Surcouf, ce comparatif se veut évolutif et collaboratif : les éditeurs mais aussi les spécialistes de la veille, sont encouragés à signaler de nouveaux outils ou des précisions sur ceux qui y figurent déjà. D’une quarantaine de solutions de veille au moment de la mise en ligne, le comparatif est passé à ce jour à plus d’une cinquantaine.
Facebook a, depuis ses débuts, l’image d’un réseau social grand public orienté vers la sphère privée avec, de fait, un intérêt limité pour la veille et la recherche d’information, à l’exception des veilles d’opinion, marketing ou encore d’e-réputation où l’on se focalise justement sur l’opinion publique.
Depuis quelques années, Facebook propose de nouvelles fonctionnalités et innovations qui l’ont fait progressivement entrer dans la sphère professionnelle, quitte à marcher dans certains cas sur les plates-bandes de Twitter ou encore de LinkedIn. Mais Facebook est-il pour autant devenu un terrain de chasse incontournable pour tous les professionnels ?
Avention : un acteur historique de l’information business en Amérique du Nord
Depuis plus de 30 ans, la société Avention (ex-OneSource jusqu’en 2014) est un acteur clé de l’information business et plus précisément l’information sur les entreprises, industries et marchés.
Son marché principal est historiquement en Amérique du Nord mais l’entreprise est également présente dans le reste du monde et notamment en Europe. L’entreprise dispose d’ailleurs de bureaux à Londres pour couvrir le continent européen avec des équipes maîtrisant les différentes langues dont le français. Elle reste néanmoins peu connue en France.
La vie de l’INIST n’a pas été un long fleuve tranquille et les remises en cause ou les questionnements sur sa vocation et ses produits et services n’ont pas manqué. Hors de la sphère publique (l’INIST est un établissement du CNRS), l’INIST était essentiellement connu pour deux produits, Pascal et Francis et un service, Refdoc.
Pascal et Francis sont deux banques de données, la première spécialisée en sciences, technologie, médecine et la seconde couvrant 15 disciplines en sciences humaines et sociales. Francis était particulièrement appréciée aux Etats-Unis où elle n’avait pas tellement d’équivalent.
On reconnait bien souvent un professionnel de l’information à son utilisation intensive et souvent experte des opérateurs booléens et autres opérateurs avancés.
Chaque question est ainsi décortiquée, traduite en une liste de mots-clés avec leurs variantes et synonymes et combinés entre eux avec des opérateurs booléens et de multiples opérateurs avancés (termes dans la même phrase, termes cités au moins n fois, opérateurs de proximité, etc.).
Les autres professions ont quant à elles généralement tendance à méconnaître ces différentes fonctionnalités et à préférer des requêtes en langage naturel.
EMIS est une base de données spécialisée dans l’information concernant les marchés émergents (données économiques et financières sur les entreprises, les pays et les industries). Elle appartient au groupe Euromoney Institutional Investor plc.
Nous avions déjà eu l’occasion de lui consacrer un article en 2013 qui s’intitulait « EMIS : une clé d’accès aux marchés émergents » (Bases n° 303 - Avril 2013).
Mais en trois ans, le produit a bien changé avec notamment une nouvelle interface et une meilleure couverture.
L’apparition et le développement de startups constituent une tendance forte aussi bien en France que dans le monde.
Il n’est d’ailleurs pas simple de définir précisément ce qu’est une startup. On peut en fait remarquer qu’il n’existe pas vraiment de définition standard de ce qu’est une startup, les définitions pouvant varier selon les sources.
Par exemple, pour Wikipedia, la startup est une jeune entreprise innovante à fort potentiel de croissance qui fait souvent l’objet de levées de fonds, alors que pour les créateurs de l’outil Sourcinno que nous verrons plus loin, une startup est une entreprise innovante avec potentiel de croissance et un modèle relativement déployable à l’international. On comprendra, au vu de ces définitions, qu’il n’est pas évident de faire, a fortiori de façon automatisée, une sélection parfaite de startups.
A l’automne 2015, Twitter a ouvert au grand public son outil de curation de contenu appelé -sans grande originalité- Curator (qui n’a absolument rien à voir avec l’outil de curation français El Curator).
L’outil déjà accessible à une poignée de professionnels depuis mai 2015, a pour ambition de répondre à un besoin majeur des professionnels de l’information : la possibilité de mettre en place des requêtes complexes afin de pouvoir trouver l’information pertinente sur Twitter et de la diffuser ensuite.
Pickanews a été créé en 2009 par Press Index, société qu’a rachetée Kantar Media en 2013.
Plateforme de veille d’information plurimedia, Pickanews a été disponible sans changement jusqu’à la fin juillet 2015 et était utilisée par des milliers de visiteurs.
Elle disposait d’une partie gratuite très controversée par les éditeurs du point de vue de la règlementation concernant les droits de copie. Elle permettait en effet de visualiser autour du terme de recherche, quelques lignes des articles répondant à la requête avec leur titre et date de publication ainsi qu’une vignette représentant l’ensemble de l’article mais de façon volontairement illisible.
Pour poursuivre notre série d’articles sur les outils de veille orientés médias sociaux nous nous intéresserons à la solution Digimind Social, lancée en octobre 2013 par l’éditeur français.
Plus globalement, Digimind, « leader en social media monitoring », est connu pour ses deux logiciels : Digimind Social et Digimind Intelligence.
A ce jour, l’entreprise compte plus de 200 clients et est présent en France comme à l’international, et ce dans plusieurs secteurs (Télécoms, Banque et Assurance, Pharmaceutique, Retail, Tourisme). Elle a récemment été sélectionnée dans le nouveau Top 100 des sociétés du Digital Content.
Depuis le 29 octobre dernier, les utilisateurs de Pressedd, « première plateforme de presse française », ont vu apparaitre un certain nombre de nouveautés sur le service.
Le premier changement est visuel, puisqu’un nouveau graphisme, plus élégant et plus moderne, est venu habiller l’interface tout en restant dans les couleurs corporate de Pressedd, le rouge et le gris.
Le premier objectif de ce relooking était de répondre à quelques retours de clients pour donner à la plateforme plus de clarté et de lisibilité, mais aussi plus d’efficacité sur la signalétique : de nouveaux pictogrammes déclinent les différentes fonctionnalités offertes (recherche, veilles, panoramas, dossiers etc…) et il est désormais plus facile de voir dans quelle partie on évolue, grâce à un jeu de surbrillance et de contrastes plus visibles.
Northern Light a maintenant une vingtaine d’années et durant ces vingt ans il a pris plusieurs virages stratégiques.
Il a même appartenu quelques temps à Divine avant la débâcle financière de celui-ci, ce qui a permis le rachat à bon prix de Northern Light par son ancien PDG.
Nous avons parlé dans le numéro 293 de BASES (Mai 2012) du « nouveau Northern Light » et rappelé son histoire. Le principal produit de Northern Light est son portail d’entreprises baptisé SinglePoint qui agrège tant du contenu externe que du contenu interne. Il utilise son propre moteur de recherche et propose aussi du data mining.