L’Open Data fait régulièrement la Une de l’actualité française depuis 2010 avec l’ouverture des premières données publiques dans notre pays.
Nous avons eu plusieurs fois l’occasion de publier des articles dans Bases sur l’Open Data mais il s’agissait surtout de lister les nouvelles initiatives en France et ailleurs dans le monde.
Nous avons décidé qu’il était temps de nous lancer dans un article de fond sur les apports de l’Open Data pour les professionnels de l’information.
Cet article reviendra donc sur le mouvement de l’Open Data en France mais également dans le reste du monde (dates-clés, concepts, etc.), nous nous intéresserons ensuite aux types de données proposées (quels organismes en proposent, est-ce du contenu exclusif et non disponible ailleurs, quel apport comparé à des données payantes, etc.) et nous effectuerons ensuite un focus sur la France avec un panorama des sources aujourd’hui disponibles.
Nous illustrerons tout cela avec une méthodologie de recherche pour retrouver des données sur les gares de voyageurs et de fret en France et dans différents pays européens. Enfin, nous terminerons sur les actualités des derniers mois.
Déjà abonné ? Connectez-vous...
Le département Intellectual Property & Science business de Thomson Reuters a récemment annoncé sa collaboration avec la bibliothèque numérique scientifique russe eLIBRARY.RU. De fait, le Russian Science Citation Index (RSCI qui inclut plus de 600 journaux scientifiques russes) sera désormais inclus dans Web of Science.
Ce même département vient tout juste de publier un rapport intitulé World’s Most Influential Scientific Minds identifiant les chercheurs ayant eu le plus d’impact dans leur domaine. Il est accessible à l’adresse suivante : bit.ly/1JTBE4Z. Les domaines couverts sont les suivants : Agricultural Sciences, Biology & Biochemistry, Chemistry, Clinical Medecine, Computer Science, Economics & Business, Engineering, Environment & Ecology, Geosciences, Immunology, Materials Science, Mathematics, Microbiology, Molecular Biology & Genetics, Neuroscience & Behavior, Pharmacology & Toxicology, Physics, Plant & Animal Science, Psychatry/Psychology, Social Sciences (General), Space Science.
Proquest a récemment numérisé les archives complètes de six journaux féminins américains du 19e et 20e siècle (Better Homes & Gardens, Chatelaine, Good Housekeeping, Ladies’ Home Journal, Parents et Redbook) et propose une base dédiée à leur consultation appelée Women’s Magazine Archive.
A l’occasion de ses 100 ans de parution, le magazine a lancé en partenariat avec Boeing un site permettant d’accéder librement à ses archives (soit 4 500 numéros) à l’adresse archive.aviationweek.com.
L’identifiant ORCID est un numéro unique attribué à chaque auteur scientifique. Il permet ainsi d’identifier facilement un auteur et évite tout risque de confusion avec un autre auteur. Un groupe de 7 éditeurs vient d’ailleurs d’annoncer qu’il exigerait des auteurs l’utilisation de l’identifiant ORCID lors de la soumission de tout article. Il s’agit de The American Geophysical Union (AGU), eLife, EMBO, Hindawi, the Institute of Electrical & Electronics Engineers (IEEE) et the Public Library of Science (PLOS). Si tous les éditeurs venaient à utiliser ce modèle, cela offrirait des possibilités de recherche intéressantes aux professionnels de l’information notamment pour l’identification d’experts.
Depuis le 1er janvier 2016, la version papier du Journal Officiel n’existe plus. Il est désormais uniquement disponible au format numérique.
PANORAMA
• Sources et Ressources sur l’Australie
SERVEURS
• Thomson Reuters élargit la couverture de Web of Science
• Orbit se lance dans la recherche sémantique
• Identifier la contribution de chaque auteur d'une publication scientifique : une idée à développer
SOURCING
• Brèves de contenu – Décembre 2015
AGENDA
• L'édition 2016 de la conférence II-SDV aura lieu à Nice les 18 et 19 avril
• Autres manifestations
ACTUS EN BREF • L’actualité des serveurs, BDD et éditeurs scientifiques
INDEX BASES 2015
Déjà abonné ? Connectez-vous...
Nous poursuivons notre série d’articles sur les ressources pays en nous intéressant cette fois-ci à l’Australie.
L’Australie, bien que plus proche du continent asiatique que du continent européen, a une image très occidentale qui lui vient de son statut de colonie britannique et de son partenariat ancien avec les Etats-Unis. De par sa taille et son importance sur la scène internationale, l’Australie est un pays qui ne manque pas de sources d’informations, fiables de surcroît. La difficulté n’est pas tant d’identifier des sources (elles sont extrêmement nombreuses et toutes anglophones) que de sélectionner les plus pertinentes pour un sujet donné.
L’Australie est un pays dont la bonne santé financière peut faire pâlir bon nombre de pays développés. C’est d’ailleurs le seul pays à ne pas avoir connu de récession durant la crise financière. La croissance a légèrement ralenti en 2013 avec un taux de 2.5% et a atteint 2.8% en 2014. Une croissance similaire est prévue pour 2015. Cette baisse (somme toute limitée) au cours des dernières années s’explique principalement par la baisse des exportations vers la Chine. Pour ce qui est du taux de chômage, il s’élevait à 6.1% en 2014.
Le secteur tertiaire représente 70% du PIB australien mais ce sont les secteurs agricoles et miniers qui dominent les exportations. L’Australie figure d’ailleurs dans le top 10 des producteurs et exportateurs de minerais (elle détient 40% des réserves mondiales d’uranium par exemple). En termes de commerce extérieur, les principaux partenaires commerciaux du pays sont les suivants : l’Asie (avec la Chine en tête), les Etats-Unis et l’Union Européenne. Les exportations françaises vers l’Australie représentaient 2.6 milliards d’euros en 2014 et les importations 0.9 milliard d’euros.
L’Australie présente un potentiel intéressant dans le secteur de l’énergie pour les années à venir. Le pays s’est d’ailleurs engagé à développer le nucléaire pour diminuer ses émissions de gaz à effet de serre. Lors de la récente COP21 (conférence mondiale sur le climat), le pays qui est l’un des plus gros pollueur de la planète, a finalement ratifié l’accord de Paris pour limiter la hausse des températures à 1,5 degré alors qu’il refusait auparavant de descendre en-dessous des 2 degrés.
Déjà abonné ? Connectez-vous...
La Web of Science Core Collection référence la totalité des articles de plus de 12 700 publications de haut niveau ainsi que 160 000 proceedings de conférences et plus de 68 000 livres.
Les critères d’inclusion dans cette collection sont très stricts et prennent en compte de multiples facteurs.
Afin d’élargir cette collection de la façon la plus intelligente possible, Thomson Reuters a décidé de créer une collection complémentaire baptisée ESCI (Emerging Sources Citations Index).
Pour atteindre ESCI, une fois sur la plateforme Web of Science, il faut cliquer sur «More Settings» et choisir Emerging Sources Citations Index.
Déjà abonné ? Connectez-vous...
Orbit ajoute une nouvelle façon de chercher dans son fonds avec une recherche sémantique.
Si Questel est volontairement discret sur l’algorithme utilisé, qui n’est bien sûr pas figé, on peut néanmoins décrire comment cela fonctionne pour l’utilisateur.
Dans le menu à gauche de l’écran, dans la catégorie Recherches, on se voit maintenant proposer une Recherche Sémantique.
Cette option invite l’utilisateur à entrer un texte en anglais d’au moins un paragraphe, ce qui est une nouvelle façon de chercher dans Orbit.
Déjà abonné ? Connectez-vous...
Cette conférence organisée par Dr Haxel CEM, l'organisateur de l'ICIC, et Infonortics son fondateur, est centrée sur les applications des recherches avancées (dans les sources électroniques), le data et text mining et les technologies de visualisation.
II-SDV est organisé sur le même principe que l'ICIC : conférence plénière uniquement (une vingtaine d'orateurs) dans laquelle s'intercalent de brèves présentations des pro- duits visibles dans une petite exposition à coté de la salle de conférence.
Lien : www.haxel.com/ii-sdv
En septembre dernier, Alacra, qui propose de multiples bases de données et également de nombreuses données financières et business, a été racheté par la société Opus Global, un des principaux acteurs de solutions SaaS de mise en conformité. Cela fera l’objet d’un article plus détaillé dans un prochain numéro de Netsources.
Dun & Bradstreet a récemment noué un partenariat avec Docusign pour développer une app dédiée à la due diligence disponible sur la plateforme AppExchange de Salesforce.
EBSCO et Biblibre collaborent sur un logiciel Open Source à destination des bibliothèques françaises et européennes. Le partenariat permettra de renforcer l’interopérabilité entre EBSCO Discovery Service (EDS) et le logiciel Koha déployé par la société Biblibre en France depuis 2002.
Le contenu de la base de donnée BASE (gérée par la Bielefeld University – Voir Bases n° 312 – Février 2014), qui indexe des millions de documents en open access dans le domaine académique peut maintenant être recherché via EBSCO Discovery Service.
LexisNexis a récemment lancé une nouvelle version de Nexis (la partie information business du serveur). Il est désormais possible de dédoublonner les articles reçus dans les alertes (ce qui n’était possible auparavant que dans la recherche et les pages de résultats), la configuration des alertes a été facilitée et optimisée et une fonctionnalité de partage des alertes a également été ajoutée.
Proquest améliore la visibilité des thèses et mémoires disponibles dans la base ProQuest Dissertations & Thèses Global. Le serveur a récemment noué plusieurs partenariats avec d’autres fournisseurs d’information pour rendre ces contenus plus visibles et plus facilement accessibles. Ainsi, les références de thèses pourront apparaître dans les résultats de Ei Compendex ou encore Philosopher’s Index.
Pour les bibliothèques, Proquest a lancé à la rentrée la base d’archives Newspapers.com Library Edition qui offre un accès à plus de 3000 titres de presse américains et du monde entier avec une antériorité remontant au début du 18e siècle jusqu’au début des années 2000.
Proquest travaille également sur un nouveau modèle pour la diffusion d’ebooks à destination des bibliothèques. L’idée étant de proposer aux bibliothèques un catalogue plus vaste en matière d’ebooks mais de ne facturer que ceux réellement consultés par les usagers des bibliothèques.
Proquest a récemment racheté le groupe Ex-Libris, une société spécialisée dans les solutions d’automatisation de bibliothèques.
Pubmed et Pubmed Central ont ajouté de nouveaux filtres de recherche permettant de limiter la recherche aux contenus sous license Creative Commons.
A la rentrée, SAGE a lancé une nouvelle base appelée Business Stats qui regroupe plus de 4000 séries de données couvrant aussi bien des données démographiques que des données sur les salaires, le taux de chômage, les brevets et les marques, les ventes, etc. au niveau mondial. La majorité de ces données sont issues de sources propriétaires comme par exemple Woods & Poole et incluent des projections jusqu’à 2040.
Thomson Reuters prévoit d’explorer « différentes options stratégiques » pour sa division Intellectual Property & Science qui regroupe notamment les produits Web of Science, Thomson CompuMark, Thomson Innovation, MarkMonitor, Thomson Reuters Cortellis et Thomson IP Manager. En d’autres termes, Thomson Reuters pourrait bientôt chercher à vendre cette division pour se concentrer toujours un peu plus sur l’aspect business et juridique.
Cette même division a lancé au cours du mois de septembre un nouveau site appelé The State of Innovation (http://stateofinnovation.thomsonreuters.com) qui permet de suivre les tendances en matière d’innovation. On y trouve notamment le top 100 des entreprises innovantes.
La base de données Thomson Reuters Embargoed Research Collection (analyses sociétés et marchés par les analystes financiers/brokers) est maintenant accessible en Pay as you Go pour les utilisateurs de ProQuest Dialog. La recherche est gratuite et l’utilisateur ne paye que pour les documents visualisés. (pour plus de détails, voir l’article Retour en force de Dialog dans les rapports d’analystes – Bases n°331 – Novembre 2015).
L’outil de gestion bibliographique Mendeley a récemment introduit de nouvelles fonction- nalités. L’outil offre désormais un système de recommandation d’articles basé sur les documents/articles présents dans la bibliothèque de l’utilisateur. Un module de statistiques a également été ajouté permettant ainsi aux chercheurs de connaître le nombre de visualisation de leurs articles, le nombre de citations, etc. Enfin, les pages de profil des utilisateurs ont été améliorées.
Le concept de recommandation est décidément à la mode. Springer vient également d’introduire un système de recommandation pour les articles présents dans SpringerLink. Pour le moment, cela ne s’applique qu’aux documents présents dans la rubrique « biotechnology » mais il est prévu que cela soit étendu à toutes les collections. Le système est intéressant puisqu’il utilise le moteur de recherche sémantique UNSILO. Au-dessous de chaque article, on trouve dans un premier temps les différents concepts identifiés au sein de l’article. Le lecteur peut ensuite sélectionner un ou plusieurs concepts et visualiser des articles contenant des concepts similaires.
L’office des brevets et marques américains (USPTO) a récemment lancé une nouvelle plateforme de visualisation et d’analyse des brevets appelée Patents View (http://www.patentsview.org). Elle permet d’effectuer des recherches avec une antériorité de 40 ans.
L’office de brevets européens (EPO) quant à lui a ajouté le moteur EspaceNet à la version mobile de son site Web permettant ainsi aux utilisateurs d’effectuer des recherches directement depuis leurs smartphones.
Il ne se passe pas un jour sans que l’on n’entende parler des fameux altmetrics, ces nouveaux indicateurs proposés comme alternative au facteur d’impact des journaux qui prennent en compte le comptage des citations mais aussi les aspects sur les impacts de la publication sur les réseaux sociaux.
Science Open, le réseau social scientifique a développé un partenariat avec la société Altmetric pour afficher ces nouveaux indicateurs sur les 10 millions d’articles scientifiques présents sur sa plateforme.
De son côté, l’entreprise Altmetric a ajouté une nouvelle fonctionnalité sur ses outils Altmetric Explorer et Altmetric for Institutions permettant aux utilisateurs de pouvoir effectuer la recherche et filtrer les résultats sur les identifiants ORCID (code alphanumérique qui permet d’identifier de manière unique les chercheurs et auteurs de contributions académiques et scientifiques).
La British Library a récemment mis en ligne plus d’un million d’images libres de droits extraites de livres des XVIIe, XVIII et XIXe siècles. Elles sont accessibles sur Flickr à l’adresse http://bit.ly/1Npi6nb.
Une bibliothèque numérique dédiée aux œuvres théâtrales françaises du domaine public a récemment été lancée. Elle s’appelle Libre Théâtre et est accessible à l’adresse http://libretheatre.fr/.654 œuvres sont pour le moment disponibles. Le site proposera dans un second temps, pour chaque œuvre, des ressources complémentaires, libres d’utilisation : éditions remarquables, informations et objets relatifs à des représentations, analyses et critiques…
On note également le lancement d’une autre bibliothèque contenant plusieurs centaines d’ouvrages libres ou du domaine public appelée FramaBookin (http://framabookin.org). Elle a été développée par l’association Framasoft qui se consacre majoritairement au logiciel libre.
Deux éditeurs (BioMed Central avec GigaScience et Ubiquity Press avec Journal of Open Research Software) innovent en proposant pour chaque article des « Contributionship Badges for Science » (paper badgers) précisant pour chaque auteur sa contribution précise à l’objet de l’article.
Cela peut être une information inédite par exemple pour savoir qui s’est occupé de tous les problèmes informatiques liés à une expérience.
Aujourd’hui, nous en sommes au tout début concernant le nombre de publications scientifiques prises en compte, mais on peut souhaiter que cette pratique se développe rapidement.
PANORAMA
• Où et comment trouver des études de marché sur la France?
MÉTHODOLOGIE
• De l’intérêt des grands réseaux sociaux pour la veille
CARNET
• Retour en force de Dialog dans les rapports d'analystes
SERVEURS
• I²KN, une base de connaissance inspirée par la méthode TRIZ
• Articles de presse : Factiva étend la recherche de tonalité à de nouvelles langues
Déjà abonné ? Connectez-vous...