SciELO (Scientific Electronic Library Online) est un programme de coopération internationale dont l’objectif est le développement du libre accès aux publications scientifiques des pays latino-américains, des Caraïbes, de l’Espagne et du Portugal. Ce libre accès est une ligne d’action prioritaire depuis 2019 de ce programme et l’objectif est que tout le contenu soit en libre accès d’ici à la fin de 2025. Un autre objectif est le développement du multilinguisme entre le portugais, l’espagnol et l’anglais, l’anglais étant de plus en plus présent pour augmenter la visibilité et la reconnaissance à l’international de ces publications. SciELO est aussi et surtout une banque de données bibliographique qui propose aujourd’hui 1 219 260 références bibliographiques.
Née au Brésil en 1997 avec le soutien de plusieurs organismes publics, SciELO intègre aujourd’hui les publications de 19 pays à savoir le Brésil, le Mexique, la Colombie, le Chili, l’Argentine, Cuba, l’Espagne, l’Afrique du Sud, le Portugal, le Venezuela, Costa Rica, la Bolivie, l’Uruguay, l’Équateur, le Paraguay et les Antilles. Le Brésil en fournit à lui seul plus de 42 % suivi par le Mexique, la Colombie et le Chili. On trouve en dernière position le contenu en provenance des Antilles avec 1,6 pour mille (1 979 références), anecdotique mais présent. Plus précisément, en ce qui concerne les Antilles, le seul contributeur est The University of The West Indies à la Jamaïque qui publie le West Indian Medical Journal, lequel est disponible aussi sur Scopus, Web of Science, EBSCO ainsi que les bases de données Embase et Biosis.
Si 2023 a été l’année de ChatGPT et de la déferlante de nouveaux outils dopés à l’IA générative, 2024 sera celle de l’intégration de l’IA générative dans les outils traditionnels du pro de l’info. Explorez avec nous les diverses innovations des acteurs traditionnels en matière d’IA et interrogeons-nous sur la pertinence de délaisser les outils IA de la cuvée 2023 au profit des outils classiques.
En 2023, l’arrivée de ChatGPT et de l’IA générative a conduit les professionnels de l’information à adapter leur arsenal d’outils pour marier habilement les outils traditionnels (qu’ils soient grand public, tels que les moteurs de recherche Web, ou spécialisés, tels que les outils de veille et bases de données) avec les nouveaux outils boostés par l’IA générative (résumés automatiques, assistants IA, dialogues avec des PDFs ou vidéos, etc.).
Aujourd’hui, c’est cette même panoplie traditionnelle qui intègre progressivement des fonctionnalités d’IA générative, avec des annonces nombreuses et difficiles à suivre.
Lire aussi :
La vague d’outils IA pour l’Information Scientifique et Technique (IST)
Une veille peut s’effectuer sur un très grand nombre de sources telles que les publications dans différents types de presse (généraliste, scientifique…), le web et, en particulier Google ou des sites spécialisés, les réseaux sociaux, les visites de foires et salons, les conférences…
Dans un très grand nombre de cas, particulièrement pour la veille technologique et concurrentielle, il ne faut surtout pas négliger les différentes dimensions de la propriété industrielle : brevets, marques ainsi que dessins et modèles.
Tout d’abord, précisons le vocabulaire, car il y a un fort risque de confusion.
On rappellera en premier lieu qu’un brevet est une sorte de contrat entre l’État en général et un inventeur. En échange de l’exclusivité de l’usage d’une technologie sur une durée pouvant, en général, aller jusqu’à 20 ans, la description de cette technologie est rendue publiquement accessible, après une période de 18 mois, et constitue une information scientifique/technique.
Le titulaire du brevet peut exploiter lui-même sa technologie ou décider s’il autorise un/des tiers à l’exploiter et, dans ce cas, sous quelles conditions (vente du brevet, concession d’une licence).
Nous avions évoqué le rachat de Proquest par Clarivate dans le numéro 392 de BASES (mai 2021) en présentant les deux sociétés et les conséquences possibles de cette acquisition.
Clarivate a annoncé le bouclage de l’opération, qui a été légèrement retardée.
Nous attendons maintenant l’annonce des changements qui ne manqueront pas de se produire.
Lire aussi :
L’acquisition de Proquest par Clarivate ne paraît pas si simple
Le rachat de Proquest par Clarivate : quelles conséquences pour le monde de l’information ?
Chaque année la National Library of Medecine (NLM) fait évoluer son célèbre thesaurus MeSH (Medical Subject Headings) avec ajout, suppression ou modification des termes.
La version 2017 est maintenant disponible et la banque de données accessible sur plusieurs serveurs va être entièrement rechargée avec cette version. Le rechargement sur Dialog Proquest est annoncé pour le 15 janvier prochain (bases de données MEDLINE et ToxLine).
Auteur : François Libmann, Directeur de publication
Scopus, la base de données bibliographique d'Elsevier, vient de lancer CiteScore qui est un outil d'évaluation des publications basé sur le nombre de citations.
Le calcul est simple : pour l'année 2015, par exemple, CiteScore compte les citations en 2015 de documents de tous types publiés en 2012, 2013 et 2014 et référencés dans Scopus, à l'exclusion des articles "in press" qui ne comportent pas de référence.
Des métriques complémentaires à CiteScore sont également disponibles.
Elsevier, qui produit ces outils, fait remarquer que 11 000 publications sur les 22 256 référencées (sans compter les livres) ont un CiteScore et pas de "Journal Impact Factor".
Lien : https://journalmetrics.scopus.com
Auteur : François Libmann, Directeur de Publication
Il est possible, maintenant, depuis une référence, d'accéder à des données qui lui sont liées, présentées dans un "repository" externe. Lorsque ces dernières sont disponibles, un ou plusieurs lien(s) apparaît/apparaissent dans le tableau de détails présent à droite de la référence, après les références citées/citantes.
D'autre part il est maintenant possible de chercher sur le nom des organismes qui ont financé la recherche dont les résultats font l'objet de l'article référencé.
Il faut, pour cela, cliquer sur "recherche avancée" sur l'écran de recherche et écrire Fund-all (mot de recherche).
Auteur : François Libmann, Directeur de la publication
Proquest Dialog s’allie à la société Gridlogics, une société également américaine, spécialisée dans les logiciels dans le domaine des brevets et de la propriété intellectuelle. Gridlogics propose en particulier la plate-forme PatSeer, dédiée à la recherche brevet associée à des outils d’analyse et de visualisation.
Les utilisateurs de Proquest Dialog, qui offre déjà une collective significative de banques de données brevet se verront proposer une nouvelle interface.
François Libmann, Directeur de la publication
Proquest Dialog enrichit son offre dans le domaine de l'économie.
En effet, après une très longue absence, la base de données EconLit est de nouveau disponible sur Proquest Dialog. Produite par l'American Economic Association, cette base propose des références bibliographiques avec résumés et indexation depuis ...1986.
Les sujets couvrent l'ensemble du champ économique à travers des articles de publications, des thèses, des livres et des "working papers". La couverture est internationale.
Auteur : François Libmann, Directeur de publication
Les "patent landscapes" sont des études détaillées d'un domaine technologique relativement précis comme, par exemple les technologies relatives au micro algues, la production d'huile de palme et les technologies de traitement des déchets ou l'industrie pharmaceutique australienne.
Ces études sont réalisées à partir d'un corpus de brevets pertinents qui sont analysés de multiples façons avec un grand nombre de représentations visuelles dont les fameux paysages fait de montagnes et de vallées.
On pourra trouver ces "patent landscapes" sur le site de l’OMPI.
Auteur : François Libmann, Directeur de publication
Questel est, depuis plusieurs années, une société en fort développement.
En effet, si, en avril 2015, elle comptait environ 140 salariés, 3 000 clients et 100 000 utilisateurs, en mars ces chiffres sont devenus 1 400 salariés, 15 000 clients et plus de 1,5 million d’utilisateurs.
Cette croissance importante est due pour une bonne part à l’acquisition d’un grand nombre de sociétés offrant des produits et/ou des services dans le domaine de la propriété intellectuelle (voir notre article « Questel double sa taille avec plusieurs acquisitions en 2021» dans ce même numéro).
L’ensemble de ces acquisitions a été réalisé avec le soutien de fonds de Private Equity.
Ce souci de développement ne pouvait, bien sûr, mettre de côté l’utilisation de l’intelligence artificielle.
Lire aussi :
Brevets : les évolutions d’Orbit
Les "combination sets" dans la classification des brevet
Contentieux de brevets et marques : Clarivate Analytics rachète darts-ip
Depuis l’annonce en mai 2021 du rachat de Proquest par Clarivate , tout semblait se passer sans trop de problèmes pour cette acquisition qui concernait tant ses bases de données que les logiciels destinés aux bibliothèques et à différents services des entreprises.
Clarivate et, dans une moindre mesure, Proquest ont déjà racheté de nombreuses entreprises.
Clarivate, en particulier, a racheté récemment Decision Resources Group, Customer First View, CPA Global, et Darts-ip, ce dernier étant spécialisé dans les litiges de propriété intellectuelle
Il semble que ces opérations de rachat se sont passées sans problèmes majeurs. Manifestement, ce n’est pas le cas pour le rachat de Proquest par Clarivate.
Lire aussi :
Le rachat de Proquest par Clarivate : quelles conséquences pour le monde de l’information ? , BASES n°392, mai 2021
Contentieux de brevets et marques : Clarivate Analytics rachète darts-ip , BASES n°377, janvier 2020
Dialog devient une source pour l’open access avec la base Publicly Available Content , BASES n°394, juillet-août 2021
Lancée en 2013, la recherche sur les valeurs numériques est une des valeurs ajoutées, originale, de l’offre du serveur STN qui propose, rappelons-le, un ensemble de banques de données dans le domaine de la littérature scientifique (références bibliographiques) et des brevets (références bibliographiques ou fulltext).
Le nombre de propriétés recherchables jusqu’à présent était de 55 telle que la charge électrique (en Coulomb), la force (en Newton), la fréquence (en Hertz), la masse moléculaire (en g/mol), la pression (en Pascal), etc.
On en trouve la liste en cherchant HELP NPS si l’on est connecté à STNext et plus précisément à une des bases offrant cette possibilité.
Sinon, on trouvera la liste à l’adresse http://www.stn-international.de/en/productsservices/products-services.
Nous avions, avec Philippe Bodart (Total Research & Technology, Feluy-CFIB) déploré dans un précédent numéro de BASES la baisse régulière depuis plusieurs années du nombre d’articles d’origine asiatique référencés dans les bases de données/agrégateurs/serveurs occidentaux ».
Le producteur de Chemical Abstracts Services nous avait à cette occasion, expliqué que le nombre de brevets déposés dans cette zone croissait fortement et qu’ils avaient, au moins pour un temps, privilégié les brevets par rapport à la littérature. Les références à cette dernière étant supposées, à terme, ré-augmenter suite à l’embauche de nouveaux experts.
Nous avions annoncé alors que nous explorerions les bases de données de certains de ces pays avec l’aide du bureau Asie de l’OEB (Office Européen des Brevets) à Vienne que nous tenons à remercier ici.
Lire aussi :
Forte chute des références d’articles en langue asiatique dans Chemical Abstracts
Dès 1995, le CHU de Rouen s’est intéressé aux sites web en langue française concernant la santé puis à la littérature médicale en langue française et a acquis une notoriété certaine. Nous avons choisi dans cet article de nous intéresser aux différents outils documentaires qu’il propose.
Cet intérêt du CHU de Rouen a débouché, dans un premier temps, sur le projet de Catalogue et Indexation des Sites Médicaux de langue française (CISMeF) qui a été réalisé par l’équipe qui appartient aujourd’hui au D2IM (Département d’Informatique et d’Information médicale du CHU hôpitaux de Rouen). Ce site s’est développé et se développe toujours de façon continue tant au niveau de son contenu que des possibilités de recherche aujourd’hui très avancées. Il a été distingué par de très nombreux prix, a reçu de nombreux labels et a bénéficié aussi du soutien financier de divers organismes.
Lorsque nous nous étions intéressés à l’évolution de la banque de données RAPRA, devenue Polymer Library, nous avons découvert qu’elle était produite maintenant par WTI-Frankfurter- digital GmbH qui est également un des serveurs qui l’héberge.
Ce serveur fort peu connu a été créé fin 2010 ou début 2011 (les sources divergent) sous le nom de WTI Frankfurter eG par le personnel de FIZ Technik après la faillite de cet organisme.
Début 2019, la société a été refondée sous le nom de WTI-Frankfurt-digital GmbH, à la fois un producteur et un serveur de banque de données et qui met en avant son indépendance vis-à-vis des éditeurs.
CAS FORMULATIONS DATABASE est une nouvelle base exclusivement accessible sur la nouvelle plateforme STNext. Son nom s’abrège en CASFORMULTNS mais CASFORM ou CASFOR sont plus simples et fonctionnent aussi bien.
La matière est sensiblement la même que celle proposée par la banque de données CHEMICAL ABSTRACTS (CA), à savoir des références indexées en détail de brevets et d’articles scientifiques concernant la chimie, la pharmacie, la biochimie, … Mais l’antériorité est bien plus limitée, puisque les brevets en langue anglaise, de même qu’une sélection de brevets chinois, français, allemands, japonais ou coréens ne sont pris en compte que depuis 1996. Les articles ne sont quant à eux pris en compte que depuis 2014.
Plusieurs banques de données qu’on avait l’habitude de pouvoir interroger presque indifféremment sur les serveurs Dialog ou STN ont connu ces derniers temps des restrictions d’accès.
WSCA (World Surface Coatings Abstracts) chargée en 1996 sur STN correspondait à la publication du même nom produite par la Paint Research Association UK. Elle était aussi accessible sur Dialog et même, il y a fort longtemps, sur Questel avant que ce serveur ne se focalise sur les brevets. Sa mise à jour avait cessé en 2013.
STN a déchargé le 29 juin dernier la banque de données Dissertation Abstracts (DISSABS) à la demande de son producteur ProQuest.
Cette banque de données est aujourd’hui l’une des rares banques spécialisées dans les thèses à demeurer payante.
Depuis quelques années, la tendance est en effet au développement de sites de thèses en accès libre, non seulement pour les références, mais souvent aussi pour le texte intégral en PDF.
Proquest a acquis Dialog en 2008, devenant ainsi le cinquième propriétaire de ce serveur pionnier, commercialisé pour la première fois par la société américaine Lockheed en 1972 au sein de laquelle il avait été développé.
En réalisant cette acquisition, Proquest a en fait acheté Dialog et DataStar, serveurs concurrents à l’origine, mais le propriétaire du premier (Knight Ridder à l’époque) avait racheté le second en 1993. Ils étaient depuis devenus plus complémentaires, voire en partie redondants, que concurrents.
Proquest a été le deuxième après Questel avec Orbit à fusionner deux serveurs en créant une nouvelle plateforme. Jusqu'à présent, cela avait toujours été considéré comme quasi-irréalisable ou du moins, particulièrement difficile.
La recherche d’information et notamment ses outils et méthodes, ne cesse d’évoluer. C'est le cas avec les outils gratuits dont nous avons fait un panorama dans le dernier BASES (la recherche d'information au mille visages). Il est temps maintenant d’aborder la question des outils de recherche payants comme les serveurs, bases de données ou agrégateurs de presse.
Car si le paysage des acteurs n’a pas tant changé au cours des dernières années, à l’exception des nouveaux outils liés à l’exploration du Web ouvert et des médias sociaux, les technologies et la façon d’utiliser les outils de recherche professionnels payants ont quant à elles beaucoup évolué.
Après le léger passage à vide observé lors de l’abandon du développement de New STN, STN montre un regain de dynamisme et, lors de la dernière journée d’utilisateurs, les nouveautés ne manquaient pas.
Il faut d’abord savoir que tous les nouveaux développements et les ajouts de nouvelles bases se feront sur STNext.
Pour leur part, New STN et STN Express continueront à exister mais ne bénéficieront d’aucune nouvelle fonctionnalité et seront abandonnés à terme
Nous avions signalé dans le numéro de janvier 2018 de BASES (n° 355) quelques problèmes de mise au point de la nouvelle interface de STN.
Ces problèmes sont maintenant réglés. En effet, quand on tape une parenthèse sur un clavier AZERTY, elle n’efface plus le caractère précédent.
D’autre part, on peut régler ses « settings » de façon à ce qu'à la déconnexion le système propose automatiquement le déchargement du transcript au moment du logoff. Pour cela, il faut aller dans les settings que l’on trouve dans le menu déroulant qui s’affiche quand on clique sur son nom, puis dans la rubrique « transcript download » activer l’option « Prompt at Logout/Logoff Hold » puis ne pas oublier de cliquer sur « apply » en haut à droite de l’écran.
La réunion parisienne des utilisateurs d’Orbit a été l’occasion de faire le point sur les nouveautés déjà opérationnelles ou proches de leur mise à disposition.
Une première tendance a été fortement mise en avant, qui est celle des différentes analyses possibles des résultats en fonction d’une multitude de critères avec toujours plus d’options de visualisation, en particulier de coloriage pour une analyse plus facile.
Si l’on a souscrit à l’option Platinum, on dispose même de près d’une vingtaine de graphes prédéfinis, avec, parmi eux, un graphe indiquant les dépenses brevets d’un ensemble de sociétés.
Il est rare que la mise en ligne d’un nouveau logiciel ne génère pas quelques soucis. STNext n’y a pas échappé. En effet, on rencontre un problème lorsque l’on utilise une parenthèse avec un clavier AZERTY car cette parenthèse efface le caractère précédent.
Par exemple, si l’on tape S (un terme) le S est effacé et la commande ne peut être exécutée. On ne peut donc faire que des stratégies de recherches qui ne comportent pas de parenthèse ce qui est évidemment très restrictif.
Pour pallier cet inconvénient, il y a plusieurs solutions : utiliser un clavier QWERTY, ou bien utiliser Command Window accessible à partir de la flèche en bas à gauche de l’écran si l’on veut rester sur STNext.
Sinon, on peut bien sûr utiliser STN on the Web ou STN Express.
Autre «détail» à prendre en compte si l’on utilise STNext : il faut penser à récupérer le transcript avant de se déconnecter, contrairement à ce qui se passe avec STN on the Web où l'on accède au transcript après la déconnexion.
Pour ceux qui n’ont pas de contrat forfaitaire, cela augmente inutilement les coûts.
On savait que Questel travaillait avec la société hongroise Chemaxon pour réaliser ses modules chimie. Comme les logiciels utilisés par Intellixir et Orbit sont différents, cela s’est fait en deux temps.
Intellixir a été le premier à offrir le module chimie, avec la contrainte de limiter la recherche aux données déchargées dans Intellixir mais avec l’avantage de fonctionner aussi bien sur des documents brevets que sur la littérature ou les essais cliniques.
En ce qui concerne Orbit, une première étape vient d’être franchie avec la mise a disposition en beta du module chimie qui permet, lui, d’effectuer des recherches sur l’ensemble de la base.
Pour y avoir accès, il suffit de le demander à son interlocuteur commercial, Questel étant très en demande de retours.
Précisons que, pour limiter le bruit, et comme dans Patentscope, ces recherches sont limitées aux brevets ayant au moins un code CIB dans le domaine de la chimie. Par contre, Orbit utilise un algorithme de détection de noms de molécules, ce qui signifie que cette détection n’est pas limitée par la mise à jour d’un thésaurus. L’algorithme sera donc capable de comprendre le nom d’une nouvelle molécule et de l’indexer.
Auteur : François Libmann, Directeur de Publication
On connaissait déjà les accès professionnels à STN par STN Express ou par STN on the Web (attention pour cet accès à bien se connecter sur le site de FIZ Karlsruhe et pas sur celui de CAS). S’est ajouté en fanfare, il y a quelques années le «New STN» supposé remplacer et rendre obsolète les deux interfaces précédentes.
Le New STN, longtemps mis en avant, ne mettait toujours pas à disposition toutes les bases du catalogue et son développement apparaissait long et quelque peu problématique. Et effectivement, STN a fini par annoncer que cette interface utilisait des technologies nouvelles pour lesquelles des contraintes non prévues étaient apparues.
Dans l’imaginaire collectif des professionnels de l’information, Google Scholar, le moteur de recherche académique de Google, apparaît comme un concurrent des serveurs et bases de données payantes comme Scopus, Web of Science, Proquest, Proquest Dialog, etc.
S’il est de notoriété publique qu’une grande partie du contenu des sites et outils des éditeurs scientifiques se retrouvent sur Google Scholar, cela paraît moins évident pour le contenu des bases de données disponibles sur les grands serveurs.
Pourtant, on apprenait il y a peu que Google étendait sa collaboration avec Proquest en indexant près d’un demi million de thèses disponibles dans la base de données ProQuest Dissertations & Theses Global™ database (PQDT).
Après une petite pause d’un an et demi qui a suivi le rachat d’Intellixir et de GEM360 en 2015, Questel poursuit à nouveau ses acquisitions de sociétés offrant des services complémentaires aux siens dans le domaine de la propriété industrielle avec le rachat de la société américaine ITIP.
On sait que Questel est, de longue date, bien implanté au Etats-Unis en particulier après l’acquisition en 1994 d’Orbit, l’un des plus anciens serveurs américains spécialisé, en particulier, dans les brevets. Il était donc tout à fait cohérent de racheter en mars dernier la société ITIP (10M$ de CA en 2016), de surcroît peu implantée en Europe.
Scopus est un agrégateur de références d’articles scientifiques qui propose 69 millions de références issues de 22 000 publications de plus de 5 000 éditeurs.
L’accès au service est payant, le modèle étant celui du forfait annuel souscrit par des Universités, des entreprises…
Outre l’accès payant, Scopus offre un service gratuit d’identification d’auteur, basé, bien sûr, sur l’ensemble de son fonds.