La Fondation Bill et Melinda Gates créée en janvier 2 000 s’est donné pour mission d’améliorer les conditions de vie des populations défavorisées à travers le monde, en se concentrant initialement sur la santé mondiale, les bibliothèques et l’éducation dans le nord-ouest du Pacifique.
En 2006, la Fondation a été restructurée pour inclure des divisions dédiées au développement mondial et à la santé mondiale, en plus de ses activités aux États-Unis.
Au fil des années, elle a élargi ses domaines d’intervention, notamment dans la lutte contre les maladies, l’éducation, le développement agricole et l’adaptation au changement climatique en Afrique et en Asie.
La Fondation finance des projets de recherche qui lui sont soumis en privilégiant, outre l’excellence scientifique, les projets collaboratifs ayant un fort potentiel d’impact positif sur les populations les plus vulnérables, en accord avec sa mission philanthropique.
Depuis les années 90, l’Open Access, porté par l’essor d’Internet et la philosophie de la science ouverte, a profondément transformé l’accès aux publications scientifiques en démocratisant la diffusion des connaissances.
Cette révolution a été marquée par la création d’archives ouvertes et de moteurs de recherche académiques, facilitant l’accès, libre ou payant, à des articles scientifiques. Elle s’est amplifiée avec la création de plateformes avancées, des initiatives pour l’accès aux citations et résumés, et le développement d’outils dopés à l’intelligence artificielle qui améliorent l’accès, l’analyse, et l’utilisation des données scientifiques.
Tout en gardant à l’esprit les défis notamment en matière de financement et de droits d’auteur, nous avons exploré l’apport de ces ressources ouvertes aux chercheurs, veilleurs et documentalistes et les nouvelles possibilités d’interaction avec les données.
Il faut revenir aux années 90 pour voir émerger le mouvement de la science ouverte, principalement sous la forme de l’« open access », porté par la volonté de donner un accès libre et gratuit aux publications scientifiques.
Cela va se matérialiser au départ sous la forme d’archives ouvertes. L’archive ouverte ArXiv avec ses preprints, une des pionnières en la matière, a été créée en 1991.
La deuxième phase de développement se situe ensuite dans les années 2000 avec l’essor de l’Internet grand public. L’archive ouverte française HAL est ainsi lancée en 2001.
Beaucoup plus récemment, le développement des plug-ins d’accès à la littérature scientifique a permis de repérer beaucoup plus simplement un article disponible en libre accès quelque part sur le Web, éventuellement sous forme de preprint ce qui n’était pas toujours évident.
Par ailleurs, quand on parle d’open access, il faut bien distinguer :
● D’une part l’accès gratuit au document primaire (l’original);
● D’autre part l’accès à une plateforme ou à un moteur permettant de rechercher puis de visualiser gratuitement uniquement des références d’articles et de proceedings et aussi parfois de chapitres de livres.
Notre habitude est de construire des stratégies complexes, mêlant synonymes, mots écrits de différentes façons (crosslink ou « cross link » par exemple), avec des opérateurs booléens, de proximité, des possibilités d’exclure des thématiques et, enfin, de multiples possibilités de combiner des étapes. Autant le dire tout de suite, ces stratégies ne sont pas transposables en l’état dans ces nouveaux outils.
Pour réaliser nos tests, nous avons donc dû utiliser des stratégies relativement simples qui puissent fonctionner sur tous les outils. Nous nous sommes limités aux références d’articles ou de conférences, incluant les preprints qui sont de plus en plus pris en compte. En revanche nous n’avons pas, dans la mesure du possible, pris en compte les chapitres d’ouvrages et les thèses. Les recherches se font dans le titre, ce qui n’est pas toujours simple, certains systèmes n’offrant pas cette option, obligeant à faire des comptages manuels. Nous avons envisagé de tester une recherche par affiliation mais cette fonctionnalité n'est pas disponible dans tous les moteurs.
Cette comparaison entre les serveurs et les outils gratuits ne pouvant se faire que sur des stratégies simples, on laisse de côté la puissance de recherche et le confort d’utilisation pour ne comparer que le nombre de réponses. Par ailleurs, il est évident que ces tests n’ont aucune valeur statistique et que l’on ne peut rien généraliser à partir de leurs résultats.
Zendy est un moteur académique qui a été lancé il y a quelques années, mais qui reste méconnu en France (cf. figure 1. Interface de Zendy).
L’idée de départ est de rendre plus accessible la littérature académique notamment dans les pays et régions où il est difficile de souscrire à des bases de données et serveurs payants.
Développé par Knowledge E, une société basée à Dubaï qui propose des solutions de bibliothèques numériques, Zendy a donc noué des partenariats avec de grands acteurs de l’édition académique pour indexer leurs contenus et en mettre une partie gratuitement à disposition de ses utilisateurs.
Lire aussi :
Elicit, un nouveau moteur scientifique au banc d’essai (06/2022)
SIMBA Information vient de publier le rapport intitulé Open Access Journal Publishing 2016-2020 (62p-2500$) sur l'Open Access.
Le communiqué de presse donne quelques informations intéressantes :
Lien : www.simbainformation.com
Auteur : François Libmann, Directeur de publication
Nous avions parlé récemment du nouveau moteur lancé par Creative Commons appelé CC Search et des manières de trouver des contenus sous licence Creative Commons.
Bien souvent, les auteurs de ces contenus exigent au minimum que l’on indique la source ou le nom de l’auteur, ce qui n'est pas nécessairement très esthétique pour les images utilisées dans un rapport, une présentation, une carte de voeux ou encore une une page Web.
Heureusement, il existe des sites qui regroupent des contenus sous licence CC0 (Creative Commons 0), c'est-à-dire que l'on peut utiliser sans la moindre contrainte et obligation.
Les sources permettant d’obtenir des articles scientifiques et académiques en libre accès sont de plus en plus nombreuses. Les serveurs et bases de données classiques, après avoir longtemps été réticents à les inclure à leur corpus, commencent à les intégrer à leurs offres soit en les intégrant directement à leurs bases existantes, soit en créant des bases spécifiques dédiées à l’open access. C’est à cette dernière catégorie qu’appartient la nouvelle base de Dialog, appelée Publicly Available Content.
Les serveurs payants (Dialog, Scopus, STN…) en référencent certains, mais il existe de nombreux sites en accès libre qui proposent gratuitement l'accès à des références, avec dans la plupart des cas, un lien vers le document original. Mais il faut noter que très souvent, seule une partie des documents eux-mêmes est en libre accès, les autres étant payants.
Les possibilités de recherche sur ces sites ne sont pas inexistantes mais plus ou moins développées.
On peut citer parmi les plus connus, sachant qu’il en existe de nombreux autres :
Bielefeld Academic Search Engine (BASE) qui propose plus de 240 millions de références de documents de toutes natures provenant de plus de 9 000 partenaires parmi lesquels environ 60 % sont en libre accès, la part de documents en libre accès pour chaque partenaire étant très variable ("variant de 1 à 100 %" selon l'éditeur).
Lire aussi :
Data.inpi.fr propose des données sur les entreprises issues du Registre National du Commerce et des Sociétés.
Cette base vient rejoindre les autres bases de données gratuites déjà disponibles, proposées par l’INPI sur :
les marques françaises, de l’Union Européenne et internationales ;
les brevets français, européens et internationaux ;
les dessins et modèles français et internationaux ;
Toute bonne veille ou recherche d’information requiert un corpus de sources qualifiées et représentatives pour un sujet donné sous peine de réaliser des analyses biaisées.
Mais en matière de sources, rien n’est jamais acquis, du moins jamais pour très longtemps.
L’accès aux médias, notamment la presse économique et les revues scientifiques académiques, est de plus en plus « instable » pour les professionnels de l’information avec des modèles d’accès (gratuit, payant, freemium, ouvert, fermé, présent dans des agrégateurs et bases de données, etc.) qui ne cessent d’évoluer.
Lire aussi : Veille et recherche d'information : toutes les sources et tous les articles n ont pas la même valeur
L’histoire des banques de données Pascal et Francis produites par l’INIST a été fortement agitée ces dernières années.
Il en a été de même avec le service de fourniture des documents primaires Refdoc, fort utilisé à une époque mais dont le nombre de commandes avait beaucoup baissé avec le temps (900'000 commandes en 1999 contre une estimation de 100'000 pour l'année 2014 selon les prévisions de l’INIST de l’époque).
Cette baisse était la conséquence du fait qu’un très grand nombre d’éditeurs avaient mis à disposition leurs publications en ligne et surtout, avaient finalement permis l’achat à l’article sans rendre obligatoire l’abonnement à la publication.
La disparition de la banque de données payante Dissertations Abstracts du serveur STN est pour nous l’occasion de faire un tour du monde des sites de thèses en accès libre.
Nous avons déjà eu l’occasion d’aborder plusieurs fois cette question dans BASES , mais nous avons souhaité faire aujourd’hui un tour d’horizon le plus large possible, sans pour autant pouvoir garantir l’exhaustivité sur le sujet. De plus, la mise à disposition des thèses et références de thèses sur le Web a évolué rapidement en quelques années, ce qui justifie donc une remise à jour.
STN a déchargé le 29 juin dernier la banque de données Dissertation Abstracts (DISSABS) à la demande de son producteur ProQuest.
Cette banque de données est aujourd’hui l’une des rares banques spécialisées dans les thèses à demeurer payante.
Depuis quelques années, la tendance est en effet au développement de sites de thèses en accès libre, non seulement pour les références, mais souvent aussi pour le texte intégral en PDF.
A l’occasion de la dernière réunion annuelle du CFIB (Club francophone d’information brevet), Marie-Pierre Vidonne, directrice du cabinet suisse Innovea, a fait un fort utile tour d’horizon des possibilités de libre accès (open access) à la littérature scientifique.
Ces problématiques sont apparues peu après que les articles scientifiques soient devenus disponibles sous forme électronique. S’est, en effet, alors posé le problème des modalités de leur accessibilité.
Google et ses concurrents ont du souci à se faire. Le parlement français a récemment voté la loi « création » qui oblige entre autres les moteurs à payer une redevance pour indexer et afficher des photos dans leurs moteurs d’images. La redevance devra être versée auprès d’une société de gestion collective agréée, telle que la SAIF, l’ADADGP, ou une autre structure ad hoc.
A l’exception des professionnels de l’image et de la photographie qui enregistreront leurs œuvres auprès de ces organismes de gestion, il est hautement improbable que le citoyen lambda qui publie des images sur le Web touche le moindre centime en droit d’auteur de la part de ces organismes. Certains dénoncent également le déséquilibre entre Google et des petits moteurs de recherche indépendants qui ne disposent pas du budget de Google et qui préfèreront désindexer certaines images car ils ne pourront pas supporter ces nouveaux coûts.
De son côté, le moteur de recherche DuckDuckGo, qui se positionne sur le créneau des moteurs qui respectent la vie privée, s’améliore et propose de nouvelles fonctionnalités de recherche. Les dernières en date : la possibilité de filtrer les résultats par date (past day, past month, etc.) et l’ajout de sitelinks pour certains sites. Rappelons que les sitelinks sont des liens affichés au-dessous de certains sites dans les résultats et sont destinés à faciliter la consultation du site par les internautes. La structure des liens du site est analysée afin de définir des raccourcis permettant aux internautes de gagner du temps et de trouver rapidement l’information qu’ils recherchent.
Factiva a récemment lancé une application Iphone permettant de suivre l’actualité en tout lieu et à tout moment. Cette application donne accès aux alertes, newsletters et actualités issues des titres présents dans Factiva. Il est possible de sauvegarder les articles pour les lire plus tard sans avoir de connexion internet.
La base de donnée Inspec (littérature scientifique et technique) est désormais accessible sur Proquest (nous rappelons qu’elle était déjà accessible depuis bien longtemps sur la plateforme Proquest Dialog et sur STN).
Proquest a également lancé récemment neuf bases de données régionales avec plus de
3 000 titres de revues académiques (business, science, sciences humaines et sociales, médecine, etc.). Les neuf bases sont les suivantes : Australie & Nouvelle Zélande, Europe continentale, Europe de l’Est & Europe Centrale, Asie de l’Est et du Sud, Inde, Amérique latine et péninsule ibérique, Afrique & Moyen-Orient, Turquie, Royaume-Uni & Irlande.
Le 12 octobre 2015, Digital Science a lancé sa nouvelle base de données GRID. Il s’agit d’une base de données en ligne, gratuite et facile à utiliser, qui contient des informations sur les organismes de recherche à travers le monde.
Elaborée en interne par Digital Science, GRID contient 50.000 noms d’établissements avec des identifiants uniques et des informations de géolocalisation à travers 212 pays. Les données sont tirées de sources des bailleurs de fonds et de publication en libre accès, tels que NIH, PubMed et UK Gateway to Research.
La base de données comprend la majorité d’établissements du monde entier qui ont reçu des financements pour la recherche, disponibles sous une licence internationale CC-BY C-BY Creative Commons Attribution 4.0, qui permet à l’utilisateur de partager ou adapter le contenu disponible pour tout usage, même commercial.
Cette nouvelle base vise à susciter l’innovation, en fournissant aux scientifiques, aux développeurs et aux entrepreneurs des données standardisées sur les différents établissements, qui seront interopérables avec les technologies et les plateformes existantes. C’est également pour assurer la perspicacité, la transparence et la précision, permettant à toute personne intéressée de visualiser et utiliser efficacement la liste commune internationale des organismes de recherche.