Le 24 août dernier, Elsevier annonçait le lancement de Datasearch, un moteur de recherche de données scientifiques multisectoriel en libre accès. L’outil fonctionne comme un moteur classique et interroge des sources scientifiques et répertoires institutionnels. Elsevier explique avoir voulu aider les chercheurs à gagner du temps dans leurs recherches car les moteurs de recherche généralistes ne sont pas forcément les plus adaptés pour identifier de l’information très spécialisée et ne se limitent pas à des sources d’information qualifiées et reconnues.
Ainsi, Datasearch indexe pour le moment les tableaux, figures et données supplémentaires associées aux articles publiés sur ScienceDirect, arXiv et PubMed Central ainsi que le contenu de NeuroElectro, Dryad, PetDB, ICPSR, Harvard Dataverse et ThemoML.
Pour le moment Datasearch n’est pas un produit commercial mais Elsevier indique que le business model n’est pas encore finalisé. Impossible donc de savoir comment va évoluer le produit dans les mois et années à venir et s’il va rester en libre accès.
IET (Institution of Engineering and Technology) a récemment annoncé que plus de 30 000 pre-prints disponibles dans l’archive ouverte ArXiv seraient indexés dans la base de données Inspec (l’une des bases de référence en physique et sciences de l’ingénieur).
Aux Etats-Unis, une nouvelle archive ouverte dédiée aux sciences de l’ingénieur vient de voir le jour. Elle s’appelle EngrXivet le projet est mené par des ingénieurs et une communauté de bibliothécaires scientifiques américains. L’archive ouverte est hébergée en version béta sur la plateforme Open Science Framework (qui héberge aussi les archives ouvertes SocArXiv pour sciences sociales et PsyArXiv pour la psychologie).
Pour le moment, l’interface est peu conviviale et le nombre de documents restreints mais le projet n’en étant qu’à ses balbutiements, on ne peut qu’espérer une amélioration au cours des prochains mois.
En termes de fonctionnalités de recherche, l’outil permet d’utiliser les opérateurs booléens classiques (sauf que les mots-clés sont séparés implicitement par un OR) et les guillemets pour la recherche d’expression exacte. Dans un second temps, il est possible de filtrer les résultats par type (document, images, données statistiques, etc.), sources et date.
Reuters vient tout juste d’annoncer des évolutions majeures au niveau de la recherche dans Thomson Innovation et notamment le lancement d’un nouvel algorithme « smart search » plus orienté vers la sémantique. Au delà de la traditionnelle recherche par mot-clé, « smart search » extrait des mots-clés et des thèmes à partir d’un bloc de texte et les injecte dans l’algorithme de recherche.
Plum Analytics (EBSCO) et ACI Information Group ont récemment développé un partenariat afin de proposer des métriques sur plus d’1 million d’articles de blogs scientifiques et académiques aux clients de PlumX Suite.
L’agrégateur de presse EDD propose de nouvelles fonctionnalités :
Il annonce également le lancement prochain d’un nouvel outil appelé Pressedd-Reader, une nouvelle plateforme de consultation des retombées médias, conçue spécifiquement pour les lecteurs.
Du côté de Google, on notera l’ajout de 11 nouveaux pays à l’outil Google Patents : Japon, Corée du Sud, Royaume-Uni, Espagne, France, Belgique, Russie, Pays-Bas, Finlande, Danemark et Luxembourg.
Twitter revoit sa politique des 140 caractères. A partir du 19 septembre, les liens ne seront plus comptabilisés.
Les outils du Web vont et viennent et il n’est pas rare que certains outils gratuits changent leur politique pour passer au payant. En cette rentrée, on notera donc la disparition du moteur de hashtag « Hshtags ».