Depuis quelques années déjà, Google ne permet plus de rechercher sur les versions locales de son navigateur. Que vous lanciez votre recherche sur google.fr, google.com, google.com.br ou encore google.co.uk, les résultats seront les mêmes.
Google détermine en effet les résultats en fonction de la localisation de l’internaute, c’est-à-dire à partir de son adresse IP. L’internaute risque donc de se retrouver dans une sorte de « bulle de filtres » géolocalisée.
Quand on fait de la veille et des recherches d’information à l’international, cela représente un risque majeur : passer complètement à côté de résultats locaux (issus de la presse locale, de sites de collectivités locales, de blogs locaux, de sites d’entreprises locales, etc.) qui pourraient pourtant apporter des informations stratégiques.
Lire aussi :
Depuis l’annonce en mai 2021 du rachat de Proquest par Clarivate , tout semblait se passer sans trop de problèmes pour cette acquisition qui concernait tant ses bases de données que les logiciels destinés aux bibliothèques et à différents services des entreprises.
Clarivate et, dans une moindre mesure, Proquest ont déjà racheté de nombreuses entreprises.
Clarivate, en particulier, a racheté récemment Decision Resources Group, Customer First View, CPA Global, et Darts-ip, ce dernier étant spécialisé dans les litiges de propriété intellectuelle
Il semble que ces opérations de rachat se sont passées sans problèmes majeurs. Manifestement, ce n’est pas le cas pour le rachat de Proquest par Clarivate.
Lire aussi :
Le rachat de Proquest par Clarivate : quelles conséquences pour le monde de l’information ? , BASES n°392, mai 2021
Contentieux de brevets et marques : Clarivate Analytics rachète darts-ip , BASES n°377, janvier 2020
Dialog devient une source pour l’open access avec la base Publicly Available Content , BASES n°394, juillet-août 2021
Depuis quelques années, les Knowledge Graphs ("graphes de connaissances"), ces réseaux sémantiques construits à partir des relations établies entre des entités de types différents (personnes, évènements, lieux, situations, concepts, etc.) ont la cote auprès des outils de recherche et de veille professionnels. Nombre d’entre eux mettent d’ailleurs en avant leur utilisation dans leur discours commerciaux. On notera bien qu’il s’agit ici d’une technologie utilisée en arrière-plan sur laquelle l’utilisateur final n’a pas directement la main.
D’une part, de nouveaux outils indiquent mettre cette technologie au cœur de leurs produits, ce qui, selon eux, viendrait « révolutionner » la recherche et la veille. C’est par exemple le cas d’IP Rally, un nouvel outil de recherche brevets qui met en avant « une technologie unique basée sur un Knowledge Graph ». IP Rally se présente comme une alternative aux outils à base d’IA qui sont de véritables boîtes noires et les outils fondés sur la recherche par mots-clés classique.
D’autre part, des outils, déjà bien en place, communiquent également régulièrement sur l’intégration de Knowledge Graphs dans leurs produits. C’est par exemple le cas du lecteur RSS Feedly pour son « assistant intelligent » Leo mais aussi d’EBSCO pour sa nouvelle interface EDS lancée fin 2020 ou encore de Dow Jones (Factiva) dans son produit DNA lancé à la fin de l’année 2019.
Lire aussi :
Outils de recherche payants à l’heure de la recherche booléenne « augmentée »
Comment construire ses propres outils de recherche d’information thématiques ?
Les sources permettant d’obtenir des articles scientifiques et académiques en libre accès sont de plus en plus nombreuses. Les serveurs et bases de données classiques, après avoir longtemps été réticents à les inclure à leur corpus, commencent à les intégrer à leurs offres soit en les intégrant directement à leurs bases existantes, soit en créant des bases spécifiques dédiées à l’open access. C’est à cette dernière catégorie qu’appartient la nouvelle base de Dialog, appelée Publicly Available Content.
Les serveurs payants (Dialog, Scopus, STN…) en référencent certains, mais il existe de nombreux sites en accès libre qui proposent gratuitement l'accès à des références, avec dans la plupart des cas, un lien vers le document original. Mais il faut noter que très souvent, seule une partie des documents eux-mêmes est en libre accès, les autres étant payants.
Les possibilités de recherche sur ces sites ne sont pas inexistantes mais plus ou moins développées.
On peut citer parmi les plus connus, sachant qu’il en existe de nombreux autres :
Bielefeld Academic Search Engine (BASE) qui propose plus de 240 millions de références de documents de toutes natures provenant de plus de 9 000 partenaires parmi lesquels environ 60 % sont en libre accès, la part de documents en libre accès pour chaque partenaire étant très variable ("variant de 1 à 100 %" selon l'éditeur).
Lire aussi :
The Lens est un moteur de recherche lancé en 2000 par une organisation à but non lucratif, Cambia, basée au sein de l’Université de Technologie du Queensland à Brisbane en Australie.
Particularité distinctive, il donne accès à trois bases de données, dont une base de publications scientifiques, objet de l’article de François Libmann dans ce même numéro « The Lens pour la littérature scientifique : des contenus mal valorisés », une base de séquences et une base de données brevets en accès libre. Cette dernière est l’objet de cet article.
Dans l’article précédent « The Lens, un outsider au fort potentiel pour la recherche brevet gratuite », Philippe Borne s’est focalisé de façon détaillée sur la partie brevet de The Lens.
Dans cet article nous examinerons la partie consacrée à la littérature scientifique de The Lens que l’on atteint en cliquant sur « Scholary works » dans le menu déroulant « Our apps » sur la page d’accueil.
La recherche dans la littérature scientifique sous forme numérique est disponible depuis très longtemps à de multiples endroits de façon gratuite ou payante. Ici, elle est limitée aux documents dont les références sont en accès libre, ce qui ne préjuge pas de la gratuité ou non de l’accès au document lui-même (41 millions sont en accès libre).
Ces références proviennent de Crossref, Pubmed, Core et Microsoft Academic, sachant que Microsoft vient d’annoncer l’arrêt de son service Microsoft Academic, ce qui risque de poser problème.
Depuis l’apparition dans les années 2000 des premiers services permettant de raccourcir des liens ou urls (Uniform Resource Locator), aussi appelés shorteners, de nombreuses plateformes ont ensuite vu le jour avec plus ou moins de succès.
Ces plateformes apparaissent et disparaissent au gré du temps, laissant le professionnel de l’information confronté à cette instabilité. L’un des derniers en date à abandonner la bataille n’est autre que huit.re, un outil proposé par Framasoft que nous utilisions parfois pour nos articles.
Et même des services, qui sur le papier procurent un sentiment de sécurité quant à leur pérennité, soit parce qu’ils sont issus des géants du Web, soit parce qu’ils existent depuis longtemps, ne sont pas à l’abri de disparaître du jour au lendemain.
Google en a été la preuve il y a quelques années avec son service googl.gl qui resta incontournable jusqu’en 2019. La firme de MountainView préféra pourtant réorienter son service autour de sa plateforme de création de liens dynamiques Firebase Dynamic Links et ferma googl.gl en 2019.
Les travaux étudiants (mémoires, thèses ou encore rapports de stage) ont toute leur place dans les sources d’information des veilleurs. Ils peuvent souvent fournir des informations uniques que l’on ne retrouve pas sous d’autres formats ou aiguiller l’internaute vers d’autres ressources pertinentes, notamment grâce aux références bibliographiques.
Mais encore faut-il y avoir accès...
Si l’archivage et la mise à disposition des thèses répondent à des obligations légales et des processus de plus en plus structurés et formalisés ce n’est pas le cas pour les mémoires en France ni à l’international.
Chaque organisme étant libre en matière de diffusion des mémoires, on se retrouve alors avec une multitude d’initiatives isolées qu’il est souvent difficile d’identifier.
Cette quête des mémoires peut vite s’avérer tellement chronophage qu’elle n’est pas nécessairement rentable.
Heureusement avec les années, certaines initiatives unifiées à l’échelle d’un pays ou d’une discipline ont pris de l’ampleur et deviennent des sources de référence en la matière.
Lire aussi : Tour du monde des sites de thèses en accès libre
Les fusions/acquisitions sont depuis longtemps très fréquentes dans le domaine de l’information.
Près de nous, voici des années que Questel rachète des sociétés, en France comme à l’étranger, offrant divers services liés à la propriété intellectuelle, cœur de son activité. Dans un autre domaine, Cision a acheté il y a quelques années Europresse, l’Argus de la Presse et PR Newswire. Cette situation existe aussi aux Etats-Unis.
Aujourd’hui, il s’agit d’un achat important d’un acteur essentiellement privé, en l’occurrence Proquest par l’acteur public qu’est Clarivate. La transaction s’élève à 5,3 milliards de dollars, dont quatre en liquide et 1,3 en actions.