Depuis quelques années déjà, Google ne permet plus de rechercher sur les versions locales de son navigateur. Que vous lanciez votre recherche sur google.fr, google.com, google.com.br ou encore google.co.uk, les résultats seront les mêmes.
Google détermine en effet les résultats en fonction de la localisation de l’internaute, c’est-à-dire à partir de son adresse IP. L’internaute risque donc de se retrouver dans une sorte de « bulle de filtres » géolocalisée.
Quand on fait de la veille et des recherches d’information à l’international, cela représente un risque majeur : passer complètement à côté de résultats locaux (issus de la presse locale, de sites de collectivités locales, de blogs locaux, de sites d’entreprises locales, etc.) qui pourraient pourtant apporter des informations stratégiques.
Lire aussi :
On pourrait bien sûr s’affranchir de Google et n’utiliser que des services qui ne collectent pas de données sur l’utilisateur et ne personnalisent pas les résultats de recherche. Sauf que malheureusement, en termes de performance et de pertinence de résultats, aucun n’arrive pour le moment à la cheville de Google. Utiliser Google (parmi d’autres sources et outils bien sûr) reste donc un prérequis dans un grand nombre de cas.
Mais tout n’est pas perdu. On sait qu’il existe différents outils et méthodes pour contourner cette géolocalisation forcée :
Nous avions dressé un panorama des solutions disponibles dans l’article « Comment identifier des sources d’information locales ? » (NETSOURCES n°146 – mai/juin 2020) que nous vous invitons à lire ou à relire.
Déjà abonné ? Connectez-vous...
Depuis l’annonce en mai 2021 du rachat de Proquest par Clarivate , tout semblait se passer sans trop de problèmes pour cette acquisition qui concernait tant ses bases de données que les logiciels destinés aux bibliothèques et à différents services des entreprises.
Clarivate et, dans une moindre mesure, Proquest ont déjà racheté de nombreuses entreprises.
Clarivate, en particulier, a racheté récemment Decision Resources Group, Customer First View, CPA Global, et Darts-ip, ce dernier étant spécialisé dans les litiges de propriété intellectuelle
Il semble que ces opérations de rachat se sont passées sans problèmes majeurs. Manifestement, ce n’est pas le cas pour le rachat de Proquest par Clarivate.
Lire aussi :
Le rachat de Proquest par Clarivate : quelles conséquences pour le monde de l’information ? , BASES n°392, mai 2021
Contentieux de brevets et marques : Clarivate Analytics rachète darts-ip , BASES n°377, janvier 2020
Dialog devient une source pour l’open access avec la base Publicly Available Content , BASES n°394, juillet-août 2021
En effet, la FTC (Federal Trade Commission) américaine vient d’annoncer qu’elle allait effectuer une enquête complémentaire sur ce projet de rachat.
Cela a pour conséquence de reporter la date limite de cette opération au minimum à la fin de l’année, sachant qu’il serait possible de repousser cette date jusqu’au 29 avril 2022.
Cela n’est pas, bien sûr, sans conséquence sur le plan du montage financier prévu à l’origine et qui est en train d’être réaménagé.
Ce report illustre l’importance de cette éventuelle fusion sur le marché de l’information, même si certains avaient prévu, à tort, que la taille relativement limitée du marché concerné ne susciterait pas l’intérêt de la FTC.
Il est vrai qu’avec un tel rachat, l’évolution de l’offre globale sur ce marché pourrait évoluer significativement et, au moins pour une part, ne pas convenir à tous les clients.
On pense, en particulier, au modèle de facturation de Dialog Solutions (racheté par Proquest en 2008), en espérant que l’option « pay as you go » soit maintenue, ce qui n’est pas évident compte tenu des pratiques de Clarivate.
Néanmoins, d’ici une éventuelle fusion, les deux groupes continueront à opérer sans changement.
En attendant, on espère que cette nouvelle attente ne démobilisera pas les équipes de Dialog Solutions. Pour la France, on enregistre le départ du (discret) représentant.
Pour l'heure, nous constatons avec grand plaisir le professionnalisme toujours présent de l'équipe du help desk européen, qui s'est manifesté par l’intérêt et les réponses apportés à nos différentes demandes très précises concernant la nouvelle base appelée Publicly Available Content que nous présentons, par ailleurs ce même numéro.
Depuis quelques années, les Knowledge Graphs ("graphes de connaissances"), ces réseaux sémantiques construits à partir des relations établies entre des entités de types différents (personnes, évènements, lieux, situations, concepts, etc.) ont la cote auprès des outils de recherche et de veille professionnels. Nombre d’entre eux mettent d’ailleurs en avant leur utilisation dans leur discours commerciaux. On notera bien qu’il s’agit ici d’une technologie utilisée en arrière-plan sur laquelle l’utilisateur final n’a pas directement la main.
D’une part, de nouveaux outils indiquent mettre cette technologie au cœur de leurs produits, ce qui, selon eux, viendrait « révolutionner » la recherche et la veille. C’est par exemple le cas d’IP Rally, un nouvel outil de recherche brevets qui met en avant « une technologie unique basée sur un Knowledge Graph ». IP Rally se présente comme une alternative aux outils à base d’IA qui sont de véritables boîtes noires et les outils fondés sur la recherche par mots-clés classique.
D’autre part, des outils, déjà bien en place, communiquent également régulièrement sur l’intégration de Knowledge Graphs dans leurs produits. C’est par exemple le cas du lecteur RSS Feedly pour son « assistant intelligent » Leo mais aussi d’EBSCO pour sa nouvelle interface EDS lancée fin 2020 ou encore de Dow Jones (Factiva) dans son produit DNA lancé à la fin de l’année 2019.
Lire aussi :
Outils de recherche payants à l’heure de la recherche booléenne « augmentée »
Comment construire ses propres outils de recherche d’information thématiques ?
Pourtant, le concept de Knowledge Graph n’est pas nouveau et a été largement popularisé dès 2012, lorsque Google a introduit son propre Knowledge Graph dans son moteur et a abondamment communiqué sur le sujet. On rappellera que Google définit son Knowledge Graph comme une base de connaissances utilisée par son moteur pour compiler les résultats de recherche avec des informations sémantiques issues de sources diverses.
Et Google n’est pas le seul géant du Web à y avoir recours depuis des années. Facebook, LinkedIn, Amazon, Netflix utilisent également leurs propres Knowledge Graphs propriétaires dans leurs produits pour à la fois comprendre les intentions et besoins informationnels des internautes mais aussi pour leur proposer des recommandations pertinentes.
C’est ce que nous avons cherché à comprendre dans cet article de BASES.
Dans cet article :
Déjà abonné ? Connectez-vous...
Les sources permettant d’obtenir des articles scientifiques et académiques en libre accès sont de plus en plus nombreuses. Les serveurs et bases de données classiques, après avoir longtemps été réticents à les inclure à leur corpus, commencent à les intégrer à leurs offres soit en les intégrant directement à leurs bases existantes, soit en créant des bases spécifiques dédiées à l’open access. C’est à cette dernière catégorie qu’appartient la nouvelle base de Dialog, appelée Publicly Available Content.
Les serveurs payants (Dialog, Scopus, STN…) en référencent certains, mais il existe de nombreux sites en accès libre qui proposent gratuitement l'accès à des références, avec dans la plupart des cas, un lien vers le document original. Mais il faut noter que très souvent, seule une partie des documents eux-mêmes est en libre accès, les autres étant payants.
Les possibilités de recherche sur ces sites ne sont pas inexistantes mais plus ou moins développées.
On peut citer parmi les plus connus, sachant qu’il en existe de nombreux autres :
Bielefeld Academic Search Engine (BASE) qui propose plus de 240 millions de références de documents de toutes natures provenant de plus de 9 000 partenaires parmi lesquels environ 60 % sont en libre accès, la part de documents en libre accès pour chaque partenaire étant très variable ("variant de 1 à 100 %" selon l'éditeur).
Lire aussi :
COnecting REpositories (CORE) propose plus de 209 millions de références dont 89 millions (environ 43 % en accès libre) provenant de plus de 10 000 partenaires.
On citera également Google Scholar, bien connu et beaucoup/trop utilisé, dont on sait qu’il ne donne aucun élément chiffré sur son contenu. Certains l’évaluent à plus de 300 millions de références, ce qui en ferait la ressource la plus volumineuse. Mais, là encore, les documents référencés ne sont pas tous gratuits.
Déjà abonné ? Connectez-vous...
The Lens est un moteur de recherche lancé en 2000 par une organisation à but non lucratif, Cambia, basée au sein de l’Université de Technologie du Queensland à Brisbane en Australie.
Particularité distinctive, il donne accès à trois bases de données, dont une base de publications scientifiques, objet de l’article de François Libmann dans ce même numéro « The Lens pour la littérature scientifique : des contenus mal valorisés », une base de séquences et une base de données brevets en accès libre. Cette dernière est l’objet de cet article.
La sortie d’une nouvelle version de ce produit nous a semblé une bonne occasion de faire le point, en particulier sur ce qu’il peut apporter par rapport aux autres outils du même type, comme Espacenet ou Patentscope.
Un échange avec l’équipe qui l’a conçu nous a permis de comprendre son positionnement et ses évolutions.
Il faut dire que The Lens a été à l’origine d’un certain engouement, du fait en particulier de son design très attractif ; la question est aussi de savoir si le contenu est à l’image du contenant.
Déjà abonné ? Connectez-vous...
Dans l’article précédent « The Lens, un outsider au fort potentiel pour la recherche brevet gratuite », Philippe Borne s’est focalisé de façon détaillée sur la partie brevet de The Lens.
Dans cet article nous examinerons la partie consacrée à la littérature scientifique de The Lens que l’on atteint en cliquant sur « Scholary works » dans le menu déroulant « Our apps » sur la page d’accueil.
La recherche dans la littérature scientifique sous forme numérique est disponible depuis très longtemps à de multiples endroits de façon gratuite ou payante. Ici, elle est limitée aux documents dont les références sont en accès libre, ce qui ne préjuge pas de la gratuité ou non de l’accès au document lui-même (41 millions sont en accès libre).
Ces références proviennent de Crossref, Pubmed, Core et Microsoft Academic, sachant que Microsoft vient d’annoncer l’arrêt de son service Microsoft Academic, ce qui risque de poser problème.
Le contenu en soi n’est pas particulièrement original. En revanche, l’originalité et l’intérêt du produit « The Lens », sont constitués par les liens entre les références d’articles et leur présence dans la partie citation des brevets. Ce type de lien, dont l’intérêt est évident car il apporte une possibilité supplémentaire de recherche, a déjà été proposé il y plusieurs années par Dialog et TotalPatent, serveurs payants, mais il n’a pas été beaucoup développé.
Déjà abonné ? Connectez-vous...
Depuis l’apparition dans les années 2000 des premiers services permettant de raccourcir des liens ou urls (Uniform Resource Locator), aussi appelés shorteners, de nombreuses plateformes ont ensuite vu le jour avec plus ou moins de succès.
Ces plateformes apparaissent et disparaissent au gré du temps, laissant le professionnel de l’information confronté à cette instabilité. L’un des derniers en date à abandonner la bataille n’est autre que huit.re, un outil proposé par Framasoft que nous utilisions parfois pour nos articles.
Et même des services, qui sur le papier procurent un sentiment de sécurité quant à leur pérennité, soit parce qu’ils sont issus des géants du Web, soit parce qu’ils existent depuis longtemps, ne sont pas à l’abri de disparaître du jour au lendemain.
Google en a été la preuve il y a quelques années avec son service googl.gl qui resta incontournable jusqu’en 2019. La firme de MountainView préféra pourtant réorienter son service autour de sa plateforme de création de liens dynamiques Firebase Dynamic Links et ferma googl.gl en 2019.
Par ailleurs, le projet TeamURL recense plusieurs centaines de disparitions de services de ce type.1
Les acteurs encore présents sur le marché ont, quant à eux, poursuivi leur évolution et proposent aujourd’hui des services plus larges et analytiques que par le passé.
Déjà abonné ? Connectez-vous...
Temps total de lecture : 25 min
Temps total de lecture : 2 min
Les travaux étudiants (mémoires, thèses ou encore rapports de stage) ont toute leur place dans les sources d’information des veilleurs. Ils peuvent souvent fournir des informations uniques que l’on ne retrouve pas sous d’autres formats ou aiguiller l’internaute vers d’autres ressources pertinentes, notamment grâce aux références bibliographiques.
Mais encore faut-il y avoir accès...
Si l’archivage et la mise à disposition des thèses répondent à des obligations légales et des processus de plus en plus structurés et formalisés ce n’est pas le cas pour les mémoires en France ni à l’international.
Chaque organisme étant libre en matière de diffusion des mémoires, on se retrouve alors avec une multitude d’initiatives isolées qu’il est souvent difficile d’identifier.
Cette quête des mémoires peut vite s’avérer tellement chronophage qu’elle n’est pas nécessairement rentable.
Heureusement avec les années, certaines initiatives unifiées à l’échelle d’un pays ou d’une discipline ont pris de l’ampleur et deviennent des sources de référence en la matière.
Lire aussi : Tour du monde des sites de thèses en accès libre
Déjà abonné ? Connectez-vous...
Les fusions/acquisitions sont depuis longtemps très fréquentes dans le domaine de l’information.
Près de nous, voici des années que Questel rachète des sociétés, en France comme à l’étranger, offrant divers services liés à la propriété intellectuelle, cœur de son activité. Dans un autre domaine, Cision a acheté il y a quelques années Europresse, l’Argus de la Presse et PR Newswire. Cette situation existe aussi aux Etats-Unis.
Aujourd’hui, il s’agit d’un achat important d’un acteur essentiellement privé, en l’occurrence Proquest par l’acteur public qu’est Clarivate. La transaction s’élève à 5,3 milliards de dollars, dont quatre en liquide et 1,3 en actions.
Proquest et Clarivate font partie des plus gros et ont chacun une longue histoire faite de créations de produits, de rachats et également de désinvestissements.
L’activité phare de Proquest consiste à fournir aux bibliothèques du monde entier une grande variété de contenus, remontant parfois loin dans le passé avec une orientation plutôt humanités ainsi que des logiciels permettant d’en tirer le meilleur parti.
Les synergies, dont le montant espéré à terme est de 100 millions de dollars, auront certainement des impacts sur de nombreux produits.
On pense en particulier à Dialog Solutions, bien que non cité dans le communiqué de presse, qui est pour une part en concurrence avec Web of Science et risque de basculer son modèle économique vers l’abonnement annuel plutôt que la facturation à l’activité.
Dialog est d’ailleurs, et depuis plusieurs années, très discret en France, ayant sans doute estimé qu’il avait achevé l’essentiel de son développement possible dans ce pays.
D’ailleurs, le représentant de Dialog Solutions en France, fort discret au demeurant, vient d’annoncer qu’il quittait la société. Heureusement l’assistance technique joignable à Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser. est réactive et compétente.