Bases & Netsources - Lire un no sur 1 page

OpenAlex, un nouveau moteur académique

Carole Tisserand-Barthole

Bases no

413

publié en

2023.04

3808

Acheter ce no

Tags

évaluation outils | moteurs académiques

OpenAlex, un nouveau moteur académique Image 1

OpenAlex est un nouvel outil qui vient se positionner sur le créneau de Google Scholar, Dimensions, Lens.org et les autres. Son but : devenir un catalogue qui recense un maximum de publications scientifiques, mais aussi chercheurs et institutions, une sorte de bibliothèque d’Alexandrie de l’IST version Web.

OpenAlex est un projet de l’organisation à but non lucratif OurResearch financé par Arcadia, un fonds qui œuvre pour la préservation de la culture et la promotion du libre accès.

Nous avons testé la version Alpha (la bêta sortira en juillet prochain) pour savoir ce qu’elle avait à nous offrir et quelle pouvait être sa valeur ajoutée par rapport aux outils déjà en place.

Lire aussi :

De nouveaux moteurs gratuits pour concurrencer Google Scholar (September 2018)

Elicit, un nouveau moteur scientifique au banc d’essai (Bases N° 404 - juin 2022)

Déconstruction de l’article scientifique : une nouvelle façon de rechercher l’information ? (Bases N° 409 - dec 2022)

Recherche bibliographique : moteurs gratuits ou grands serveurs payants, que choisir ? (Bases N° 405 - juil/août 2022)

Comment faire évoluer sa recherche d’information scientifique avec les nouveautés de Google Scholar ? (Bases N° 404 - juin 2022)

Un corpus IST très conséquent

Dans tout moteur académique, la question du corpus est primordiale. OpenAlex indexe 250 millions de contenus, dont 43,8 millions en libre accès, ce qui en fait un des acteurs avec le plus gros corpus après Google Scholar.

Pour se repérer dans la taille des différents corpus, on pourra jeter un coup d’œil au tableau comparatif proposé par OpenAlex sur son site Web et que nous avons reproduit ici en figure 1.

Déjà abonné ? Connectez-vous...

Connexion

La Chine facilite l'accès à sa littérature scientifique

François Libmann

Bases no

412

publié en

2023.03

3196

Acheter ce no

Tags

information scientifique et technique

La Chine facilite l'accès à sa littérature scientifique Image 1

Nous avons déjà, à de multiples reprises, parlé des documents scientifiques d’origine chinoise référencés dans les banques de données et les serveurs d’origine chinoise ou occidentale.

Dès 2006, nous avions évoqué cette question notamment dans un article consacré au marché chinois de l’information à partir d’une conférence donnée au Salon Online de Londres (demander le Bases N° 233 - décembre 2006 à Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.).

Depuis, les initiatives chinoises se sont multipliées et l’offre et l’accessibilité se sont élargies de plusieurs façons :

Augmentation de la production d’articles d’origine chinoise en langue locale ;
Augmentation de la proportion d’articles d’origine chinoise en anglais ;
Possibilité d’effectuer des recherches en anglais dans un grand nombre de bases de données en chinois sachant que, de plus en plus souvent, les références d’articles en chinois sont enrichies de la référence bibliographique en anglais, y compris l’abstract et les mots clés ;
Facilité d’accès aux documents primaires d’origine chinoise, en anglais ou en chinois.

Comment enrichir son sourcing grâce à Google Sheets, Airtable & les autres ?

Céline Boileau

Bases no

412

publié en

2023.03

87166

Acheter ce no

Tags

recherche Web | méthodologie | sourcing veille

Dans le cadre d’une recherche d’informations, le premier réflexe pour identifier des sources est généralement de cibler des médias, des experts, voire des annuaires. Mais il existe une autre ressource utile pour fournir de l’information et à laquelle on pense moins : les listes de sources disponibles sur des tableurs en ligne comme Google Sheets ou Airtable et qui se multiplient.

La volonté de partager des listes de sources sur le Web a toujours existé, surtout avec l’avènement du Web 2.0. Mais le format ainsi que les outils de partage et d’hébergement de ces listes ont évolué. Il y a eu le temps des annuaires (qui sont finalement des sortes de listes), le temps des blogrolls sur les blogs, des outils de bookmarking, des FollowFriday et des listes sur Twitter, etc.

Aujourd’hui, outre Google Sheets, de nouveaux outils de création de bases de données ‘no-code’ et de tableurs en ligne ont vu le jour, dont le plus connu est Airtable. Ces tableurs sont souvent partagés publiquement par des experts, consultants ou autres acteurs d’un secteur particulier, qui disposent en échange de la gratuité du service.

Ces listes plus ou moins exhaustives peuvent se révéler précieuses, car elles constituent un pré-tri de l’information opéré par une personne suffisamment intéressée et experte pour entreprendre ce travail de recherche et de structuration. Elles permettent donc d’aller au-delà pour dénicher des sources utiles, voire des pépites, ou même des idées de structuration de l’information.

Mais elles présentent un problème : la difficulté à les identifier. Souvent nées d’une initiative personnelle, elles sont :

- créées de façon individuelle et ponctuelle ;
- partagées de façon plus ou moins organisée, voire spontanée.

On découvre donc souvent ces listes un peu au hasard de ses pérégrinations sur le Web. Nous nous proposons donc de présenter ici une démarche construite, avec une recherche structurée en ligne, pour éviter de passer à côté de ces pépites.

Déjà abonné ? Connectez-vous...

Connexion

Entre ergonomie et exhaustivité, la distribution de l'information institutionnelle s'améliore

Céline Boileau

Bases no

412

publié en

2023.03

2411

Acheter ce no

Tags

sourcing veille

Entre ergonomie et exhaustivité, la distribution de ... Image 1

Recherche législative française et européenne facilitée, augmentation de la visibilité des questions citoyennes…

Le début d’année 2023 a été riche pour l’information institutionnelle. Or, le suivi et l’analyse de l’activité des institutions publiques et de leurs représentants permettent d’anticiper l’évolution d’un cadre réglementaire et d’y déceler des opportunités. Mais, doté d’un jargon et d’un circuit de l’information propres, ce type de sources reste parfois difficile d’accès. Zoom sur les nouveautés à retenir et les nouveaux outils à découvrir !

Pappers Politique facilite la recherche législative française et européenne

Après les agrégateurs de sources ouvertes Pappers Entreprise, puis Pappers Justice, Pappers Politique met en avant l’information institutionnelle française et européenne, de l’élaboration à la promulgation d’une loi.

Voir notre article Une nouvelle fonctionnalité pour Pappers, BASES n° 409, décembre 2022

Pluralisme, l’outil pour retrouver la parole publique

Céline Boileau

Bases no

412

publié en

2023.03

2897

Acheter ce no

Tags

veille audiovisuelle | multimédia

Pluralisme, l’outil pour retrouver la parole publique Image 1

L’actualité politique est un jeu de ping-pong. Elle est faite de prises de position, et en retrouver l’origine permet de couvrir ses rebonds avec précision et fiabilité. Mais qu’il s’agisse de débats, d’interviews ou de discours, la surveillance et la vérification des interventions publiques constituent une vraie difficulté technique pour les professionnels de l’information.

Premièrement, car ce type de contenu est en grande partie diffusé dans un format audiovisuel, alors que les méthodes et les outils des professionnels de la veille reposent surtout sur du texte. Et même quand ces discours, interviews et citations existent au format textuel (dans des articles de presse par exemple), ils restent très difficiles à identifier et il est nécessaire d’avoir recours à des requêtes longues et complexes pour explorer tout le champ lexical de la prise de parole. Pour savoir comment rechercher des déclarations au format textuel, on pourra se référer à l’article « Retrouver les déclarations d’une personnalité : sources et méthodes », Bases N° 341 - oct 2016, qui reste encore d’actualité pour ce qui est des méthodes proposées.

Deuxièmement, parce que ces sources audiovisuelles restent difficiles à intégrer dans un livrable de veille. Cette étape peut alors nécessiter une écoute longue et minutieuse, une transcription parfois coûteuse, quand il ne s’agit pas de faire soi-même un montage pour en supprimer des extraits… Et tout cela, pour en tirer une ou deux lignes de citations pertinentes, généralement, donc… au format écrit.

Retrouver des discours et déclarations de personnalités publiques issues de sources audiovisuelles représente donc un double défi !

Citations dans les brevets : des ressources stratégiques sous-estimées

Philippe Borne

Bases no

411

publié en

2023.02

2942

Acheter ce no

Tags

brevets

Une citation est, dans un document donné, une référence à un autre document antérieur, traitant en général d’un sujet connexe. Les citations sont bien connues dans le domaine des articles scientifiques où leur nombre est souvent utilisé pour évaluer la qualité d’une publication.

Le développement du mouvement de la science ouverte (open access mais aussi open citations) donne un coup de projecteur aux citations et références, ainsi qu’à leur rôle dans le processus de recherche d’informations et de veille.

De nombreux outils s’emparent de ces données, désormais accessibles librement, pour proposer des fonctionnalités de recherche spécifiques et on voit également l’apparition de nombreux petits outils, souvent gratuits, qui se donnent pour mission d’explorer les réseaux de citations, offrant une autre manière de rechercher des documents pertinents et/ou d’identifier des experts.

On trouve aussi les citations dans les brevets. Et même si elles sont librement accessibles depuis longtemps, la recherche par les citations reste un champ trop peu exploré lors d’une recherche brevets.

Lire aussi :

Le brevet est-il un signal faible pour l'innovation ? (Bases N° 407 - oct 2022)

Savoir utiliser les publications défensives dans une stratégie brevet (Bases N° 403 - mai 2022)

Déterminer la valeur d’un brevet : des outils stratégiques pour l’entreprise (Bases N° 401 - mars 2022)

La recherche de citations et de références boostée par l’IA et les « open citations » (Bases N° 369 - avril 2019)

Nous allons voir dans cet article qu’elles offrent une large gamme de possibilités pour un public très divers : PME détentrice de brevets, désireuse de savoir qui empiète sur son territoire ; inventeur, souhaitant évaluer la nouveauté de son invention ; analyste financier, souhaitant évaluer la valeur d’un brevet ; historien des sciences et techniques mais aussi bien sûr le professionnel de l’information et veilleur ! Penchons-nous sur la multitude d’informations que l’on peut tirer de l’exploitation de ces citations.

Déjà abonné ? Connectez-vous...

Connexion

L’actu du Veilleur : plein phare sur l’IA

Céline Boileau

Bases no

411

publié en

2023.02

3189

Acheter ce no

Tags

outils de veille | IA

L’actu du Veilleur : plein phare sur l’IA Image 1

2023 sera-t-elle l’année où l’utilisation de l’intelligence artificielle (IA) se démocratise au sein de l’activité de veille ? En attendant de le confirmer, notre sélection dans l’actualité de la veille montre que l’IA s’intègre, doucement mais sûrement, dans nos outils quotidiens. Florilège.

NEWS #1 : L’IA de DeepL améliore les écrits en langue étrangère

L’outil de traduction automatique DeepL Translator, devenu incontournable pour les professionnels de l’information, étend son champ de compétences à la réécriture. Auréolé de son nouveau statut de Licorne, DeepL vient de sortir la version bêta de DeepL Write, un outil de rédaction par une Intelligence artificielle.

Comment retrouver la trace d’une personne décédée au XIXe siècle ?

Carole Tisserand-Barthole

Bases no

411

publié en

2023.02

2715

Acheter ce no

Tags

méthodologie

Comment retrouver la trace d’une personne décédée au XIXe ... Image 1

C’est une question qui revient régulièrement : retrouver la trace d’une personne décédée aux siècles précédents dans le but d’identifier dans quel cimetière elle a été enterrée, retrouver des informations pour comprendre les raisons de son décès, garder une trace d’un fait divers pour l’inclure et illustrer un dossier documentaire ou une biographie, etc.

Toutes ces demandes ont un point commun : elles nécessitent d’entrer dans le monde des archives et dans l’idéal même le monde des archives en ligne, ce qui évite de se déplacer.

On sort alors complètement des sources que l’on peut avoir l’habitude d’interroger sur le Web et ce type de requête demande une démarche spécifique.

Lire aussi :

Tous les outils pour rechercher dans les archives du Web (02/2022)

La recherche d’information appliquée aux personnes (04/2019)

Comment retrouver de vieux articles de presse ?

Dans cet article, nous retraçons la méthode à suivre mais aussi les sources à connaître quand il s’agit de retrouver la trace de personnes ayant vécu avant l’arrivée d’Internet.

Nous prendrons comme exemple une demande qui nous avait été envoyée par un lecteur : trouver le lieu de sépulture de Victor-Napoléon Vuillerme-Dunand, un des marionnettistes les plus connus du 19e siècle, fidèle disciple du créateur du théâtre de Guignol à Lyon qui est né en 1810 à Turin et serait décédé le 4 mai 1876.

Ce sont donc les seules informations dont nous disposons à ce stade de l'investigation.

Déjà abonné ? Connectez-vous...

Connexion

Twitter a changé : ce qu’il faut vraiment retenir pour sa pratique de veille

Carole Tisserand-Barthole

Bases no

410

publié en

2023.01

2857

Acheter ce no

Tags

Twitter | médias sociaux

Twitter a changé : ce qu’il faut vraiment retenir pour sa ... Image 1

Depuis le rachat effectif de Twitter par Elon Musk en octobre dernier (après des mois de tergiversations et de retournements en tous genres), le volume d’information et d’articles publiés à propos de Twitter a été très important avec une grande diversité de thèmes abordés : changements au niveau de la politique, licenciements massifs, avis négatifs et positifs sur le rachat, prospective sur l’avenir de ce réseau social, nouvelles fonctionnalités ou disparition de fonctionnalités existantes, etc.

Mais avec l’annonce il y a quelques semaines du départ d’Elon Musk du poste de PDG, même s’il reste propriétaire de Twitter, le soufflé médiatique est rapidement retombé.

Maintenant que la situation se stabilise, il est temps de se pencher sur ce qui a changé chez Twitter au cours des derniers mois surtout en termes de services et de fonctionnalités. Car il y a eu de nombreux changements, souvent éclipsés par les nombreuses polémiques et ces changements viennent modifier certaines pratiques de veille et de recherche d’information que l’on pouvait avoir sur Twitter.

Ce dernier est quoi qu’on en dise toujours à ce jour le réseau social le plus important pour les professionnels de l’information, que ce soit en termes de contenus ou de fonctionnalités.

Un recentrage sur les tweets, le contenu historique de Twitter

Une disparation de certaines fonctionnalités

Elon Musk n’est pas connu pour proposer des transitions en douceur ni de changements progressifs et c’est exactement ce qu’il a fait avec les fonctionnalités et services de Twitter au cours des trois derniers mois. Il a ainsi supprimé pratiquement du jour au lendemain un certain nombre de fonctionnalités, dont certaines avaient un réel intérêt pour le professionnel.

Alors que ces dernières années, Twitter avait choisi de diversifier ses contenus au-delà des tweets classiques avec des espaces audio, un service de newsletter, etc., Elon Musk a pris le chemin inverse en se recentrant sur les tweets.

Déjà abonné ? Connectez-vous...

Connexion

Bercy crée son propre annuaire des entreprises

Céline BOILEAU

Bases no

410

publié en

2023.01

2660

Acheter ce no

Tags

veille commerciale | information business

Bercy crée son propre annuaire des entreprises Image 1

Le ministère de l’Économie et des Finances a annoncé il y a quelques semaines l’arrivée d’un nouvel annuaire des entreprises, officiel. Ce dernier a été créé par Etalab, le département d’ouverture des données de la Direction Interministérielle du Numérique, et la Direction Générale des Entreprises.

Trois filtres de recherche sont proposés : la zone géographique, le nom du dirigeant et la situation administrative (état administratif/type de structure/labels et certificats/Domaine d’activité/Code NAF ou APE).

Ils permettent de retrouver les données publiques détenues par l’administration sur une entreprise, une association ou une administration.

Informations générales (N° Siren, n° TVA, taille de l’entreprise, date de création, statut juridique) ;
Justificatif d’immatriculation contenu dans un extrait KBIS (pour les sociétés au Registre du commerce)/D1 (pour les artisans au Registre des métiers) ;
État civil du ou des dirigeants ;
Annonces BODACC de dépôt des comptes (avec deux liens, sur l’annonce officielle et la fiche Infogreffe) ;

Les conventions collectives ;

Cet annuaire est toutefois plus utile aux entreprises qu’au professionnel de l’information car il permet à celles-ci d’intégrer plus facilement leurs justificatifs dans une API afin de les rendre publics. Pour le veilleur, en revanche, cet annuaire n’a pas de valeur ajoutée en comparaison de Pappers, le moteur open data gratuit qui ne cesse de s’améliorer.