Bases & Netsources - Les articles de BASES

Une fenêtre sur l'Outre-mer : regards croisés entre droit et territoires

FRANÇOIS LIBMANN

Bases no

432

publié en

2025.01

4189

Acheter ce no

Tags

trésor du web

Une fenêtre sur l'Outre-mer : regards croisés entre droit ... Image 1

L’avocat guyanais Patrick Lingibé a constaté avec regret que l’Outre-Mer en général, et, spécifiquement le droit des Outre-Mer était très mal connu en métropole.

Il a observé que les gouvernements français ont souvent confié la gestion des affaires ultramarines à des personnes incompétentes et déplore la baisse de confiance entre l’Outre-Mer et l’Hexagone.

C’est pour contribuer à renforcer la force de ce lien qu’il a créé ce site : DROM-TOM, le portail du droit Outre-Mer.

Orbit Intelligence propose de nouveaux outils dopés à l’IA

FRANCOIS LIBMANN

Bases no

431

publié en

2024.12

3701

Acheter ce no

Tags

Questel | brevets | IA

Orbit Intelligence propose de nouveaux outils dopés à l’IA Image 1

L’IA étant devenue incontournable, la plupart des serveurs et agrégateurs de presse développent de nouveaux outils ou de nouvelles interfaces intégrant ces développements technologiques.

Les équipes de Questel sont persuadées que l’IA va profondément bouleverser les opérations liées à la propriété intellectuelle, aussi bien pour la recherche, que la visualisation des résultats puis de leur analyse, le classement des résultats et plus généralement pour optimiser les workflows complexes de ce domaine.

Nous avons déjà présenté dans ces colonnes SCOPUS AI et Web of Science Research Assistant (BASES, Nos 425 et 428). Nous explorons aujourd’hui les améliorations apportées par Questel à Orbit Intelligence par l’utilisation de ChatGPT tant pour la recherche que pour la visualisation des réponses.

L’IA peut-elle écrire à notre place ? le test des « styles » de Claude

ANNE MARIE LIBMANN

Bases no

431

publié en

2024.12

3519

Acheter ce no

Tags

évaluation outils | IA

L’IA peut-elle écrire à notre place ? le test des ... Image 1

Nous avions décrit dans la rubrique IA du dernier numéro de BASES comment utiliser la nouvelle fonctionnalité « styles rédactionnels » de Claude, dont la promesse est de produire un texte avec le « bon style de rédaction ».

Cette fonctionnalité est intéressante en soi, car elle nous emmène déjà au-delà de la « simple » génération de contenus, vers la création de textes toujours plus personnalisables, de qualité comparable à ceux que l’on produit manuellement et même, pourrait-on dire, « humanisés ».

Claude fait d’une certaine façon « coup double » avec cette fonctionnalité des styles personnalisés : elle concerne à la fois la rédaction d’un texte en imitant un auteur humain donné et l’adaptation du message au type de public cible.

Faire le lien entre tradition et innovation : le voyage d’un bibliothécaire avec Perplexity.ai

RYAN MULHOLAND

Bases no

431

publié en

2024.12

2846

Acheter ce no

Faire le lien entre tradition et innovation : le voyage ... Image 1

Ryan, qui a rejoint notre équipe de rédaction, est « Research librarian » à l’Université Wesleyan du Tennessee aux États-Unis. Cette fonction de « bibliothécaire spécialisé en recherche », située à l’intersection de la documentation et du soutien à la recherche académique joue un rôle très important dans la diffusion des connaissances et le développement des compétences en recherche au sein de l’université.

Les contributions de Ryan sont traduites de l’anglais par notre équipe.

Plus d’un an s’est écoulé depuis que l’intelligence artificielle (IA) s’est largement répandue, modifiant, en particulier, radicalement les processus de prise de décision, les modes d’écriture, de pensée et d’analyse des modèles, entre autres. Depuis la sortie de logiciels tels que ChatGPT, l’utilisation de l’IA et ses applications ont été vivement débattues et discutées. Qu’il s’agisse de l’application de la loi, des soins de santé, de l’éducation ou des ressources humaines, l’utilisation (et dans certains cas, l’abus) de l’IA a suscité l’émoi de nombreux professionnels intéressés par ces questions. Dans mon propre domaine, celui des sciences de l’information, les publications d’articles, les ateliers numériques et les autres occasions d’apprendre, d’expérimenter et de discuter de cette technologie émergente et passionnante ne cessent de se multiplier.

L’ordinateur personnel est né bien plus tôt qu’on ne le pense

FRANÇOIS LIBMANN

Bases no

431

publié en

2024.12

2981

Acheter ce no

L’ordinateur personnel est né bien plus tôt qu’on ne le ... Image 1

L'utilisation d'un ordinateur personnel est aujourd'hui une évidence. Il n'est plus nécessaire d'être un expert pour s'en servir, d'autant plus que ces appareils peuvent désormais prendre la forme d'un téléphone.

En fait, c’est dans l’État du New Hampshire aux États-Unis, précisément au Dartmouth College, le vrai nom de l’« Université de Dartmouth » tel qu’on le voit écrit dans la presse, que ce concept s’est matérialisé pour la première fois en 1964. Le Dartmouth College appartient à la Ivy Ligue qui rassemble huit universités prestigieuses du nord-est des États-Unis.

Ce concept fut l’aboutissement de la démarche de deux enseignants en mathématique dans cette université, John Kemeny et Thomas Kurz.

Ce dernier vient de décéder à l’âge de 96 ans, ce qui explique que ce sujet revienne dans l’actualité.

Les 20 ans de Google Scholar : un tournant ?

FRANCOIS LIBMANN

Bases no

430

publié en

2024.11

3818

Acheter ce no

Tags

Google | moteurs académiques

Les 20 ans de Google Scholar : un tournant ? Image 1

Google Scholar a été créé en 2004 par deux chercheurs. Son objectif a été et est toujours de référencer de grandes quantités d’articles, de rapports, de comptes-rendus de conférences, de livres ou de thèses pour peu qu’ils relèvent du secteur académique.

Sa devise « Standing on the shoulders of giants » signifie que Google Scholar existe parce que des chercheurs ont écrit et accumulé d’immenses quantités de connaissances. Cela a justifié la création de Google Scholar pour aider à naviguer dans cet océan d’information et y trouver des réponses à ses questions.

Google Scholar est beaucoup utilisé, et depuis longtemps, par un grand nombre de chercheurs

Les raisons de cette large utilisation sont très simples.

D’une part, l’accès est gratuit alors que de nombreuses sources d’information scientifique sont payantes. C’était particulièrement vrai il y a vingt ans, mais moins aujourd’hui.

D’autre part, l’étendue de sa couverture a pour conséquence qu’il est rare de ne pas trouver au moins quelques réponses intéressantes et bien souvent un nombre non négligeable à une question scientifique.

Enfin, son utilisation est simple, voire très simple, même si quelques possibilités avancées sont disponibles bien que pas toujours très mises en avant.

En revanche, la troncature n’existe pas alors que c’est un « must » pratiquement partout. On ne peut pas non plus entrer une chaîne de recherche experte sans même parler de combinaisons d’étapes totalement impossibles.

En ce qui concerne le traitement des réponses, leur nombre est limité à 1 000 ce qui est largement suffisant pour une simple lecture, mais ne l’est plus pour faire du data mining.

Aujourd’hui, Google Scholar est quelque peu sur la sellette.

Même si ses utilisateurs semblent être toujours aussi nombreux, on voit poindre une série de critiques plus ou moins fondamentales.

L'IA Act pour la veille et l'IE : naviguer entre marécage et certitudes

Thibault du MANOIR de JUAYE, avocat à la Cour

Bases no

430

publié en

2024.11

3847

Acheter ce no

Tags

droit d'auteur | IA

L'IA Act pour la veille et l'IE : naviguer entre marécage ... Image 1

Maître Thibault du Manoir de Juaye, avocat à la Cour de Paris, est un spécialiste reconnu en intelligence économique et en droit de la sécurité privée. Il a fondé son cabinet en 1995, intervenant régulièrement sur des dossiers liés à l’intelligence économique, notamment en matière de propriété intellectuelle.

Auteur de plusieurs ouvrages sur le sujet, il a également été rédacteur en chef du magazine « Regards sur l’IE ».

L’intelligence artificielle amplifie les problématiques juridiques déjà connues pour la veille et l’IE, notamment en raison de sa faculté à faciliter les recherches et à générer automatiquement des contenus de tout type.

Même si elle n’en est sans doute qu’à ses débuts, il existe déjà des tentatives pour encadrer juridiquement l’intelligence artificielle (IA).

Des juristes imaginatifs (et pour moi loufoques) vont même jusqu’à soutenir qu’il faudrait donner la personnalité juridique aux systèmes d’IA, un peu comme les sociétés ont la personnalité morale. Mais il ne s’agit pour le moment que de spéculations ludiques et récréatives, sans grand intérêt, sauf pour quêter une exposition médiatique à moindres frais.

Il faut donc s’en tenir au droit positif.

L’intelligence artificielle est désormais encadrée par un règlement européen en date du 12 juillet 2024, texte qui sera complété par des milliers de pages d’application.

L'IA transforme le monde professionnel : gains de productivité et éthique

Anne-Marie LIBMANN

Bases no

430

publié en

2024.11

3294

Acheter ce no

Tags

IA

L'IA transforme le monde professionnel : gains de ... Image 1

Devant l’avalanche d’annonces sur les innovations et nouveautés en IA, cette rubrique met en avant celles que nous considérons comme utiles pour les professionnels de l’information.

N’hésitez pas à nous partager vos questions ou sujets d’intérêt liés à l’IA en nous écrivant à l’adresse Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser..

En préliminaire, il nous paraît important de clarifier notre position sur la difficulté à recommander de s’abonner à tel ou tel modèle d’IA pour accéder à certaines fonctionnalités (même si nous pensons que l’abonnement à ChatGPT est un must).

La dynamique entre les fonctionnalités gratuites et payantes dans les modèles d’IA évolue constamment, en fonction des stratégies commerciales, des retours utilisateurs et des innovations technologiques. Une fonctionnalité peut être d’abord réservée aux abonnés puis devenir gratuite, ou inversement, être monétisée après avoir gagné en popularité.

Visual PDFs : la révolution de Claude dans l’analyse documentaire

Anthropic sort une nouvelle version de son modèle Claude 3.5 Sonnet avec une innovation majeure dans le traitement documentaire, qui enrichit l’analyse les documents complexes en extrayant et analysant les éléments visuels contenus quand il existent.

Judilibre : l’open data judiciaire en transformation

FRANÇOIS LIBMANN

Bases no

429

publié en

2024.10

3723

Acheter ce no

Judilibre : l’open data judiciaire en transformation Image 1

Notre première démarche en préparant cet article a été d’interviewer Denis BERTHAULT, vice-président du GFII, et surtout, fin connaisseur des nombreuses évolutions et péripéties de l’information juridique en ligne en France. Qu’il soit ici remercié pour ses précieuses informations accompagnées de commentaires fort pertinents.

Judilibre, qui a vocation à diffuser en open access les décisions de justice, monte en puissance comme prévu. La Cour de cassation qui opère ce service s’était vu confier cette mission de mise à disposition des décisions de justice par un décret du 29 juin 2020.

Le choix de la Cour de cassation pour la mise en open data des décisions judiciaires tient au fait qu’une des missions traditionnelles de la Cour est la diffusion de la jurisprudence.

Palmarès brevet et potentiel d’innovation des entreprises : attention aux risques de conclusion hâtive

Philippe Borne

Bases no

429

publié en

2024.10

3026

Acheter ce no

Palmarès brevet et potentiel d’innovation des entreprises : ... Image 1

« Avec 1542 demandes de brevets, Stellantis est le premier déposant en 2023 ». La presse économique est friande de ce type de chiffrage.

Que peut-on en déduire ? L’avantage de ces données brutes, c’est leur simplicité de lecture ; le dépôt de demandes de brevet étant souvent considéré comme un indicateur de la capacité d’innovation d’une entreprise, on peut en conclure qu’« en 2023, Stellantis est plus innovant que Safran qui l’est plus que Valeo… ».

Est-ce aussi simple ? Probablement pas, car attribuer le même poids à tous les brevets, c’est oublier que tous ne se valent pas. Comment donc introduire du qualitatif dans ce type de comptage, afin d’arriver à une vision plus juste ?

Passons en revue les différentes options proposées jusqu’à présent.

AU FIL DE L'ACTUALITE : Lenso.ai, Qwant/ecosia et DeepL

François LIBMANN

Bases no

429

publié en

2024.10

4286

Acheter ce no

AU FIL DE L'ACTUALITE : Lenso.ai, Qwant/ecosia et DeepL Image 1

Lenso.ai se positionne comme un leader dans la recherche d'images

Lenso.ai est une plateforme spécialisée dans la recherche inversée d’images. Créé récemment, cet outil permet aux utilisateurs de télécharger une image puis d’obtenir en résultat une série d’images plus ou moins proches/analogues à l’image de départ. Elle est d’origine polonaise, comme sa célèbre consœur PimEyes spécialiste de la recherche faciale.

La plateforme exploite des algorithmes complexes qui analysent l’image téléchargée et la comparent à un index interne de données visuelles en ne repérant que les meilleures correspondances. Les résultats sont intelligemment classés en plusieurs catégories distinctes :

Lieux / Personnes / Doublons / Images similaires / Images associées

Par ailleurs, Lenso.ai, grâce à une collaboration avec la société singapourienne EyeMatch, a lancé un outil de reconnaissance faciale particulièrement performant. Sur ce terrain, Lenso.ai n’est pas le seul.

Nous avons testé le Web of Science Research Assistant

François LIBMANN

Bases no

428

publié en

2024.09

3289

Acheter ce no

Tags

web of science | littérature scientifique | IA

Nous avons testé le Web of Science Research Assistant Image 1

Après neuf mois de tests auprès de la communauté des utilisateurs de Web of Science, Clarivate vient d’annoncer le lancement de son assistant de recherche dopé à l’IA pour la recherche sur le contenu de Web of Science Core qui propose 92 millions de références dans le domaine scientifique depuis le début du 20° siècle.

Nous avons testé ce nouvel outil qui illustre l’investissement des serveurs et agrégateurs dans des possibilités de recherche nouvelles sur leur fonds grâce à l’intelligence artificielle.

Interface et options de recherche

L’écran d’accueil est commun avec la recherche classique sur le Web of Science. L’accès se fait par un clic sur « Search assistant » qui donne accès à la nouvelle interface. On se voit alors proposer quatre options qui correspondent à autant de problématiques.

La première baptisée « Start a new search by asking a question » permet de lancer une question spécifique en langage naturel. « C’est une méthode intuitive pour commencer une exploration, particulièrement utile pour les chercheurs qui ne sont pas familiers avec les techniques de recherche avancées. »

La seconde, « Understand a topic » a pour objectif d’offrir rapidement une vue d’ensemble structurée d’un sujet spécifique. C’est un excellent point de départ pour se familiariser rapidement avec un nouveau domaine de recherche ».

L’intelligence économique territoriale : stratégies locales pour des défis globaux

Jean-Pierre LARCHER, Anne-Marie LIBMANN

Bases no

428

publié en

2024.09

2783

Acheter ce no

L’intelligence économique territoriale : stratégies locales ... Image 1

Interview de JEAN-PIERRE LARCHER, membre du collège des Emérites - Académie de l’Intelligence Economique.

Nous avons souhaité interviewer Jean-Pierre Larcher, un pionnier de l’intelligence économique et du développement territorial, dont les réflexions sur les défis contemporains et l’importance de la souveraineté économique nous apparaissent essentielles pour éclairer les enjeux actuels des collectivités.

Jean-Pierre Larcher compte plus de quarante ans d’expérience dans la gestion de projets liés à l’intelligence économique et au développement territorial, aussi bien en France qu’à l’international. Son parcours impressionnant inclut la direction de projets innovants tels que « Maîtrise de l’Information » et la contribution à l'élaboration de la Charte partenariale entre l'Etat et Régions de France sur l’Intelligence Économique Territoriale.

Depuis 2016 jusqu’à récemment, M. Larcher a co-piloté la Mission Stratégie Prospective Intelligence Économique (SPIE) de la Région Normandie, une initiative pionnière au sein d’une collectivité régionale. En formant des réseaux d’acteurs économiques régionaux et en lançant des programmes novateurs, il a contribué à faire de la Normandie un leader national en intelligence économique.

Derwent défend la qualité et supériorité de ses abstracts face à l’IA

François LIBMANN

Bases no

428

publié en

2024.09

2739

Acheter ce no

Tags

abstracts | derwent | brevets | IA

Derwent défend la qualité et supériorité de ses abstracts ... Image 1

DERWENT qui réécrit les titres et les abstracts de brevets depuis des dizaines d’années affirme que sa pratique est plus performante qu’une utilisation d’une IA.

La banque de données DWPI (Derwent World Patents Index) commercialisée aujourd’hui par Clarivate a été créée il y a plus de 60 ans et a une grande notoriété auprès des spécialistes de la recherche d’information brevet.

DWPI a longtemps été la principale source utilisée par les professionnels.

Sa valeur ajoutée tient en plusieurs points :

• La réécriture par des experts (aujourd’hui au nombre de 900) du titre et du résumé pour les rendre plus clairs et plus informatifs alors que la tendance des déposants est justement d’être le moins compréhensible ou le plus général possible ;

• L’extraction et la présentation des informations concernant la nouveauté, les avantages, l’usage ainsi qu’un focus technologique ;

• L’attribution des codes de classifications spécifiques en plus des classifications classiques (CIB et CPC) ;

• Une vérification, avec éventuellement des compléments, concernant les données bibliographiques.

Lancement des modèles o1 d’OpenAI : raisonnement avancé et spécialisation STEM

Anne-Marie LIBMANN

Bases no

428

publié en

2024.09

2767

Acheter ce no

Lancement des modèles o1 d’OpenAI : raisonnement avancé et ... Image 1

OpenAI continue d’innover à une vitesse impressionnante. On se souvient que ce n’est qu’en mai 2024 qu’OpenAI a lancé GPT-4o.

Le 12 septembre 2024 dernier, le suspense derrière le projet du nom de code Strawberry a été levé avec le lancement d’une nouvelle famille de modèles LLM appelée la o1, dont la caractéristique clé est la capacité de raisonnement avancé.

La famille OpenAI o1 comprend deux principaux modèles : o1-preview, conçu pour les tâches de raisonnement avancé et résolution de problèmes complexes, et o1-mini, optimisé pour des tâches spécifiques telles que le codage avec un coût réduit.

Contrairement aux modèles précédents qui généraient des réponses principalement basées sur des associations statistiques, o1 utilise un processus de « chaîne de pensée : les problèmes complexes sont décomposés en étapes logiques, et les temps de réflexion du modèle sont ajustés dynamiquement en fonction de la complexité de la tâche.

ScieLO : un pont vers la science latino-américaine

François Libmann

Bases no

427

publié en

2024.08

2936

Acheter ce no

Tags

ist | serveur de bases de données

ScieLO : un pont vers la science latino-américaine Image 1

SciELO (Scientific Electronic Library Online) est un programme de coopération internationale dont l’objectif est le développement du libre accès aux publications scientifiques des pays latino-américains, des Caraïbes, de l’Espagne et du Portugal. Ce libre accès est une ligne d’action prioritaire depuis 2019 de ce programme et l’objectif est que tout le contenu soit en libre accès d’ici à la fin de 2025. Un autre objectif est le développement du multilinguisme entre le portugais, l’espagnol et l’anglais, l’anglais étant de plus en plus présent pour augmenter la visibilité et la reconnaissance à l’international de ces publications. SciELO est aussi et surtout une banque de données bibliographique qui propose aujourd’hui 1 219 260 références bibliographiques.

Une croissance continue de 1997 à aujourd’hui

Née au Brésil en 1997 avec le soutien de plusieurs organismes publics, SciELO intègre aujourd’hui les publications de 19 pays à savoir le Brésil, le Mexique, la Colombie, le Chili, l’Argentine, Cuba, l’Espagne, l’Afrique du Sud, le Portugal, le Venezuela, Costa Rica, la Bolivie, l’Uruguay, l’Équateur, le Paraguay et les Antilles. Le Brésil en fournit à lui seul plus de 42 % suivi par le Mexique, la Colombie et le Chili. On trouve en dernière position le contenu en provenance des Antilles avec 1,6 pour mille (1 979 références), anecdotique mais présent. Plus précisément, en ce qui concerne les Antilles, le seul contributeur est The University of The West Indies à la Jamaïque qui publie le West Indian Medical Journal, lequel est disponible aussi sur Scopus, Web of Science, EBSCO ainsi que les bases de données Embase et Biosis.

AskAdis : une interface intégrant l’IA pour rechercher des synthèses sur les médicaments

François Libmann

Bases no

427

publié en

2024.08

3229

Acheter ce no

Tags

ist | biomédical | IA

AskAdis : une interface intégrant l’IA pour rechercher des ... Image 1

AskAdis est une interface innovante utilisant l’intelligence artificielle pour fournir des synthèses complètes sur le développement de médicaments. Elle offre des informations validées sur les essais cliniques et les propriétés des médicaments, avec une présentation moderne et intuitive.

Adis est une société spécialisée dans la fourniture de services d’informations et de solutions aux professionnels de la santé et de l’industrie pharmaceutique. Fondée en 1969, Adis fait aujourd’hui partie du groupe Springer Nature.

Elle édite une trentaine de publications spécialisées, offre différents services et propose plusieurs banques de données essentiellement consacrées aux étapes de développement de médicaments.

Claude et Grok-2 : l'IA entre collaboration, transparence et... provocation

Anne-Marie Libmann

Bases no

427

publié en

2024.08

2803

Acheter ce no

Tags

IA

Claude et Grok-2 : l'IA entre collaboration, transparence ... Image 1

La concurrence féroce entre les modèles d’IA n’a pas ralenti cet été, avec la poursuite des annonces de nouvelles versions commerciales et open source, et progrès en matière de traitement vocal, visuel et textuel. Parmi ces innovations, nous avons identifié certaines fonctionnalités et nouveautés dont certaines ont un impact sur nos pratiques de l’IA générative.

Avec les artefacts, Claude devient votre collaborateur et coéquipier

Anthropic vient d’annoncer la disponibilité d’une nouvelle fonctionnalité sur toutes les versions du modèle, tant payantes que gratuites (bien que beaucoup plus limitées).

Cette fonctionnalité permet de générer et d’afficher de façon interactive les réponses du chatbot dans une fenêtre distincte de la conversation principale. Il est important de noter que le terme « artefacts », sans définition très précise, est également utilisé pour désigner le contenu produit par le modèle (textes, visualisations, interfaces, etc.).

Suivre le brevet européen à effet unitaire dans les bases de données

Philippe Borne

Bases no

427

publié en

2024.08

2651

Acheter ce no

Tags

brevets

Suivre le brevet européen à effet unitaire dans les bases ... Image 1

Voici un peu plus d’un an que le brevet européen à effet unitaire est entré en vigueur, le 1er juin 2023, après plusieurs dizaines d’années d’âpres discussions. Cette arrivée représente un changement majeur pour l’ensemble des déposants de brevets, et pas seulement en Europe. Elle implique une nouvelle procédure, de nouvelles actions et dates, d’autant plus qu’y est associé un nouveau tribunal, la Juridiction Unifiée des Brevets. Nécessairement, tous ces nouveaux évènements doivent apparaître dans les bases de données. Comment ? C’est ce que nous allons voir.

Le brevet unitaire, en bref

Le brevet européen à effet unitaire est né sur des fondations : le brevet européen classique.

Valoriser une invention par un dépôt de demande de brevet dans son pays, la France par exemple, c’est bien, mais les produits créés par nos entreprises ayant rarement un marché uniquement en France, il peut être sage d’étendre le dépôt de demande de brevet national par des dépôts à l’étranger, générant une famille de brevets qui sera constituée de l’ensemble des titres valorisant une même invention dans plusieurs pays.

Si votre marché se trouve dans plusieurs pays - France, Allemagne, Espagne… - il est nécessaire d’effectuer un dépôt auprès des offices de chacun de ces pays, dans des langues différentes, initiant des procédures qui risquent de ne pas avancer à la même vitesse, générant un ensemble difficile à gérer, et coûteux.

Pour remédier à cet inconvénient, a été mis en place en 1973 le brevet européen classique, qui n’est pas un brevet de l’Union européenne.

La Fondation Gates bouleverse le paysage de la publication scientifique

FRANCOIS LIBMANN

Bases no

426

publié en

2024.06

3720

Acheter ce no

Tags

ist | open access

La Fondation Gates bouleverse le paysage de la publication ... Image 1

La Fondation Bill et Melinda Gates créée en janvier 2 000 s’est donné pour mission d’améliorer les conditions de vie des populations défavorisées à travers le monde, en se concentrant initialement sur la santé mondiale, les bibliothèques et l’éducation dans le nord-ouest du Pacifique.

En 2006, la Fondation a été restructurée pour inclure des divisions dédiées au développement mondial et à la santé mondiale, en plus de ses activités aux États-Unis.

Au fil des années, elle a élargi ses domaines d’intervention, notamment dans la lutte contre les maladies, l’éducation, le développement agricole et l’adaptation au changement climatique en Afrique et en Asie.

Des débuts philanthropiques à l’engagement pour l’open access

La Fondation finance des projets de recherche qui lui sont soumis en privilégiant, outre l’excellence scientifique, les projets collaboratifs ayant un fort potentiel d’impact positif sur les populations les plus vulnérables, en accord avec sa mission philanthropique.

ADAY offre désormais la possibilité de combiner les étapes de recherche sur sa nouvelle plateforme

François LIBMANN

Bases no

426

publié en

2024.06

3446

Acheter ce no

Tags

méthodologie | agrégateurs de presse

ADAY offre désormais la possibilité de combiner les étapes ... Image 1

La possibilité de combiner les étapes de recherche est un outil très puissant, très utile pour des recherches complexes.

Cette fonctionnalité, longtemps et toujours présente sur les serveurs traditionnels, est aujourd’hui peu courante, voire inexistante, chez les agrégateurs de presse.

On peut certes toujours y utiliser parenthèses et opérateurs pour combiner différents concepts, mais cela s’avère rapidement compliqué.

Il est beaucoup plus simple, élégant et performant d’utiliser la combinaison d’étapes.

Médias et droit d’auteur dans le contexte de l’IA générative (IAG)

Anne-Marie LIBMANN

Bases no

426

publié en

2024.06

3439

Acheter ce no

Tags

droit d'auteur | IA

Médias et droit d’auteur dans le contexte de l’IA ... Image 1

Deux rapports influents sur les médias, tout juste publiés, ont retenu notre attention dans la perspective des enjeux liés au droit d’auteur et à l’utilisation des sources, notre ressource primaire.

Le rapport intitulé « Un journalisme de confiance à l’ère de l’IA générative » publié par l’European Broadcasting Union, basé sur des entretiens avec 40 personnalités influentes des médias et des universitaires, souligne que l’utilisation d’IA pour réutiliser des contenus protégés sans mentionner explicitement les sources risque de nuire à la création originale et menace la survie du secteur créatif.

• L’un des défis majeurs réside dans la collaboration entre médias et entreprises technologiques est le développement de modèles de licence clairs pour l’utilisation éthique des données. Ce qui implique de surmonter la méfiance persistante entre les deux secteurs et de favoriser une approche ouverte et collaborative.

• Le rapport exige une transparence complète des données exploitées par les intelligences artificielles et demande une rémunération juste pour l’utilisation des contenus et données journalistiques, un enjeu primordial au moment où la précarité des journalistes s’accentue avec le développement de l’IA.

Les périls et la puissance du NOT dans la stimulation des chatbots

Marydee OJALA

Bases no

426

publié en

2024.06

2968

Acheter ce no

Tags

recherche Web | méthodologie | IA

Les périls et la puissance du NOT dans la stimulation des ... Image 1

Nous avons le plaisir d’accueillir dans nos colonnes Marydee Ojala, professionnelle de l’information américaine très connue. Elle est rédactrice en chef de la revue ONLINE SEARCHER.

Nous avons adapté pour BASES l’article de Marydee, précédemment publié dans sa version originale en anglais dans la section ONLINE SEARCHER du numéro 5, volume 44, paru en juin 2024 de la revue COMPUTERS IN LIBRARIES sous le titre « The perils and power of NOT in prompting Chatbots » dans la rubrique « Voices of the searchers »

La plupart des professionnels de l’information connaissent bien les commandes booléennes de base : AND, OR et NOT. Elles fonctionnent parfaitement pour la recherche dans les bases de données traditionnelles. Lorsque nous enseignons les techniques de recherche, nous nous appuyons sur des exemples et des diagrammes de Venn pour démontrer la puissance de la recherche booléenne. J’ai toujours pensé que nous devrions souligner les dangers de la commande NOT, en particulier dans les ressources en texte intégral proposant des documents volumineux.

Utiliser la force prédictive de l’IA pour l’analyse

Céline BOILEAU

Bases no

426

publié en

2024.06

3400

Acheter ce no

Tags

tendances | IA

Utiliser la force prédictive de l’IA pour l’analyse Image 1

Le battage médiatique autour de l’IA générative a quelque peu éclipsé les avancées tout aussi décisives de l’IA prédictive dans les domaines de la recherche et de la veille d’informations. Pourtant, la première n’aurait pas rencontré un accueil aussi favorable dans les entreprises sans l’expérience de la seconde qui opère déjà, depuis des années, une transformation en profondeur de nos pratiques professionnelles.

Depuis qu’il est devenu possible pour tous d’interroger des intelligences artificielles dans un langage naturel, on parle beaucoup de l’impact de l’IA générative pour les métiers de l’information (voir notre article « Search: quand les moteurs “recherchent pour vous” », Bases N° 425 - mai 2024).

Mais cette dernière n’est pas arrivée en terrain vierge. Il est donc temps de remettre en lumière l’IA prédictive pour replacer l’apport des modèles de langage dans une perspective plus juste au sein des métiers info-documentaires.

ACCES LIBRE - Le droit d’auteur face à l’IA générative : Interview de Philippe Masseron (gf2i) sur les enjeux juridiques et économiques des métiers de l’information et de la donnée

Anne-Marie Libmann

Bases no

425

publié en

2024.05

4125

Acheter ce no

Tags

droit d'auteur | propriété intellectuelle | professionnel de l'information | IA

ACCES LIBRE - Le droit d’auteur face à l’IA générative : ... Image 1

Philippe Masseron du gf2i (Groupement français de l’industrie de l’information) nous éclaire sur les enjeux cruciaux du droit d’auteur à l’ère de l’IA générative. Entre risques de prédation massive des contenus et opportunités d’accès et d’innovation portées par l’IA, les acteurs de la création et de l’information doivent se mobiliser pour défendre leurs intérêts et repenser leurs modèles de valorisation.

Le rôle d’instances comme le gf2i sera clé pour peser dans les débats législatifs en cours et créer les nouveaux équilibres dans l’économie de la donnée.

Philippe MASSERON

Expert en droit de la propriété littéraire et artistique et en gestion de droits

Après des études juridiques (DEA en Finances publiques et Fiscalité – Paris 2) et en Information Communication (Institut Français de Presse – Paris 2), Philippe MASSERON a successivement occupé les postes de directeur juridique et directeur général au CFC (Centre Français d'exploitation du droit de Copie).

Il est administrateur du gf2i (Groupement Français de Industries de l'Information) délégué à la prospective. Il participe régulièrement aux missions du CSPLA.

Anne-Marie Libmann (AML) : Comment définissez-vous le problème de fond sur la question du droit d’auteur par rapport aux systèmes d’intelligence artificielle générative (SIAG) ?

Philippe Masseron (PM) : Nous assistons à une réaccélération et une amplification massive du phénomène de scraping, fouille et crawling des données. Cela n’est pas nouveau, nous avons déjà été confrontés à des situations similaires par le passé qui ont suscité de vives inquiétudes, comme lors du lancement de Google Books ou des grands programmes de numérisation des bibliothèques. Mais l’échelle et la vitesse ont changé. Aujourd’hui, il existe d’immenses bases de contenus protégés accessibles, notamment dans le domaine scientifique, par exemple SciHub qui rassemble des millions de documents en infraction avec le droit d’auteur.

Scopus AI : une nouvelle façon de rechercher dans SCOPUS avec l’intelligence artificielle

François LIBMANN

Bases no

425

publié en

2024.05

4145

Acheter ce no

Tags

Scopus | IA

Scopus AI : une nouvelle façon de rechercher dans SCOPUS ... Image 1

La plateforme Scopus propose depuis longtemps des outils de recherche classiques : opérateurs booléens, et de proximité, navigation dans les citants/cités. Les fonctionnalités apportées par Scopus AI permettent d’expérimenter de nouvelles stratégies.

Tous les serveurs/agrégateurs présents sur le marché sont en train d’intégrer plus ou moins rapidement des fonctionnalités d’intelligence artificielle. Ils le font souvent en proposant à des bêta-testeurs, souvent des clients importants, de les aider à finaliser la mise au point de ces nouvelles fonctionnalités. D’autres, et ce n’est pas incompatible, mettent progressivement à disposition des séries d’outils innovants.

Nous ouvrons une rubrique dédiée à l’IA chez les grands serveurs de bases de données. Et nous commencerons cette série d’articles par Scopus AI, la nouvelle offre qu’Elsevier est en train de développer et qui est toujours en bêta.

Search : quand les moteurs « recherchent pour vous »

Céline Boileau

Bases no

425

publié en

2024.05

2819

Acheter ce no

Tags

recherche Web | IA

Search : quand les moteurs « recherchent pour vous » Image 1

Entre les annonces de Google et d’OpenAI, l’utilisation de l’IA dans la recherche redessine irrémédiablement les pratiques sur Internet. Aux agrégateurs traditionnels comme les moteurs de recherche et les médias sociaux, s’ajoutent donc les moteurs avec IA. Pour les veilleurs, le challenge se déplace de la synthèse à la vérification des résultats de recherche.

Il y a quelques jours, OpenAI volait la vedette à Google qui présentait pourtant sa Keynote, événement phare des groupes de la tech. La rumeur, qu’Open AI ne s’est pas empressé de démentir, annonçait le lancement de son propre moteur de recherche. Finalement, ce dernier a (en attendant?) présenté un nouveau modèle gratuit qui intègre le web et les GPTs, des fonctionnalités jusqu’alors payantes (environ 20 €/mois). Si l’on ajoute la liste d’accords de licences avec les médias qui s’allonge chaque semaine, on comprend que l’ambition de ce dernier est réelle et se veut à la hauteur des attentes.

Les utilisateurs utilisent en effet les chats d’IA comme des moteurs de recherche et y font leurs recherches malgré le risque d’hallucination. La recherche d’informations fait ainsi partie des usages inattendus des modèles de langage, créés à l’origine pour deviner des suites de phrases. D’après une étude de The Verge, 53 % des utilisateurs et 61 % des Millenials utilisent les chats IA plutôt que les moteurs de recherche traditionnels pour faire leurs recherches.

La pérennité en question des informations sur le web

François LIBMANN

Bases no

425

publié en

2024.05

3586

Acheter ce no

Tags

recherche Web | information scientifique et technique

La pérennité en question des informations sur le web Image 1

Deux études récentes révèlent que la durabilité des informations sur le web est loin d’être garantie.

La première traite des liens DOI et montre qu’environ 27 % des documents ne sont pas conservés dans des archives pérennes. La seconde étude indique que 25 % des pages web créées il y a dix ans ont disparu, et de nombreux liens sur ces pages sont brisés. Ces résultats mettent en lumière les défis de la préservation de l’information numérique à long terme.

C’est un grand changement si on se réfère à l’ère du papier qui a débuté en 1 450 et a duré environ cinq siècles sans partage. En effet, pendant cette période, le support papier pour l’information paraissait relativement éternel préservé au moins pendant très longtemps dans les bibliothèques sauf incident majeur tel qu’un incendie ou les conséquences d’un conflit armé.

Les deux études récentes que nous allons présenter portent sur l'accessibilité de l'information sur le web. Elles montrent que la possibilité de se connecter pour accéder à ces informations a une fâcheuse tendance à diminuer à mesure que le temps passe.

ResearchGate développe ses liens avec les éditeurs

François LIBMANN

Bases no

424

publié en

2024.04

3967

Acheter ce no

Tags

information scientifique et technique

ResearchGate développe ses liens avec les éditeurs Image 1

ResearchGate est un réseau social consacré aux chercheurs leur permettant d’échanger entre eux sur différentes questions et de partager leurs publications.

Récemment ResearchGate a signé des accords avec de nombreux éditeurs offrant ainsi un contenu de plus en plus important, avec, malheureusement des possibilités de recherche très limitées.

ResearchGate multiplie depuis quelques mois les annonces de partenariat avec des éditeurs scientifiques.

Cette stratégie peut être décomposée en deux volets :

• La mise en ligne d’articles, essentiellement en open access, de nombreux éditeurs;

• D’autre part, des accords particuliers confidentiels avec Elsevier et ACS (American Chemical Society) signés en fin de l’année dernière.

La mise en ligne de nouveaux contenus open access d’un grand nombre d’éditeurs

Le premier volet est donc le chargement sur la plateforme ResearchGate des contenus de nombreux éditeurs, et pas les moindres.

On peut, en effet, citer, rien que pour les quatre premiers mois de 2024 : Trans Tech Publications (7 titres), SAGE (100 titres), Cambridge University Press (16 titres), Taylor & Francis (400 titres), Wiley (700 titres), Optica Publishing (105 000 articles depuis 2012). Pour sa part, l’accord avec Emerald Journals (18 titres) date de juillet 2023.

Faire ses recherches avec un GPT

Céline Boileau

Bases no

424

publié en

2024.04

3519

Acheter ce no

Tags

évaluation outils | recherche Web | IA

Faire ses recherches avec un GPT Image 1

Utiliser un assistant IA monotâche comme les GPTs d’OpenAI permet d’utiliser un modèle de langage dans un but spécifique et de façon plus précise qu’avec un chatbot généraliste comme ChatGPT, Gemini ou Copilot. Nous en avons testé une vingtaine dédiés à la recherche et voici les résultats de notre sélection.

Les agents virtuels ne sont pas simplement capables de converser et de guider l’utilisateur comme un chatbot, mais ils peuvent aussi adapter leurs réponses au contexte et à l’intention de celui-ci.

Les plus connus sont les GPTs d’OpenAI, même si d’autres agents sont apparus comme les Hugging Chat Assistants de Hugging Face et les copilotes de Microsoft.

Mais les GPTs d’OpenAI, d’après nos tests, restent les plus opérationnels. Attention, ils ne sont toutefois disponibles qu’avec la version payante GPT Plus, pour un résultat qui reste inégal.