En 2022, nous avions déjà mené une première grande enquête sur les plateformes de veille. Elle avait fait l’objet d’un numéro spécial de la revue I2D.
Depuis cette date, le marché s’est transformé avec l’intégration de Digimind dans Onclusive (juillet 2022), les rachats successifs par Chapsvision, après celui de Bertin (AMI EI) en juin 2021, de QWAM (mars 2023) et Geotrend (juin 2023) et de plusieurs autres acteurs de l’OSINT, de la traduction ou de l’analyse de données, ou encore l’acquisition d’Iscope par KB Crawl en février 2024.
En parallèle, et depuis 2020, d’autres acteurs, plus petits et aux publics plus confidentiels, sont apparus sur le marché des éditeurs de veille, avec des solutions souvent boostées par l’intelligence artificielle. Le recours croissant aux technologies d’IA a considérablement accéléré la transformation des technologies de veille.
Il était donc devenu nécessaire d’actualiser notre enquête.
Mathieu Andro est Animateur du réseau de veille des Services du Premier ministre
Corinne Dupin est Consultante et formatrice au sein du cabinet Ourouk
SciELO (Scientific Electronic Library Online) est un programme de coopération internationale dont l’objectif est le développement du libre accès aux publications scientifiques des pays latino-américains, des Caraïbes, de l’Espagne et du Portugal. Ce libre accès est une ligne d’action prioritaire depuis 2019 de ce programme et l’objectif est que tout le contenu soit en libre accès d’ici à la fin de 2025. Un autre objectif est le développement du multilinguisme entre le portugais, l’espagnol et l’anglais, l’anglais étant de plus en plus présent pour augmenter la visibilité et la reconnaissance à l’international de ces publications. SciELO est aussi et surtout une banque de données bibliographique qui propose aujourd’hui 1 219 260 références bibliographiques.
Née au Brésil en 1997 avec le soutien de plusieurs organismes publics, SciELO intègre aujourd’hui les publications de 19 pays à savoir le Brésil, le Mexique, la Colombie, le Chili, l’Argentine, Cuba, l’Espagne, l’Afrique du Sud, le Portugal, le Venezuela, Costa Rica, la Bolivie, l’Uruguay, l’Équateur, le Paraguay et les Antilles. Le Brésil en fournit à lui seul plus de 42 % suivi par le Mexique, la Colombie et le Chili. On trouve en dernière position le contenu en provenance des Antilles avec 1,6 pour mille (1 979 références), anecdotique mais présent. Plus précisément, en ce qui concerne les Antilles, le seul contributeur est The University of The West Indies à la Jamaïque qui publie le West Indian Medical Journal, lequel est disponible aussi sur Scopus, Web of Science, EBSCO ainsi que les bases de données Embase et Biosis.
AskAdis est une interface innovante utilisant l’intelligence artificielle pour fournir des synthèses complètes sur le développement de médicaments. Elle offre des informations validées sur les essais cliniques et les propriétés des médicaments, avec une présentation moderne et intuitive.
Adis est une société spécialisée dans la fourniture de services d’informations et de solutions aux professionnels de la santé et de l’industrie pharmaceutique. Fondée en 1969, Adis fait aujourd’hui partie du groupe Springer Nature.
Elle édite une trentaine de publications spécialisées, offre différents services et propose plusieurs banques de données essentiellement consacrées aux étapes de développement de médicaments.
Pendant assez longtemps, la veille business et la veille scientifique et technique ont constitué des champs tout à fait distincts avec des compétences et ressources spécialisées bien définies pour les piloter, ainsi que des objectifs, des méthodes, des outils et des sources propres.
Puis la mise en place de plus en plus courante de veilles dites « innovation » a commencé à brouiller les frontières, mêlant informations concurrentielles et technologiques, et l’on constate que les spécialistes de la veille au sein des départements marketing et R&D de grands groupes travaillent étroitement ensemble pour fournir leurs analyses stratégiques au top management.
La veille IST a longtemps nécessité un véritable background scientifique et technique dans un domaine spécifique, quel qu’il soit (matériaux, énergie, agro-alimentaire, etc.), pour pouvoir exercer ce rôle efficacement. Pourtant, comprendre non seulement la pertinence, mais aussi l’apport de certains travaux scientifiques ou d’articles techniques n’est plus mission impossible pour celui qui n’est pas du sérail, et ce grâce au développement récent des outils d’intelligence artificielle qui changent la donne.
Bien sûr, un veilleur « généraliste » ne pourra jamais se hisser au niveau d'expertise d’un ingénieur spécialiste, mais l’IA va lui permettre en revanche d’élever sa compréhension des documents sans avoir de bagage spécifique et sans connaître tout le vocabulaire scientifique et technique spécialisé.
La concurrence féroce entre les modèles d’IA n’a pas ralenti cet été, avec la poursuite des annonces de nouvelles versions commerciales et open source, et progrès en matière de traitement vocal, visuel et textuel. Parmi ces innovations, nous avons identifié certaines fonctionnalités et nouveautés dont certaines ont un impact sur nos pratiques de l’IA générative.
Anthropic vient d’annoncer la disponibilité d’une nouvelle fonctionnalité sur toutes les versions du modèle, tant payantes que gratuites (bien que beaucoup plus limitées).
Cette fonctionnalité permet de générer et d’afficher de façon interactive les réponses du chatbot dans une fenêtre distincte de la conversation principale. Il est important de noter que le terme « artefacts », sans définition très précise, est également utilisé pour désigner le contenu produit par le modèle (textes, visualisations, interfaces, etc.).
À l’arrivée de ChatGPT, nous avons vu fleurir sur le web et les réseaux sociaux une quantité de conseils sur l’art subtil de la formulation des prompts. On a vu également émerger une multitude d’outils et de bibliothèques de prompts prêts à l’emploi, souvent payants, adaptés à divers secteurs et types de questions (cf. FOCUS IA : maîtriser et gérer ses prompts - BASES no421- Janvier 2024). Cette révolution IA a même donné naissance à un nouveau métier : le prompt engineering, qui semble se professionnaliser de plus en plus.
Rappelons au passage qu’un prompt (ensemble d’instructions ou encore d’invites) est adressé à un modèle de langage (LLM) via une interface utilisateur, qui peut prendre la forme d’un chatbot (interface conversationnelle) pour générer des réponses ou des contenus spécifiques. Par exemple, Open AI a développé le modèle GPT (avec ses déjà nombreuses versions) et a mis à disposition des utilisateurs le chatbot ChatGPT.
Ces conseils et outils se concentrent principalement autour de ChatGPT, ce qui ne surprend pas au regard de la large et rapide démocratisation de l’IA générative qu’OpenAI a su orchestrer : il était urgent de fournir un « mode d’emploi » pour utiliser efficacement ce chatbot.
Cependant, une question fondamentale demeure : peut-on utiliser les mêmes prompts pour tous les modèles d’IA établis sur le marché (outre GPT : Gemini, Claude, Mistral, Llama principalement) ? Par exemple, Claude répond-il de manière aussi satisfaisante à un prompt conçu pour ChatGPT ?
Perplexity se définit comme un «moteur de réponses» innovant, combinant les fonctionnalités d’un moteur de recherche traditionnel avec celles d’un agent conversationnel alimenté par l’IA : une sorte d’hybride entre ChatGPT et Google Search.
Son ambition affichée est de concurrencer Google sur le marché de la recherche en ligne, en proposant une approche radicalement différente : plutôt que de fournir une simple liste de liens, Perplexity génère des réponses textuelles rédigées en s’appuyant sur des sources d’information récentes, variées et toujours indiquées en référence par l’outil.
La start-up californienne fondée en 2022 par un ancien d’Open AI, a rapidement attiré l’attention des investisseurs, atteignant une valorisation d’un milliard de dollars en 2024.
Le nom «Perplexity AI» fait référence à la notion de perplexité en théorie de l’information, qui mesure l’incertitude, mais il est utilisé ici de manière inverse. L’objectif de Perplexity AI est de réduire l’incertitude (ou la perplexité) des utilisateurs en fournissant des réponses claires et précises, transformant ainsi la haute perplexité en basse perplexité dans le domaine de la recherche d’information.
Pour fonctionner, Perplexity extrait les données d’internet au moment où la question lui est posée, de sorte que les réponses sont réputées être toujours à jour. Il s’appuie ensuite sur plusieurs modèles de langage, le sien propre mais aussi celui d’OpenAI, le modèle open source Llama de Meta ou encore Claude 3, pour produire ses réponses. De plus, il propose des questions connexes à la requête initiale (rappelant un peu les requêtes suggérées de Google), permettant ainsi d’affiner progressivement la recherche.
L’accès peut se faire sans obligation de créer un compte, via le site web de l’application ou une application mobile, avec fonction de recherche vocale disponible sur iPhone. Il existe enfin une extension Chrome qui permet d’y accéder à partir de n’importe quelle page web, de lui faire résumer la page ou répondre à des questions sur ce qu’elle contient.
Voici un peu plus d’un an que le brevet européen à effet unitaire est entré en vigueur, le 1er juin 2023, après plusieurs dizaines d’années d’âpres discussions. Cette arrivée représente un changement majeur pour l’ensemble des déposants de brevets, et pas seulement en Europe. Elle implique une nouvelle procédure, de nouvelles actions et dates, d’autant plus qu’y est associé un nouveau tribunal, la Juridiction Unifiée des Brevets. Nécessairement, tous ces nouveaux évènements doivent apparaître dans les bases de données. Comment ? C’est ce que nous allons voir.
Le brevet européen à effet unitaire est né sur des fondations : le brevet européen classique.
Valoriser une invention par un dépôt de demande de brevet dans son pays, la France par exemple, c’est bien, mais les produits créés par nos entreprises ayant rarement un marché uniquement en France, il peut être sage d’étendre le dépôt de demande de brevet national par des dépôts à l’étranger, générant une famille de brevets qui sera constituée de l’ensemble des titres valorisant une même invention dans plusieurs pays.
Si votre marché se trouve dans plusieurs pays - France, Allemagne, Espagne… - il est nécessaire d’effectuer un dépôt auprès des offices de chacun de ces pays, dans des langues différentes, initiant des procédures qui risquent de ne pas avancer à la même vitesse, générant un ensemble difficile à gérer, et coûteux.
Pour remédier à cet inconvénient, a été mis en place en 1973 le brevet européen classique, qui n’est pas un brevet de l’Union européenne.
« Publish or Perish » est une expression très courante dans les milieux universitaires et de la recherche.
Elle signifie que sans un flux suffisant d’articles publiés dans de « bonnes revues », la carrière d’un chercheur est sérieusement compromise.
Cette préoccupation des chercheurs concernant la publication de leurs articles est une constante dans une carrière et elle est très souvent évoquée, en particulier dans le milieu de la recherche. Elle fait souvent aussi l’objet de polémiques.
L’expression « Publish or Perish » est, en effet, très fréquemment utilisée, et ce, depuis longtemps, si l’on en juge par le nombre de réponses affichées par Google, à savoir 964 000, même si l’on sait que l’on ne pourra pas toutes les visualiser. Le serveur Dialog quant à lui annonce que 19 400 documents contiennent l’expression, documents que l’on peut, en théorie, effectivement visualiser.
Peu d’expressions couramment employées, surtout dans le milieu professionnel, en particulier si elles sont quelque peu polémiques, deviennent le prétexte d’un jeu de société. C’est pourtant ce qui est en train d’arriver avec cette expression. En effet, d’après la publication bien connue NATURE, un psychosociologue américain du nom de Max BAI a lancé en bêta un jeu s’appelant « The Publish or Perish game ».
Ce jeu de société centré sur la publication académique — ce qui est très original — ressemble au bien connu et historique Monopoly, à ceci près que le vainqueur est celui qui a obtenu le plus grand nombre de citations d’articles qu’il a publiés. Mais tout cela se passe de façon caricaturale, le plagiat étant possible, voire encouragé, de même que le sabotage des actions des chercheurs concurrents au moyen de dénigrement ou en leur faisant subir des restrictions budgétaires.
Nous ne résistons pas au plaisir de citer les titres de certains de ces articles improbables :
« Unpacking the Aerodynamics of Flying Pigs », « Why Dogs Follow You Into the Bathroom: Insights into Canine Codependency » ou encore « The economics of Santa Claus: an analysis of infinite resource management ».
Ce jeu peut tout à fait séduire le grand public, mais les éléments satiriques auront une résonance particulière pour ceux qui auront passé suffisamment de temps dans le milieu universitaire.
D’après l’article de Nature dans lequel nous avons trouvé cette information, le jeu sera en vente dans quelques mois sur la plateforme Kickstarter. Pour être informé du lancement effectif du jeu, vous pouvez vous inscrire ici.
Fulltext Sources Online recense depuis de très nombreuses années les publications du monde entier disponibles en texte intégral sur au moins un agrégateur, parmi les 17 qu’il prend en compte.
Il n’y a plus qu’une édition annuelle au lieu de deux précédemment, mais il y a une version en ligne librement recherchable, les détails des publications étant réservées aux abonnés.
Un total de 64 636 publications sont recensées dont 467 françaises (BASES et NETSOURCES en font partie), mais 1 928 en français, tandis qu’il y a une publication en occitan et trois en islandais.
Sans surprise, pour les titres en français, plus de 80 commencent par Journal, plus de 70 par Revue, 28 par ECHO ou L’Echo, 17 par La Lettre, etc.
On notera l’absence d’agrégateurs de presse européens tels que ADAY pour la France, GBI Genios pour l’Allemagne, Swissdox pour la Suisse et Belga pour la Belgique.
Leur prise en compte aurait conduit à largement dépasser le nombre actuel de publications recensée.