Qu’il s’agisse du pilotage, de la valorisation ou de la communication de l’activité documentaire, comment les fonctionnalités statistiques de ces outils aident le documentaliste à tirer le meilleur parti de ses outils numériques ?
En documentation, nous avons recours à divers outils numériques pour accompagner nos activités, diffuser nos produits ou offrir des abonnements adaptés à nos utilisateurs.
Ces outils ne sont pas utilisés de la même façon selon la mission du service, la période de l’année et le type d’utilisateurs visés.
L’analyse des statistiques fournies par les outils de gestion des fournisseurs d’information, les outils métier comme les logiciels documentaires ou un Système intégré de gestion de bibliothèque (SIBG) ou encore les outils de diffusion, permettent aux services d’information d’adapter leur offre de produits et services documentaires à leurs utilisateurs.
Par exemple, l’analyse de statistiques des bases de données proposées par Factiva, Orbis, Dalloz, etc. apporte un éclairage sur l’utilisation de leurs contenus comme le taux de consultation ou de téléchargement des informations.
Compte tenu de leur coût d’abonnement souvent très élevé, le service d’information doit évaluer les statistiques de ces outils afin de garantir leur rentabilité. En fonction des chiffres recueillis, plusieurs conclusions peuvent être tirées et un plan d’action être établi.
Que la ressource soit sous-exploitée ou au contraire surexploitée, il faudra en comprendre les raisons : les utilisateurs connaissent-ils l’existence de l’outil ? Savent-ils s’en servir correctement ? Rencontrent-ils des difficultés de connexion ? L’outil répond-il à leurs besoins ?
Ces statistiques apportent ainsi autant d’informations nécessaires pour décider de façon éclairée de l’arrêt de l’abonnement ou au contraire de l’augmentation du « forfait » de mener une campagne de communication ou encore d’organiser des sessions de formation.
Déjà abonné ? Connectez-vous...
Dans le cadre d’une veille technologique, souvent couplée à une démarche d’innovation/diversification, il peut être intéressant de surveiller non seulement les publications (articles, conférences, brevets), mais aussi les technologies cessibles.
Les technologies (à céder ou à licencier) peuvent constituer des compléments très pertinents et aussi des amorces de nouvelles collaborations. Ce peut être aussi l’occasion pour l’acquéreur d’une de ces technologies de gagner du temps, notamment en R&D et, éventuellement, de l’argent, en fonction des conditions de cession.
Ces technologies sont les résultats des travaux de chercheurs d’une université, d’une école d’ingénieur ou d’un centre de recherche. Elles peuvent faire l’objet d’une licence ou être vendues (en général, c’est le brevet qui est vendu). En effet, tous ces organismes cherchent à valoriser les technologies qu’ils ont développées en les cédant, car ils n’ont pas vocation à les emmener sur le marché, sauf en cas de création d’une startup.
Notre société de conseil FLA Consultants propose par ailleurs cette prestation de veille professionnelle, n'hésitez pas à nous contacter pour en savoir plus. Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser..
Nous ne nous sommes pas intéressés ici au cas des entreprises cherchant à valoriser des technologies, mais à celui des universités et des centres de recherches qui « produisent » des technologies.
En application de cette démarche, nous avons ainsi enrichi plusieurs veilles technologiques effectuées par notre cabinet FLA Consultants en cherchant des technologies cessibles dans leurs domaines technologiques, qui ont chez plusieurs clients suscité leur intérêt.
Nous nous sommes focalisés dans un premier temps sur les technologies européennes et nord-américaines. Nous consacrons aux technologies d’origine française un autre article dans ce numéro : « En France, la prééminence du réseau des SATT ».
Pour identifier les sources de technologies, nous avons procédé ainsi :
« technology transfer »
donne surtout des définitions, ce qui n’est pas ce que nous recherchons. « Où trouver une liste des technology transfer offices des universités ? »
. À partir de là, nous avons poursuivi les recherches avec diverses stratégies dans Google, en remarquant que les pages dans lesquelles se trouvent les descriptions des technologies offertes sont souvent difficiles à localiser dans le site d’une université. Ceci est surprenant, compte tenu de leur vocation à être le plus visibles possible.
Le volume de technologies offertes est ici très variable, allant de quelques dizaines de technologies, voire moins d’une dizaine, à plusieurs milliers.
Une université ne présentant qu’un petit nombre de technologies peut néanmoins présenter de l’intérêt, car ses technologies peuvent être considérées comme un prétexte à une prise de contact pouvant aboutir à des collaborations — d’ailleurs non nécessairement liées à ces technologies.
Il faudra être attentif à la date de création de l’offre, car certains sites ont la fâcheuse habitude de maintenir la présence d’offres anciennes, voire très anciennes. On peut d’ailleurs parfois se demander si les offres qui ne sont plus d’actualité, quelle qu’en soit la raison, sont effectivement retirées. Cependant, il peut arriver qu’une technologie proposée il y a longtemps résolve un problème d’aujourd’hui.
Déjà abonné ? Connectez-vous...
Les Sociétés d’Accélération du Transfert de Technologies (SATT) en France jouent un grand rôle dans le développement technologique des innovations issues de la recherche publique française.
Les SATT (Sociétés d’Accélération du Transfert de Technologies) sont au nombre de 13, réparties sur l’ensemble du territoire français. Ce réseau a été créé en trois vagues de 2012 à 2014 dans le cadre du Programme d’Investissement d’Avenir, selon un rapport du Sénat (1), « pour répondre à certaines lacunes du système de valorisation français ». Les SATT sont des SAS de droit privé. Les actionnaires « outre l’État par le biais de Bpifrance » sont tous des organismes publics (enseignement et recherche).
« Elles financent le développement technologique des innovations issues de la recherche publique française (laboratoires et centres de recherche) grâce à un fonds d’investissement (…) de 856 M€. ». Au moins certaines de ces SATT bénéficient de subventions de leur Conseil Régional et de fonds européens FEDER (Fonds Européen de Développement Régional). « Elles détectent, évaluent, protègent et conduisent ces inventions jusqu’au marché en les confiant à une entreprise existante ou à une future startup. »
Les SATT couvrent environ 165 établissements de recherche et 150 000 chercheurs/docteurs, ce qui représente environ 80 % de la recherche publique française. Plus précisément ces technologies ont, pour 44 % d’entre elles été à l’origine de la création de startups, 45 % ont été transférées vers des TPE/PME et 11 % vers de grands groupes.
Source : service de communication du réseau des SATT
Récemment, en particulier après l’organisation de Deep Tech Meetings, des conventions d’affaires ayant pour but de mettre en relation offreurs et demandeurs de technologie, le besoin est apparu d’une plateforme/marketplace regroupant des offres de technologies sélectionnées. Cela a conduit au lancement de la plateforme TECH-365.fr.
Celle-ci propose, à la date d’écriture de cet article, 387 technologies réparties au sein de quatre grandes filières stratégiques : Greentech, Numtech, Biotech et Medtech.
Ces technologies ont nécessairement fait l’objet d’une demande de brevet et sont à un stade de développement de TRL3 à TRL6 (2).
Cette plateforme pensée pour la prise de rendez-vous est dérivée de celle utilisée par la société Proximum qui organise de nombreuses conventions d’affaires dans le domaine des technologies tels Les Rendez-vous Carnot ou Techinnov.
Contrairement à ce que l’on observe dans quasiment tous les pays dans lesquels nous avons trouvé de nombreuses marketplaces en accès libre, l’accès à cette banque de données est non seulement payant, mais aussi soumis à une sorte d’examen de passage pour s’assurer du sérieux du demandeur et de la qualité de sa démarche.
“C’est un choix stratégique et de sécurité. Nous filtrons les inscriptions pour éviter l’accès au catalogue à des structures non identifiées. Les technologies que nous portons sont des brevets issus de la recherche publique, il convient donc de savoir à qui nous donnons accès à ces informations " explique le service de communication du réseau des SATT.
Le « service central » des SATT qui gère la plateforme se définit comme un gardien. Cette « centralisation » n’empêche pas la plupart des SATT de présenter des technologies cessibles sur leur site dont le total est supérieur à ce que l’on trouve dans TECH 365.
Notre commentaire
On retrouve bien là un penchant bien français consistant à confier à l’État des missions a priori d’intérêt public et de bien en verrouiller la réalisation.
On est quand même un peu gêné par cet « examen de passage » pour accéder à « TECH-365 » d’autant que la plupart des SATT proposent des technologies en libre accès. Nous avions gardé de l’ANVAR (intégrée aujourd’hui dans Bpifrance qui est un des financeurs des SATT) une impression de liberté et d’efficacité avec un système nettement moins verrouillé. Il semblerait que cet état d’esprit se soit un peu perdu.
Avec une couverture de 80 %, il est très probable que lors de la recherche d’un service de transfert de technologies d’une école d’ingénieur ou d’une université, vous soyez redirigé vers la SATT de sa région.Il y a néanmoins des « récalcitrants » qui préfèrent continuer à valoriser eux-mêmes leurs technologies. On pense par exemple à INSERM transfert, INRAE transfert, au réseau CURIE, etc.
Nous avons eu récemment une expérience qui ternit quelque peu le discours du service de communication du réseau des SATT. Dans le cadre de notre recherche de technologies, nous avons identifié. deux technologies dans deux SATT différentes auprès desquelles nous avons manifesté notre intérêt en demandant des informations complémentaires.
Nous attendons toujours…
(1) Rapport d’information n° 683 (2016-2017), déposé le 26 juillet 2017 : « Les SATT : des structures de valorisation de la recherche publique qui doivent encore faire la preuve de leur concept ».
(2) L’échelle TRL (Technology readiness level) évalue le niveau de maturité d’une technologie jusqu’à son intégration dans un système complet et son industrialisation.
Avec les modules complémentaires (appelés aussi « add-ons » et « add-ins ») des suites bureautiques de Microsoft et Google, il est possible de booster à l’IA ses logiciels de rédaction, tableurs et présentations. Cela permet de bénéficier des fonctionnalités de ChatGPT tout en restant dans son environnement de travail. Nous avons testé une douzaine d’extensions gratuites, et voici les quatre utiles à connaître.
Notre chouchou, et pas seulement car il est développé par une entreprise française ! Talarian a développé deux modules, un pour la suite Microsoft (Word+Excel) et un autre pour la suite Google (Docs+Sheets).
On les trouve sur le site de Talarian, sur la Marketplace de Google Workspace ou dans le catalogue de modules complémentaires de Microsoft, via notamment le menu. Pour faire fonctionner ce logiciel avec ChatGPT, il est nécessaire créer une clé API sur ChatGPT (voir le tuto réalisé par WeDoData).
Avec Excel ou Sheets, cette extension permet de nettoyer et d’enrichir sa base de données en introduisant directement dans son document les invites (ou prompts) prérédigées de ChatGPT. Le plus impressionnant est sans doute lorsqu’on extrait ou ajoute des informations en ligne en décrivant simplement son besoin en langage naturel, sans recourir à des formules complexes.
Par exemple, pour compléter une liste de noms d’entreprises avec leurs départements, numéros de téléphones ou les villes d’établissement, on ajoute une colonne et il suffit d’insérer une invite préenregistrée dans une cellule, comme
=GPT(« indique les numéros de téléphone »)
. Pour plus d’exemples, voir notre article Maîtriser l’open data et l’IA pour transformer et exploiter les données différemment, NETSOURCES N° 168, Janvier-février 2024.
Attention toutefois au risque d’hallucinations dans ce cas. Pour le limiter, penser au prompt, testé et approuvé « Si tu ne sais pas, n’invente pas
», qui réduit grandement la marge d’erreur. Sur Word et Docs, l’extension fonctionne en français et il est possible de créer ou modifier du texte.
La version actuellement en ligne est une bêta gratuite, mais elle est aussi soumise aux limites de l’offre d’essai l’API de ChatGPT. Pour l’utiliser, il vaut mieux disposer de la version payante de ChatGPT. Il est aussi possible dans certains pays de choisir le modèle Claude en se connectant à l’API d’Anthropic, mais cette dernière n’est pas disponible en Europe.
Enfin, sur la suite Google, il faut savoir que le menu « Extension » qui permet d’afficher les « add-ons » ne s’affiche que sur les documents non partagés !
Figure 1 : Sur Word, GPT for Work s’affiche dans la barre d’outils et pour l’utiliser, une barre latérale s’ouvre à droite du document.
Déjà abonné ? Connectez-vous...
La documentation brevet constitue une source inestimable d’information pour établir une veille technologique et concurrentielle, ou même évaluer la valeur d’une entreprise. Au moins une vingtaine de bases de données brevet totalement ou partiellement gratuit sont désormais disponibles sur le WEB. S’il est difficile d’établir une hiérarchie entre elles, deux produits se détachent du lot : Espacenet, produit par l’Office Européen des Brevets, et Patentscope de l’OMPI (Organisation Mondiale de la Propriété Intellectuelle). Quel produit choisir, et faut-il choisir ?
Le contenu d’une base de données brevet se décline en plusieurs éléments : offices couverts, sur quelle période, pour quelles données (données bibliographiques, texte intégral, etc.), et avec quel délai de disponibilité.
La couverture des deux services fait l’objet de pages Web dédiées régulièrement mises à jour.
Patentscope annonce couvrir 79 offices, et Espacenet 104 concernant les informations bibliographiques et 68 concernant le texte intégral. Toutefois, pour certains offices la couverture est très partielle, ou les mises à jour plus ou moins tardives, allant jusqu’à plus d’un an de délai à compter de la date de publication. Hors de ce cas de figure, on tombe côté Espacenet à 70 offices couverts pour les données bibliographiques et 33 pour les données de texte intégral ; côté Patentscope on arrive à 55 offices dont la couverture est régulière concernant les informations bibliographiques. ; par rapport au texte intégral, les plages couvertes n’étant pas précisées, seul le nombre de documents OCRisés l’étant, il est difficile de conclure.
Au vu des chiffres disponibles, et nonobstant quelques lacunes informationnelles, certaines différences non spectaculaires peuvent être notées concernant les six offices essentiels (Européen, Américain, Chinois, Japonais, Coréens et l’OMPI). Patentscope ne couvre pas les documents japonais antérieurs à 1964, là où Espacenet couvre à partir de 1961 pour les documents A (correspondant à la demande de brevet), et 1926 pour les B (correspondant au brevet délivré). On a aussi 2,5 ans supplémentaires de documents coréens de type Y sur Espacenet. Concernant les US, la période 1790 - 1835 est affichée comme disponible sur Patentscope. Mais cette période ne correspond à l’interrogation qu’à 1659 documents, et les données disponibles sont souvent très parcellaires.
Sur la partie données en texte intégral, Espacenet a un léger avantage, un doute subsistant toutefois quant à l’OCRisation des textes en question.
Pour ce qui concerne les autres offices, rien de très marquant mis à part un +Patentscope sur les documents néo-zélandais.
En termes de délais de mise à jour, et si l’on reste sur les offices essentiels, on constatait début janvier 2024, pour les données bibliographiques, un délai oscillant entre 0 - demandes européennes - et 2,7 semaines - documents coréens - sur Espacenet, et entre 0 - demandes PCT (Patent Cooperation Treaty, gérées par l’OMPI) - et trois semaines - documents japonais, coréens, chinois - sur Patentscope. Pas de différence spectaculaire donc.
Pour les autres offices importants, les délais sont variables : près de cinq semaines pour les documents autrichiens, trois semaines pour les Suisses, mais seulement une pour les Australiens sur Espacenet, avec des pointes à seize semaines pour les documents bulgares, et dans l’autre sens, moins d’une semaine pour les Allemands, les Danois, les Espagnols, les Français, entre autres. La situation n’est pas très différente sur Patentscope.
Les données de texte intégral sont mises à jour sur Espacenet à peu près dans les mêmes délais que ceux cités ci-dessus pour les offices EP, WO, US, CN, JP et KR. Pour les autres offices, la situation est très diversifiée : il faut deux ans et demi pour voir apparaître le texte intégral des documents autrichiens, mais moins d’une semaine pour les documents australiens. On prendra donc garde à ce point lorsque l’on effectue par exemple des recherches dans le texte intégral (description et/ou revendications)
L’information sur le délai de mise à jour du texte intégral n’est pas disponible pour Patentscope.
Déjà abonné ? Connectez-vous...
En septembre dernier, nous évoquions la question de la veille sur les réseaux sociaux, qui depuis le déclin de X (Twitter) devient de plus en plus fragmentée (cf. La veille sur les réseaux sociaux s’annonce de plus en plus fragmentée, BASES n°417, Septembre 2023). Si cette question subsiste et continue à rendre la veille sur les réseaux sociaux toujours plus complexe et chronophage, ce n’est pas la seule difficulté à laquelle est aujourd’hui confronté le veilleur.
L’autre dimension à prendre en compte, c’est l’essor du dark social depuis quelques années et du shadow social, nouvelle tendance théorisée par Marie Dollé en ce début d’année.
C’est un fait aujourd’hui bien documenté, les internautes partagent de moins en moins de contenus de manière publique sur les réseaux sociaux et ont plutôt tendance à se reporter sur des espaces plus restreints composés de leurs proches, cercles d’amis ou communautés qui se rassemblent autour d’intérêts communs.
Sur les réseaux sociaux, il existe donc des espaces privés et fermés que l’on appelle le dark social et des espaces à mi-chemin entre le public et le privé que Marie Dollé appele le shadow social et qui ne cessent de prendre de l’ampleur.
Lire aussi :
La veille sur les réseaux sociaux s’annonce de plus en plus fragmentée (09/2023)
Comment utiliser Discord pour ses veilles et ses recherches ? (09/2023)
Veille Instagram : quoi, comment, pour quoi faire ? (06/2022)
Réussir à utiliser LinkedIn pour la veille et la recherche d’information (06/2022)
Qu’on se rassure, le dark social n’a rien à voir avec le dark web et d’éventuels contenus et pratiques illicites. La comparaison est plutôt à chercher du côté du Web visible et invisible et sa fameuse image d’iceberg, car le dark social représente la partie immergée et donc invisible des réseaux sociaux.
Le dark social, ce sont donc ces espaces privés sur les réseaux sociaux où les internautes communiquent, partagent des contenus, mais qui ne sont pas référencés par les moteurs de recherche Web ou internes aux réseaux sociaux et sont donc invisibles aux non-membres.
Cette tendance peut s’expliquer par plusieurs facteurs : une quête d’authenticité, un plus grand besoin d’intimité, une fatigue des attaques et clashs incessants sur les réseaux sociaux, une réaction face à l’infobésité et au burn-out informationnel. Les Anglo-saxons parlent ainsi du passage d’un concept de One-to-many où une personne s’adresse à une très large audience publique à celui de One-to-one ou One-to-few avec des contenus et du partage d’information destinés à une personne ou un petit groupe d’individus.
Dans un récent article de Business Insider intitulé « Great news - social media is falling apart », le journaliste illustre parfaitement cela en expliquant que « nous sommes passés d’un Internet qui ressemblait à une sortie au centre commercial à un Internet plus semblable à une soirée entre amis. »
Déjà en 2017, une étude réalisée par la plateforme de publicité programmatique RadiumOne annonçait que 84 % des partages que font les consommateurs « se font maintenant sur des canaux sociaux privés comme les e-mails et les messageries instantanées ». Si le chiffre peut paraître très élevé (la même année, Talkwalker avait mené un test similaire et estimait que 20 % du trafic vers leur site venait du dark social), il n’en reste pas moins qu’il existe bien une face cachée des réseaux sociaux et qu’elle ne cesse de prendre de l’ampleur.
À l’été 2023, Adam Mosseri, qui est à la tête d’Instagram, expliquait dans une interview que le flux public des internautes était devenu secondaire et que c’était la messagerie (surtout) et les stories (dans une moindre mesure) qui étaient le moteur de croissance d’Instagram depuis au moins cinq ans.
Le dark social est donc aujourd’hui le fonds de commerce des réseaux sociaux et il y a toutes les chances d’y trouver des pépites informationnelles. Mais il ne faut pas négliger non plus le shadow social.
Le concept de shadow social est quant à lui plus récent et s’annonce comme une des tendances de 2024. La première fois que nous l’avons vu apparaître c’était dans la newsletter Futur(s) sous la plume de Marie Dollé. Elle décrit le shadow social comme « un espace hybride situé entre le public et le “dark social”. Le shadow social représente une évolution significative dans notre manière de percevoir l’identité et les relations en ligne, équilibrant le privé et le public, l’individuel et le collectif. Il se positionne comme une réponse stratégique au content shock croissant, exacerbé par l’augmentation des contenus générés par l’IA. Plus encore, il représente pour les plateformes sociales une opportunité de stimuler l’engagement au sein de leurs écosystèmes. »
Elle cite en exemple les Broadcast Channels sur Instagram qui permettent des échanges directs entre les créateurs de contenus et leurs abonnés ou encore les articles collaboratifs sur LinkedIn et leurs commentaires. On est alors plus proche du « one to few » évoqué plus haut dans cet article.
Dans la même veine, on pourra également penser au lancement récent des chaînes WhatsApp qui prennent beaucoup d’ampleur notamment au niveau des médias ou encore aux nouveaux canaux de diffusion récemment lancés sur Facebook et Messenger.
Et même si c’est moins évident, on pourrait inclure dans le monde du shadow social les newsletters, qui sont de plus en plus prisées : Il s’agit en effet d’espaces semi-privés (qu’il faut réussir à identifier et auxquels il faut s’abonner pour visualiser le contenu), avec une personne qui s’adresse à une communauté restreinte. De plus, les newsletters ont des frontières poreuses avec les réseaux sociaux qui avaient développé pour la plupart des systèmes de newsletters intégrés (GetRevue sur Twitter par exemple), mais ces fonctionnalités ont plutôt tendance à disparaître. Parallèlement, les plateformes de newsletters se transforment peu à peu en réseaux sociaux dédiés aux newsletters : Substack a par exemple développé son propre réseau social appelé Substack Notes.
Attention : Si le développement du shadow social semble être une des tendances de 2024, ce n’est pas pour autant complètement nouveau. Les groupes privés/sur invitation des réseaux sociaux existent depuis des années, mais ont pour la plupart périclité pour devenir des espaces publicitaires et d’autopromotion : Telegram propose des chaînes depuis déjà plusieurs années, les serveurs Discord existent aussi depuis un moment mais gagnent en popularité, etc.
Les nouveaux produits et fonctionnalités que l’on voit apparaître ces derniers mois, révèlent un glissement d’un schéma d’espace communautaire composé d’un petit groupe de personnes où chacun peut s’exprimer, vers une communication à sens unique où une personne communique vers une audience restreinte. Les membres sont limités à des rôles de lecteurs et peuvent au mieux réagir avec des emojis comme c’est le cas sur les chaînes WhatsApp par exemple.
Les espaces de shadow social donnent finalement l’impression de faire partie d’un club un peu sélect. Certains restreignent même volontairement le nombre de membres, c’est par exemple le cas de la newsletter Pygmalion (https://pygmalion.club/#pricing) qui est limité à 200 abonnés (au-delà, les gens sont sur liste d’attente et patientent jusqu’à ce que quelqu’un se désabonne).
Faire de la veille sur le Web, c’est réussir à identifier les meilleures sources et les informations en lien avec ses thématiques. On sait depuis toujours que ces sources et informations sont en partie sur le Web invisible, mais on réalise désormais qu’elles peuvent se trouver dans des espaces de dark social ou de shadow social qui prennent une place de plus en plus importante dans le paysage.
Déjà abonné ? Connectez-vous...
Pour rendre un livrable et une formation efficaces en vérifiant le niveau de compréhension de son public ou tout simplement pour rajouter une touche de divertissement, le quiz est un outil pédagogique qui peut s’avérer un précieux allié. Et aujourd’hui avec les modèles d’IA générative, un quiz peut être créé en une minute, ou presque. Florilège de nos 4 outils préférés.
Lire aussi :
Livrables : trois outils IA pour maximiser vos présentations (11/2023)
4 générateurs de videos freemiums au banc d’essai (10/2023)
Le text to mindmap depoussiere les cartes mentales (09/2023)
Opexams est une plateforme pédagogique qui propose la génération de quiz parmi d’autres fonctionnalités.
Son « Quiz Generator » est accessible sans inscription. Le quiz est généré à partir d’un texte à fournir (jusqu’à 3000 signes environ) et, comme toujours avec ces outils IA, le procédé est simplifié au maximum : on copie son texte, puis on sélectionne les options suivantes : le type de quiz (choix multiples, vrai/faux ou questions ouvertes), la langue, le nombre d’options par question (cinq maximum), puis on clique sur « Générer un quiz ».
L’option « par sujet » permet d’entrer uniquement un thème de son choix, qu’il soit dans le domaine scolaire ou professionnel. Aux options précédentes, s’ajoute le niveau de difficulté souhaité (facile/moyen/difficile).
Le résultat est composé de dix questions avec les réponses apparentes. Il est possible de les copier, soit une par une avec le bouton sous chaque question, soit la totalité avec le bouton à droite de la première question.
Dans tous les cas, vérifier les réponses et ne pas hésiter à modifier la proposition de quiz. Dans notre test, 1 réponse sur 10 était fausse, avec ou sans texte comme matériau de départ.
La version gratuite permet de générer un quiz de dix questions par jour. La version payante, elle, offre un nombre de quiz illimité, l’export des questions en Word et en Excel, l’import de document-source y compris en PDF et le stockage des quiz dans une « collection ». Elle permet aussi de générer un quiz à partir de plusieurs documents et formats (par exemple, deux liens et un PDF). Le premier prix est à 6,99 € TTC.
Déjà abonné ? Connectez-vous...
Après la période de vide laissé par le départ en retraite de Martine Michel, CAS (Chemical Abstracts Services qui gère STN en collaboration avec FIZ Karlsruhe) vient de recréer son équipe en charge de la France.
Cette nouvelle équipe a organisé une réunion en présentiel, ce qui n’était pas arrivé depuis fort longtemps.
Cette réunion était centrée sur la chimie et les brevets. Les autres banques de données présentes sur STN seront, quant à elles, évoquées lors d’une prochaine rencontre.
Les recherches autour du brevet unitaire ont fait l’objet d’une présentation particulièrement dynamique.
Le brevet unitaire est entré en vigueur le 1er juin 2023. Il permet, en un seul dépôt, de couvrir les 17 pays qui ont ratifié l’accord relatif à la JUB (Juridiction Unifiée du Brevet) ce qui permet une économie de temps et d’argent.
Les bases de données de STN référençant ces brevets unitaires sont CAPlus (Chemical Abstracts qui propose des références de brevets et d’articles scientifiques), DWPI (Derwent), INPADOC (International Patent DOCumentation DataBase) et EPFULL (les brevets européens en texte intégral depuis l’origine).
Par exemple, pour identifier les brevets européens à effet unitaire déposés par une entreprise on utilisera la banque de données INPADOCDB connue pour son indexation très détaillée des évènements juridiques relatifs à la vie d’un brevet. Cette dernière fait apparaître les documents un à un tandis que INPAFAMB les regroupe par familles, sachant que les mêmes informations sont disponibles dans les deux bases.
Déjà abonné ? Connectez-vous...
Cela fait des années que l’on entend parler de Cross-Language Information Retrieval (CLIR) pour la recherche d’information. Il s’agit de la capacité à rechercher dans une langue et à recueillir des résultats dans d’autres langues. Jusqu’à maintenant, les produits ou fonctionnalités de ce type étaient rares et n’ont jamais véritablement décollé, à l’instar de la fonctionnalité proposée par Google de 2007 à 2013.
Et pourtant, il y a là un vrai besoin notamment pour les professionnels de l’information : dans un monde globalisé, il est en effet souvent nécessaire d’élargir à des sources en anglais (ce qui est souvent gérable), mais aussi à des sources dans des langues dont on ne maîtrise pas toujours les rudiments.
Si on peut malgré tout à mettre en place un système qui fonctionne en s’aidant de dictionnaires et d’outils de traduction, le processus reste long et fastidieux (voir NETSOURCES n°163, Avril 2023 consacré à la veille multilingue).
Lire aussi :
Sourcing, de la théorie à l’épreuve de la pratique
Les nouvelles dimensions du multilinguisme pour la veille
Veille multilingue : comment trouver ses mots ?
Veille internationale : comment trouver des sources en langue étrangère ?
Comprendre les résultats de sa veille multilingue en un clin d’œil
La première façon de rechercher des contenus dans des langues qu’on ne maîtrise pas forcément est de tirer parti de l’indexation (thésaurus, vocabulaire contrôlé, ontologies, etc.), ce qui existe depuis longtemps. Dans certains outils de recherche, notamment professionnels (agrégateurs de presse, bases de données, etc.), les articles et documents peuvent être indexés avec des mots-clés : nom de société, nom de personne, noms de lieu, thème de l’article, etc. L’utilisateur peut ensuite repérer dans sa langue les termes d’indexation adaptés à sa recherche puis les utiliser dans sa requête et voir apparaître des résultats pertinents dans des langues autres que l’anglais ou le français.
C’est par exemple le cas sur Factiva avec l’indexation sujet où il est possible, par exemple, de lancer une recherche sur le thème des insurtechs sur des contenus en langue chinoise, sans entrer un seul mot en chinois. Cependant, les résultats s’affichent bien sûr en chinois et il faut passer la liste des résultats dans un outil de traduction pour en déterminer la pertinence.
Il existe également d’autres limites à la recherche multilingue par l’indexation : tous les outils de recherche professionnels ne proposent pas de système d’indexation et quand ils le font, leurs termes ne répondent pas toujours parfaitement au besoin informationnel.
La deuxième façon de chercher des contenus dans une langue autre que celle de la requête relève du Cross-language information retrieval (CLIR). Si cette discipline est étudiée depuis des dizaines d’années, il n’y a pas eu beaucoup d’applications commerciales jusqu’à présent.
Plusieurs approches ont été étudiées au cours des années :
● Traduire la requête initiale dans différentes langues pour que cela matche avec des contenus dans d’autres langues ;
● Traduire tous les contenus du corpus dans une langue commune (souvent l’anglais) pour que l’utilisateur puisse ensuite lancer toutes ses recherches dans la même langue.
On notera que la traduction utilisée dans ces systèmes peut être humaine, complètement automatique ou bien hybride.
En 2007, Google avait lancé une fonctionnalité de ce type. Le service reposait sur la traduction automatique des contenus mais a été retiré en 2013 car pas assez utilisé. Il faut aussi admettre qu’à cette époque la qualité de la traduction automatique laissait franchement à désirer.
Déjà abonné ? Connectez-vous...
Si 2023 a été l’année de ChatGPT et de la déferlante de nouveaux outils dopés à l’IA générative, 2024 sera celle de l’intégration de l’IA générative dans les outils traditionnels du pro de l’info. Explorez avec nous les diverses innovations des acteurs traditionnels en matière d’IA et interrogeons-nous sur la pertinence de délaisser les outils IA de la cuvée 2023 au profit des outils classiques.
En 2023, l’arrivée de ChatGPT et de l’IA générative a conduit les professionnels de l’information à adapter leur arsenal d’outils pour marier habilement les outils traditionnels (qu’ils soient grand public, tels que les moteurs de recherche Web, ou spécialisés, tels que les outils de veille et bases de données) avec les nouveaux outils boostés par l’IA générative (résumés automatiques, assistants IA, dialogues avec des PDFs ou vidéos, etc.).
Aujourd’hui, c’est cette même panoplie traditionnelle qui intègre progressivement des fonctionnalités d’IA générative, avec des annonces nombreuses et difficiles à suivre.
Lire aussi :
La vague d’outils IA pour l’Information Scientifique et Technique (IST)
Cette nouvelle étape dans le déploiement de l’IA n’a finalement rien de très surprenant ; c’est même un schéma classique dans le cycle de l’innovation :
Et c’est exactement à ce moment charnière que nous nous trouvons actuellement.
La vague de nouveaux outils IA est en train de retomber. C’est quelque chose que nous pouvons aujourd’hui mesurer lors de la veille que nous menons sur les lancements de nouveaux outils IA avec toujours quelques nouvelles annonces de lancement, mais nettement moins chaque semaine. Et c’est tant mieux, car il était devenu compliqué de suivre toutes les nouveautés…
À l’inverse, les outils traditionnels du professionnel de l’information (outils de veille, moteurs académiques, réseaux sociaux, bases de données, etc.) enchaînent les déclarations et annonces de nouvelles fonctionnalités d’IA en ce début d’année.
Nous avons donc décidé dans cet article de faire un tour d’horizon des différentes annonces afin d’avoir une vision globale de ce que les outils traditionnels du pro de l’info ont aujourd’hui à offrir comme fonctionnalités dopées à l’IA. Nous nous interrogerons ensuite sur les avantages et inconvénients à recourir à ces fonctionnalités d’IA intégrées par rapport à des outils comme ChatGPT ou des outils IA spécialisés.
La panoplie d’outils des professionnels de l’information est généralement vaste et inclut à la fois des outils grand public utilisés dans une perspective professionnelle (comme les moteurs de recherche Web, les navigateurs, les réseaux sociaux, les outils de bureautique, les banques d’images, les outils de création graphiques, etc.) mais aussi des outils professionnels spécialisés (comme les outils de veille, les outils de recherche IST, les serveurs, bases de données, agrégateurs de presse, etc.).
Ce sont les outils grand public qui ont ouvert en premier leurs portes à l’IA générative. Regardons donc plus en détail ces nouveautés.
Les moteurs de recherche ont, les premiers, intégré des fonctionnalités d’IA sous la forme d’assistant venant se greffer sur le moteur.
Voir notre article « Revue des moteurs de recherche à l’heure de ChatGPT », BASES n° 413, avril 2023.
La plupart de ces assistants existent toujours et on notera l’apparition récente d’un petit nouveau cette fois-ci adossé au moteur Ecosia. L’acteur a en effet récemment annoncé le lancement d’un chatbot IA « vert » basé sur l’API d’OpenAI. Il est pour l’instant en version bêta et n’est pas encore disponible en France.
De nombreux autres outils grand public ont ensuite fait de même comme les navigateurs, outils de bureautique, création de visuels, etc.
Commençons par les navigateurs.
Chrome a lancé sa propre fonctionnalité d’IA (en plus des nombreux plug-ins et extensions d’IA proposées par des développeurs). Brave a quant à lui présenté Leo, une IA conversationnelle qui permet notamment de résumer la page sur laquelle on se trouve, de poser des questions sur le contenu de la page ou de faire de la traduction. Le navigateur Arc propose également une fonctionnalité de ce genre (voir notre article « ARC Browser réinvente la navigation en ligne » - BASES n°420 - décembre 2023).
Les outils de productivité et de bureautique ne sont pas en reste.
C’est le cas de Microsoft avec son IA Copilot intégrée à Microsoft 365 ou encore Duet AI intégrée à Google Workspaces. Dans les 2 cas, ces fonctionnalités ont un coût important, car facturées 30 $/mois et par utilisateur, ce qui peut vite représenter un budget conséquent dès que l’entreprise est d’une taille importante. Du côté des tableurs, Airtable a lancé Airtable AI, permettant aux entreprises de développer et de déployer des applications d’intelligence artificielle générative pour les flux de travail et la productivité des entreprises.
Dropbox a quant à lui lancé Dropbox Dash et Dropbox AI qui permettent pour le premier une recherche universelle dopée à l’IA dans l’ensemble des contenus, outils et apps de l’utilisateur et pour l’autre, offre des fonctionnalités de résumé automatique pour n’importe quel document.
Les réseaux sociaux introduisent aussi progressivement des fonctionnalités d’IA générative :
X a fait le choix d’une IA conversationnelle (Grok) sur le même créneau génératif que ChatGpt, mais réservée pour l’instant aux abonnés premium plus aux États-Unis.
Du côté de Meta, l’entreprise a commencé à intégrer son IA conversationnelle Meta AI dans ses différents produits comme Facebook, WhatsApp ou encore Instagram : chat avec les contenus, suggestion de commentaires, de sujets pour les groupes, aide à la description de produit pour les marketplaces, génération d’images collaboratives sur Messenger et Instagram, etc.
LinkedIn a, de son côté, introduit de l’IA générative pour l’aide à la création de messages pour les recruteurs, pour améliorer la description des profils et la création d’articles collaboratifs.
On note également de nombreux développements d'IA générative du côté des outils multimédias.
C’est le cas des outils liés à l’image comme les bibliothèques de stocks Shutterstock ou encore Getty Images ou les outils de création visuelle comme Canva ou Piktochart.
Canva propose un « Magic Studio », une suite d’IA qui convertit les créations d’un clic dans un autre format et/ou dans une autre langue (une infographie en billet de blog par exemple), de créer des visuels à partir d’un texte/prompt, d’améliorer des designs existants, etc. Dans la même veine, Piktochart permet de créer une infographie à partir d’un prompt.
Shutterstock a lancé en octobre un générateur d’IA basé sur sa bibliothèque d’images et garantissant le droit d’auteur. Getty Images a quant à lui lancé récemment un générateur d’images appelé Generative AI by iStock mêlant les images propriétaires de Getty et la plateforme d’IA générative de Nvidia. Le produit garantit la protection juridique et les droits d’utilisation pour les images générées.
Et Adobe a lancé Firefly qui permet d’utiliser l’IA générative et des prompts pour obtenir des images, effets de texte originaux ou de palettes de couleurs inédites.
Du côté de la vidéo, YouTube teste pour les abonnés à YouTube premium un chatbot permettant de résumer et poser des questions à la vidéo. L’IA est également utilisée dans la section commentaires des vidéos pour mieux les organiser, les regrouper par catégories et les résumer.
Après cette première vague d’intégration dans les outils grand public utilisés par les pros de l’info, on assiste actuellement à une deuxième vague, cette fois-ci dans les outils professionnels.
Déjà abonné ? Connectez-vous...