Alors que l’utilité des cartes mentales est relancée par le renouveau actuel du Personal Knowledge Management, une nouvelle génération, issue des IA génératives, arrive sur le marché.
Il y a quelques années, on avait pu voir émerger des outils d’exploration des réseaux de citations des articles scientifiques. Ces outils s’avèrent très utiles pour trouver des articles scientifiques pertinents que l’on n’aurait pas forcément identifiés lors d’une recherche par mot-clé classique et sont donc complémentaires aux moteurs académiques.
Les métiers des professionnels de l’information, - documentation, veille, KM et autres fonctions liées à la gestion de l’information, - ont toujours été en prise directe avec les évolutions du numérique.
La datavisualisation (souvent appelée dataviz) est une représentation graphique permettant de synthétiser des données quantitatives surtout mais aussi qualitatives.
Depuis quelques années, les plateformes de veille intègrent de plus en plus de fonctionnalités de dataviz.
Quand la datavisualisation n’est pas incluse ou pas suffisamment aboutie dans les outils de recherche ou de veille que l’on utilise au quotidien, il n’y a pas d’autre choix que de se tourner vers des outils dédiés à la représentation visuelle de données.
Dans le monde de la veille, on peut aisément s’imaginer que la dataviz a surtout un rôle à jouer au niveau de l’analyse et des livrables.
Inoreader est un agrégateur de flux RSS connu des professionnels de la veille qui sont particulièrement concernés par l’idée de se constituer un « second cerveau ». Ce dernier est capable de mémoriser l’information importante tout en facilitant sa disponibilité pour l’utiliser quand cela s’avère nécessaire. Jusqu’où et comment cet outil de veille peut-il contribuer à cette démarche ? Voici une méthode pas à pas.
Alors que l’utilité des cartes mentales est relancée par le renouveau actuel du Personal Knowledge Management, une nouvelle génération, issue des IA génératives, arrive sur le marché.
Dans le monde professionnel, chacun développe en continu les compétences utiles à l’exercice de son métier pour rester à la pointe et devenir d’une certaine façon « la meilleure version professionnelle de soi-même ».
La question de la surcharge informationnelle, créée par l’explosion de la sphère numérique, se pose de façon toujours plus aiguë pour les métiers de l’information.
Produit documentaire classique, la newsletter a su devenir incontournable pour proposer des services, mais aussi valoriser des activités et l’image du service documentaire. Nous avons expérimenté deux outils de création et diffusion de contenus, Flashissue et MailChimp.
Google a récemment annoncé qu’il avait retiré le cache des pages Web dans les résultats du moteur. C’était pourtant une option bien utile quand une page ou un site n’était pas disponible.
L’année 2023 a été marquée par la démocratisation des IA génératives. Cette technologie de pointe, qui a émergé sur le marché en 2020, était alors réservée à quelques experts qui payaient une API. Amorcée par la mise sur le marché de l’interface gratuite ChatGPT d’OpenAI, dont la plupart des produits sont devenus payants dans les mois qui ont suivi, cette démocratisation pourrait néanmoins perdurer grâce au développement de modèles de langage sous licence ouverte (ou « open source »).
Les médias des collectivités locales sont des sources essentielles d’informations régionales au rôle bien singulier. Et comme l’intégration de ces ressources dans une veille reste un véritable défi, comment identifier, surveiller et intégrer ces médias à son système de veille.
La connaissance des médias est une compétence essentielle du sourcing et de l’analyse dans la veille informationnelle. Pourtant, les professionnels de la veille et des médias ne se côtoient que trop rarement. Or, connaître l’univers - et la diversité - médiatique est justement ce qui permet de constituer un corpus complet, c’est-à-dire qui prend en compte l’ensemble des opinions autour d’une question. Visite guidée, à l’aube d’une prochaine disruption médiatique.
Après les moteurs de recherche et les médias sociaux, l’IA générative redistribue de nouveau les cartes pour les médias d’information. Avec des impacts considérables sur la production, la diffusion et la monétisation du contenu. Comment les médias s’adaptent-ils et comment cela affecte-t-il l’activité de veille ? Petit tour des initiatives en cours.
Les médias locaux évoluent et cela impacte directement le sourcing et les pratiques de veille. Comment identifier et intégrer ces sources et verticales dans son sourcing ?
L’infobésité des sources est un défi de plus en plus difficile à gérer, pour un veilleur comme pour tout un chacun. L’une des pistes possibles pour en sortir passe par une méthode de « mise en veilleuse » basée sur l’intelligence des sources que nous développons dans cet article.
Microsoft vient de mettre à disposition du marché européen son offre IA adaptée à sa suite Office et son tarif, 30 €/mois/personne, n’est pas négligeable pour un service de veille.
Sur Twitter, le nombre de fonctionnalités essentielles à la veille se réduisant drastiquement, nombreux sont les professionnels qui se questionnent sur les alternatives. Twitter a perdu encore 10 % d’abonnés en quelques mois, et les institutions, comme l’ENSSIB par exemple, commencent également à déserter cet espace.
On oublie trop souvent que les brevets ont un intérêt pour la veille concurrentielle. Et pourtant, en savoir un peu plus sur la politique brevet d’une entreprise est souvent très utile : par exemple, S’il s’agit de l’un de vos concurrents, cela peut être intéressant de connaître les techniques sur lesquelles il dispose d’une capacité d’interdiction, Si c’est un potentiel partenaire, cela peut être très pertinent avant de signer un accord de collaboration de connaître son niveau de sensibilité à la propriété industrielle. Et s’il s’agit d’un des fournisseurs auprès duquel vous vous approvisionnez en composants indispensables, s’il dispose de brevets sur ces composants, cela peut vouloir dire que vous ne pourrez vous fournir ailleurs. Et cette liste est loin d’être exhaustive.
Le réseau social par excellence pour faire de la veille a longtemps été Twitter (désormais X), en raison des fonctionnalités qu’il proposait et de la gratuité de son API qui permettait l’existence d’un écosystème d’outils de qualité pour analyser, rechercher et faire de la veille sur le réseau social.
Parmi les outils IA, ceux qui proposent la fonctionnalité de Text-to-Speech (ou Text to Voice) représentent un gain de productivité. On les utilise pour écouter ses sources, ou pour faire écouter son livrable en format audio.
Depuis la sortie du générateur de texte ChatGpt il y a quelques mois, on commence à comprendre que l’impact de l’IA sur les usages du professionnel de l’information concerne surtout la création de contenu.
Sur le Web, les commentaires publiés sous des articles, billet de blogs et sous les posts des réseaux sociaux peuvent parfois receler de véritables pépites mais ce sont des contenus difficiles à intégrer dans ses veilles et recherche d’information. En effet, on peut ponctuellement avoir besoin de plonger dans les commentaires sur les réseaux sociaux, par exemple pour une étude d’image, pour obtenir des informations complémentaires à l’article lui-même, pour y trouver des réponses, pour les analyser en vue d’une étude ou les sauvegarder en vue d’un usage futur.
Ne dites plus « lecteurs de flux RSS » mais « lecteurs d’information » ou « App d’actualité ». Nouvelles applis, nouvelles fonctionnalités, nouveaux looks, nouvelles promesses… Au cours de leur veille outils, les professionnels de l’info ont vu apparaître dernièrement de nouveaux acteurs, avec un discours marketing prometteur. Les lecteurs se moderniseraient-ils au point de gagner en notoriété ? Faut-il se préparer à remplacer Feedly ou Inoreader ? C’est à ces questions que nous nous proposons de répondre.
Dans le cadre d’une recherche d’informations, le premier réflexe pour identifier des sources est généralement de cibler des médias, des experts, voire des annuaires. Mais il existe une autre ressource utile pour fournir de l’information et à laquelle on pense moins : les listes de sources disponibles sur des tableurs en ligne comme Google Sheets ou Airtable et qui se multiplient.
La datavisualisation a un rôle à jouer à toutes les étapes de la veille comme nous avons pu le voir dans le précédent numéro de NETSOURCES. Cela commence dès les premières étapes de la veille avec la définition précise d’un sujet ainsi que le choix des mots-clés et du champ lexical à utiliser pour créer de futures alertes.
Dans le monde de la veille, on peut aisément s’imaginer que la dataviz a surtout un rôle à jouer au niveau de l’analyse et des livrables.
Conçu il y a 10 ans, Inoreader, est l’un des rares agrégateurs qui permet d’aller le plus loin avec les flux RSS et réellement faire de la veille.
Feedly est aujourd’hui un des lecteurs RSS les plus utilisés par les veilleurs et professionnels de l’information. Et ce n’est pas sans raison. Il propose en effet de nombreuses fonctionnalités qui répondent aux besoins des pros de l’information.
Si Feedly et Inoreader sont aujourd’hui les deux lecteurs RSS les plus plébiscités pour la veille (non sans raison), ils ne conviennent pas nécessairement à tout le monde : soit en raison du prix qui ne cesse d’augmenter avec les années, soit en termes d’hébergement et de sécurité des données (certaines entreprises n’autorisent pas l’utilisation de certains outils hébergés en ligne), soit en termes de fonctionnalités (ils en ont beaucoup pour la veille, mais ne peuvent couvrir l’ensemble des besoins).
Le marché des outils de veille est un univers vaste qui regroupe aussi bien les grosses plateformes de veille et de social media monitoring que des outils moins onéreux comme les outils de surveillance de pages et les lecteurs de flux RSS.
Quand on réalise une veille pour soi-même (dans le cas d’une veille métier par exemple), des veilles qui ne nécessitent pas des milliers de sources, qui génèrent un volume d’information raisonnable ou qu’on dispose d’un budget limité, les lecteurs de flux RSS sont toujours aujourd’hui des outils incontournables.
Une newsletter ne se reçoit pas nécessairement par email. Certaines plateformes de création de newsletters offrent la possibilité de s’abonner aux nouveaux contenus via RSS.
Avant de vouloir à tout prix récupérer un flux RSS, il faut déterminer si la source et les contenus que l’on souhaite surveiller sont adaptés à ce format. Et si c’est bien le cas, il existe une méthode générale qui peut s’appliquer à tous les types de sources (sites web, moteurs, réseaux sociaux, bases de données, etc.) et que nous avons détaillée dans l’article « Comment déterminer la méthode la plus adaptée pour mettre une source en veille ? ».
Il est possible de récupérer des flux RSS sur certains moteurs et leurs verticales. C’est par exemple le cas de Google et de ses moteurs spécialisés comme Google Actualités ou même Google Scholar.
S’il y eut un temps où les réseaux sociaux proposaient pour la plupart des flux RSS sortants (sur des comptes, des requêtes, etc.), ce temps est bien révolu. En dépit du regain d’intérêt pour des solutions d’alertes du côté des géants du Web (voir notre article « Maîtriser le RSS, le socle inamovible de la veille »), il faut avoir conscience que ces acteurs ne remettront jamais de flux RSS en tant que tels puisque le but est de garder l’internaute captif de la plateforme. Le veilleur va devoir donc continuer d’essayer de récupérer des flux RSS.
Cela fait des années que l'on nous annonce tantôt la mort du RSS tantôt sa résurrection quand ce n’est pas les deux en même temps.
Si on ne devait retenir qu’un seul réseau social pour sa veille et ses recherches d’information, ce serait sans aucun doute Twitter.
Savoir réaliser des recherches d’image inversée sur le Web est une des compétences des professionnels de l’information. Si cette technique est toujours d’une utilité certaine, elle a quelque peu été malmenée au cours des dernières années. Et aujourd’hui, elle oscille entre une baisse significative de qualité et l’ajout récent de quelques nouveautés et innovations qui ouvrent de nouveaux horizons pour le veilleur.
La recherche d’information et la veille reposent avant tout sur un bon sourcing : le sourcing clé en main que l’on trouve dans les corpus que les professionnels utilisent au quotidien (agrégateurs de presse, plateformes de veille, etc.) et le sourcing « fait maison » que chacun se doit de mettre en place et faire évoluer régulièrement.
Les podcasts ont une place particulière dans le monde de la veille. C’est un type de sources qui a, sur certains sujets, une valeur inestimable. Ils peuvent en effet proposer des informations que l’on ne retrouve pas ailleurs, offrir de l’analyse et de la profondeur difficile à obtenir dans des contenus plus courts comme des articles par exemple, etc. De plus, les podcasts sont souvent gratuits, ce qui ne nécessite pas une souscription à un abonnement supplémentaire.
À côté des outils de reconnaissance faciale payants créés par Clearview, Thales ou Amazon, des moteurs de recherche faciale sont accessibles gratuitement sur le web, et à tout public. Mais que peut-on en tirer dans un contexte de recherche et de veille professionnelle ?
Le bouleversement de ce début d’année 2023, c’est bien évidemment le lancement grand public de ChatGPT et plus largement la course à l’intégration de l’IA générative dans tous les outils du quotidien et du monde professionnel.
L’innovation et l’actualité chez Google ne s’arrêtent jamais et ces derniers mois ne dérogent pas à la règle.
L’heure est indéniablement aux bonnes nouvelles du côté des moteurs. Alors qu’il n’y avait jusqu’à présent aucune alternative crédible à Google sur le terrain des moteurs Web pour la veille et la recherche d’information professionnelle, on voit enfin arriver sur le marché une nouvelle génération de moteurs en phase avec les problématiques des professionnels de l’information.
Cela fait 20 ans que de nouveaux moteurs apparaissent avec pour ambition de concurrencer voire détrôner Google. Et pratiquement tous ont le même créneau : le respect de la vie privée, domaine où il est clair que Google n’excelle pas.
Le moteur Brave fait partie des moteurs prometteurs à avoir dans sa boîte à outils de recherche.
L’entreprise spécialisée dans le SEO Ahrefs, basée à Singapour, mais fondée par l’Ukrainien Dmytro Gerasymenko, vient de dévoiler son propre moteur de recherche, Yep.com, qui se veut un émule du moteur Brave et ambitionne de prendre quelque part de marché au mastodonte Google et, dans une moindre mesure, à Bing.
Comme chaque année, Google organise au mois de mai sa fameuse conférence annuelle appelée Google I/O (pour Input/Output). Deux jours de show à l’américaine avec des annonces de nouveautés de produits et de fonctionnalités.
Dans le contexte actuel, les professionnels de l’information se retrouvent de plus en plus confrontés au besoin de se créer leurs propres outils de recherche thématiques pour ne pouvoir rechercher que sur un corpus restreint de sources qualifiées.
Philippe Masseron du gf2i (Groupement français de l’industrie de l’information) nous éclaire sur les enjeux cruciaux du droit d’auteur à l’ère de l’IA générative. Entre risques de prédation massive des contenus et opportunités d’accès et d’innovation portées par l’IA, les acteurs de la création et de l’information doivent se mobiliser pour défendre leurs intérêts et repenser leurs modèles de valorisation.
Parmi les promesses de l’IA concernant les métiers de l’information, le fact-checking figure en bonne place. À côté des outils payants, figurent nombre d’outils gratuits ou peu onéreux qui pourraient s’avérer utiles aux professionnels de l’information pour combattre la désinformation… Mais qu’en est-il dans la réalité ?
L'intelligence artificielle révolutionne le paysage médiatique en introduisant de nouvelles fonctionnalités telles que des résumés automatisés, des podcasts générés par l'IA, la traduction de contenu et des chatbots.
Pour rendre un livrable et une formation efficaces en vérifiant le niveau de compréhension de son public ou tout simplement pour rajouter une touche de divertissement, le quiz est un outil pédagogique qui peut s’avérer un précieux allié. Et aujourd’hui avec les modèles d’IA générative, un quiz peut être créé en une minute, ou presque. Florilège de nos 4 outils préférés.
Depuis les années 90, l’Open Access, porté par l’essor d’Internet et la philosophie de la science ouverte, a profondément transformé l’accès aux publications scientifiques en démocratisant la diffusion des connaissances.
En France, pays champion européen de l’open data, on parle souvent des startups qui parviennent à exploiter des données accessibles en accès gratuit, pour en faire des services, avec parfois une option payante, à l’instar de Pappers ou Doctrine.
L’année 2023 a été marquée par la démocratisation des IA génératives. Cette technologie de pointe, qui a émergé sur le marché en 2020, était alors réservée à quelques experts qui payaient une API. Amorcée par la mise sur le marché de l’interface gratuite ChatGPT d’OpenAI, dont la plupart des produits sont devenus payants dans les mois qui ont suivi, cette démocratisation pourrait néanmoins perdurer grâce au développement de modèles de langage sous licence ouverte (ou « open source »).
Depuis la sortie du générateur de texte ChatGpt il y a quelques mois, on commence à comprendre que l’impact de l’IA sur les usages du professionnel de l’information concerne surtout la création de contenu.
Si 2023 a été l’année de ChatGPT et de la déferlante de nouveaux outils dopés à l’IA générative, 2024 sera celle de l’intégration de l’IA générative dans les outils traditionnels du pro de l’info. Explorez avec nous les diverses innovations des acteurs traditionnels en matière d’IA et interrogeons-nous sur la pertinence de délaisser les outils IA de la cuvée 2023 au profit des outils classiques.
S’il n’est pas la seule clé du succès pour garantir un résultat satisfaisant d’un outil IA, un bon prompt augmente néanmoins ses chances d’obtenir satisfaction. Des milliers d’outils permettent de copier, améliorer ou encore stocker ses prompts. Ils varient en fonction des algorithmes concernés, des thèmes et des formats à générer et/ou des usages. En voici quatre sur une trentaine testés, sélectionnés pour leur efficacité et leur facilité de prise en main : Prompt Genius, PromptBase, SnackPrompt et FlowGPT.
Après les moteurs de recherche et les médias sociaux, l’IA générative redistribue de nouveau les cartes pour les médias d’information. Avec des impacts considérables sur la production, la diffusion et la monétisation du contenu. Comment les médias s’adaptent-ils et comment cela affecte-t-il l’activité de veille ? Petit tour des initiatives en cours.
L’Information scientifique et technique intéresse particulièrement les développeurs d’outils IA. En 2023, nous avons repéré au total plus de 20 outils IA spécifiquement dédiés à l’IST. Voici un tour d’horizon, le plus complet possible, pour aider le professionnel de la recherche d’information et de la veille à y voir plus clair et comprendre quelle place leur donner dans son activité.
Microsoft vient de mettre à disposition du marché européen son offre IA adaptée à sa suite Office et son tarif, 30 €/mois/personne, n’est pas négligeable pour un service de veille.
« Ça va trop vite, c’est difficile de trouver les bonnes sources, il y a trop d’outils et il y a trop d’aspects à maîtriser ». C’est avec ces mots que Franck Guigard, conseiller Performance et Management de l’information au sein de la CCI de la Drôme, résume la vague IA qui a déferlé sur sa veille métier.
La veille métier veille/infodoc et la gestion des connaissances qui s’en suit fait partie de mes pratiques depuis de nombreuses années. Cela me permet notamment de rester à jour, m’aide à développer mes compétences métier et me sert aussi à trouver des idées de sujets pour Bases et Netsources, bénéficier d’une base de matière brute pour rédiger des articles, préparer des formations ou des conférences et plus largement nourrir ma réflexion.
Le professionnel de l’information se retrouve très touché par le développement exponentiel de l’IA et l’arrivée de ChatGPT au début de l’année 2023, notamment en termes de compétences à développer et en connaissances à acquérir.
La question de la surcharge informationnelle, créée par l’explosion de la sphère numérique, se pose de façon toujours plus aiguë pour les métiers de l’information.
La fiabilité des sources est un critère essentiel pour les professionnels de la veille. En effet, ils doivent s’assurer que les informations qu’ils collectent sont exactes et fiables afin de pouvoir les transmettre à leurs clients.
Parmi les outils IA, ceux qui proposent la fonctionnalité de Text-to-Speech (ou Text to Voice) représentent un gain de productivité. On les utilise pour écouter ses sources, ou pour faire écouter son livrable en format audio.
L’intelligence artificielle s’invite dans le quotidien des professionnels de l’information. Lancée en tant que prototype le 30 novembre 2022, ChatGPT https://openai.com/blog/chatgpt s’est imposé comme l’application connaissant la croissance la plus rapide de tous les temps. Parallèlement, les enregistrements de noms de domaine en .ai ont augmenté de 156% au cours de la dernière année, contre seulement 27% pour les domaines en .com au cours de la même période, selon Domain Name Stat.
Depuis la sortie du générateur de texte ChatGpt il y a quelques mois, on commence à comprendre que l’impact de l’IA sur les usages du professionnel de l’information concerne surtout la création de contenu.
L’IA générative a un rôle à jouer à certaines étapes de la veille et de la recherche d’information et notamment lors de la phase d’analyse notamment pour tout ce qui a trait aux résumés de documents, de pages Web ou encore contenus audio et vidéo et à la possibilité d’interroger et d’interagir avec ces documents.
Pour ce nouvel article de « Focus IA », nous avons décidé de nous intéresser spécifiquement aux outils qui permettent de résumer et d’interroger des vidéos YouTube.
L’un des thèmes récurrents autour de ChatGPT et autres IA génératives concerne la question des prompts - c’est-à-dire les requêtes utilisées pour communiquer avec l’IA - avec l’idée que la qualité des réponses et contenus produits par ces outils dépendraient de la qualité des prompts.
Le déploiement massif de ChatGPT et autres modèles d’IA entraîne une transformation significative des tâches, des processus et de la valeur ajoutée des professionnels de l’information, qui se trouvent en première ligne de cette révolution en cours.
On découvre chaque jour, dans la déferlante des applis, extensions et plug-ins, tout le potentiel de ChatGPT et de l’IA pour nos métiers de l’information. Malgré les réserves très compréhensibles que l’on peut avoir, on ne peut nier l’intérêt de ces puissants modèles d’intelligence linguistique pour l’ensemble des opérations de traitement des données qui sont pour partie le socle de la veille et de l’activité documentaire.
Le bouleversement de ce début d’année 2023, c’est bien évidemment le lancement grand public de ChatGPT et plus largement la course à l’intégration de l’IA générative dans tous les outils du quotidien et du monde professionnel.
2023 sera-t-elle l’année où l’utilisation de l’intelligence artificielle (IA) se démocratise au sein de l’activité de veille ? En attendant de le confirmer, notre sélection dans l’actualité de la veille montre que l’IA s’intègre, doucement mais sûrement, dans nos outils quotidiens. Florilège.
L’intégration de l’IA dans les outils de recherche est le grand sujet de ce début d’année 2023. Et cela s’applique également au monde des moteurs de recherche académique.
Nul n’a pu y échapper. Dans les médias, au bureau… on ne parle que de cela : ChatGPT est-il en train de ringardiser Google ?
Parmi les promesses de l’IA concernant les métiers de l’information, le fact-checking figure en bonne place. À côté des outils payants, figurent nombre d’outils gratuits ou peu onéreux qui pourraient s’avérer utiles aux professionnels de l’information pour combattre la désinformation… Mais qu’en est-il dans la réalité ?
En septembre dernier, nous évoquions la question de la veille sur les réseaux sociaux, qui depuis le déclin de X (Twitter) devient de plus en plus fragmentée (cf. La veille sur les réseaux sociaux s’annonce de plus en plus fragmentée, BASES n°417, Septembre 2023). Si cette question subsiste et continue à rendre la veille sur les réseaux sociaux toujours plus complexe et chronophage, ce n’est pas la seule difficulté à laquelle est aujourd’hui confronté le veilleur.
Savoir réaliser des recherches d’image inversée sur le Web est une des compétences des professionnels de l’information. Si cette technique est toujours d’une utilité certaine, elle a quelque peu été malmenée au cours des dernières années. Et aujourd’hui, elle oscille entre une baisse significative de qualité et l’ajout récent de quelques nouveautés et innovations qui ouvrent de nouveaux horizons pour le veilleur.
Les réseaux sociaux sont incontournables pour la veille et la recherche d’information. Contrairement à d’autres types de sources, il faut dans la plupart des cas posséder un compte ou un profil sur le réseau pour tout visualiser. Ce qu’on ne souhaite pas nécessairement faire…
Depuis quelques années, le sujet du respect de la vie privée et de l’anonymat sur le Web prend de l’ampleur et les internautes adaptent leurs méthodes pour laisser moins de traces sur le Web. On ne cesse de voir des articles qui nous expliquent comment être le moins visible possible et comment préserver son anonymat.
Comme nous l’avons vu dans l’article « La veille Web sans trace : un pari impossible ? », laisser le moins de traces possible lors de ses recherches et veilles sur le Web n’est pas chose facile.
Les médias des collectivités locales sont des sources essentielles d’informations régionales au rôle bien singulier. Et comme l’intégration de ces ressources dans une veille reste un véritable défi, comment identifier, surveiller et intégrer ces médias à son système de veille.
Comment trouver des interlocuteurs qui permettent d’approfondir sa recherche ?
L’actualité politique est un jeu de ping-pong. Elle est faite de prises de position, et en retrouver l’origine permet de couvrir ses rebonds avec précision et fiabilité. Mais qu’il s’agisse de débats, d’interviews ou de discours, la surveillance et la vérification des interventions publiques constituent une vraie difficulté technique pour les professionnels de l’information.
Si les ressources et sites d’information en France sur le thème de l’autisme sont plutôt nombreux (Autisme Info Service, Comprendre l’autisme, etc.), il était jusqu’à présent difficile de trouver en un seul et même lieu un recensement de ressources documentaires qualifiées et de natures variées (ouvrages, thèses, articles, législation, etc.).
Même bien avant l’invention du Web, il a toujours existé un besoin de sources et outils capables de proposer, d’agréger et de structurer des listes de personnes, d’entreprises, de sources, etc. qualifiées par rapport à une thématique donnée ou un type de contenus. C’est le principe même des annuaires, dont on retrouve les premières traces dès le Moyen-âge.
Le Web change à vive allure et les sites Web que l’on voit aujourd’hui n’ont plus grand-chose à voir avec ceux d’il y a 5, 10 ou 20 ans. Si cette évolution est bien normale, elle pose un important problème en termes de conservation des données : tous les contenus qui se trouvaient sur ces sites qui ont disparu sont aujourd’hui inaccessibles directement sur le Web ou les moteurs. Et il n’existe que peu de moyens pour les retrouver.
La recherche d’information et la veille reposent avant tout sur un bon sourcing : le sourcing clé en main que l’on trouve dans les corpus que les professionnels utilisent au quotidien (agrégateurs de presse, plateformes de veille, etc.) et le sourcing « fait maison » que chacun se doit de mettre en place et faire évoluer régulièrement.
Les portails documentaires ont depuis de nombreuses années de multiples atouts qui en font des candidats de choix pour le sourcing des veilleurs. Mais encore faut-il réussir à les identifier.
Il y a quelques mois, l’INRS (Institut National de Recherche et de Sécurité) a mis en ligne son nouveau portail documentaire à cette adresse. On y trouve de multiples ressources en santé et sécurité au travail.
Cela fait des années que l’on entend parler de Cross-Language Information Retrieval (CLIR) pour la recherche d’information. Il s’agit de la capacité à rechercher dans une langue et à recueillir des résultats dans d’autres langues. Jusqu’à maintenant, les produits ou fonctionnalités de ce type étaient rares et n’ont jamais véritablement décollé, à l’instar de la fonctionnalité proposée par Google de 2007 à 2013.
Nous sommes à un moment charnière où l’intelligence humaine va s’enrichir considérablement de l’intelligence artificielle pour devenir encore plus puissante. Et les secteurs de l’information, de la communication et de la langue, terrains de prédilection d’un modèle de langage tel que ChatGPT, sont certainement parmi les premiers bénéficiaires de cet enrichissement inédit et renversant. Même si l’on peut naturellement craindre l’autre versant, beaucoup moins optimiste, de cette promesse, avec des effets négatifs encore difficiles à caractériser et à évaluer à ce stade.
Identifier des sources dans une langue étrangère nécessite de sortir de sa zone de confort. Il faut non seulement se plonger dans un paysage médiatique et culturel différent, mais aussi minimiser son risque d’erreur d’interprétation.
Toute veille débute par une phase d’identification des mots-clés qui serviront aux futures requêtes et alertes. Cette étape cruciale se complexifie quand la veille est internationale et nécessite de prendre en compte la question du multilinguisme.
ResearchGate est un réseau social consacré aux chercheurs leur permettant d’échanger entre eux sur différentes questions et de partager leurs publications.
Dans le cadre d’une veille technologique, souvent couplée à une démarche d’innovation/diversification, il peut être intéressant de surveiller non seulement les publications (articles, conférences, brevets), mais aussi les technologies cessibles.
Les Sociétés d’Accélération du Transfert de Technologies (SATT) en France jouent un grand rôle dans le développement technologique des innovations issues de la recherche publique française.
La documentation brevet constitue une source inestimable d’information pour établir une veille technologique et concurrentielle, ou même évaluer la valeur d’une entreprise. Au moins une vingtaine de bases de données brevet totalement ou partiellement gratuit sont désormais disponibles sur le WEB. S’il est difficile d’établir une hiérarchie entre elles, deux produits se détachent du lot : Espacenet, produit par l’Office Européen des Brevets, et Patentscope de l’OMPI (Organisation Mondiale de la Propriété Intellectuelle). Quel produit choisir, et faut-il choisir ?
Depuis les années 90, l’Open Access, porté par l’essor d’Internet et la philosophie de la science ouverte, a profondément transformé l’accès aux publications scientifiques en démocratisant la diffusion des connaissances.
En France, pays champion européen de l’open data, on parle souvent des startups qui parviennent à exploiter des données accessibles en accès gratuit, pour en faire des services, avec parfois une option payante, à l’instar de Pappers ou Doctrine.
Il faut revenir aux années 90 pour voir émerger le mouvement de la science ouverte, principalement sous la forme de l’« open access », porté par la volonté de donner un accès libre et gratuit aux publications scientifiques.
Notre habitude est de construire des stratégies complexes, mêlant synonymes, mots écrits de différentes façons (crosslink ou « cross link » par exemple), avec des opérateurs booléens, de proximité, des possibilités d’exclure des thématiques et, enfin, de multiples possibilités de combiner des étapes. Autant le dire tout de suite, ces stratégies ne sont pas transposables en l’état dans ces nouveaux outils.
Après la période de vide laissé par le départ en retraite de Martine Michel, CAS (Chemical Abstracts Services qui gère STN en collaboration avec FIZ Karlsruhe) vient de recréer son équipe en charge de la France.
En septembre dernier, le nouveau moteur académique Matilda était officiellement lancé. Explorez ses fonctionnalités de recherche avancées, ses fonctionnalités de veille, son vaste corpus et découvrez comment il se positionne par rapports aux outils de recherche académique.
Les Business cases sont une source originale d’information sur des problématiques d’entreprises, des questions de management ou d’éthique. Si, dans quelques cas, l’accès à ces études appliquées au milieu des affaires est réservé au monde universitaire (enseignants et étudiants), très souvent, leur accès peut être ouvert à d'autres publics. On recommandera dans tous les cas de bien vérifier les droits d'auteur et les exploitations possibles.
L’Information scientifique et technique intéresse particulièrement les développeurs d’outils IA. En 2023, nous avons repéré au total plus de 20 outils IA spécifiquement dédiés à l’IST. Voici un tour d’horizon, le plus complet possible, pour aider le professionnel de la recherche d’information et de la veille à y voir plus clair et comprendre quelle place leur donner dans son activité.
Comme nous avons pu le voir dans l’article « Comment enrichir sa veille concurrentielle avec les brevets ? » de ce même numéro, l’information brevet a un rôle à jouer dans tous les types de veille mais l’inverse est aussi vrai. L’information non-brevet, comme l’information business, financière, presse, etc. a aussi un rôle à jouer pour enrichir et améliorer la veille brevet.
Depuis quelques années, le mouvement no-code / low-code s’inscrit dans l’actualité des outils de veille. Ces outils permettent incontestablement d’imaginer et de réaliser des tâches qu’il était impossible de réaliser soi-même auparavant sans savoir coder (ou juste un peu, pour le low-code). Or, comme la datavisualisation , le no-code constitue un véritable moteur de transformation non seulement des usages, mais du métier dans son ensemble, tant il est vrai que le professionnel de l’information agit de concert avec les avancées informatiques comme nous l’avions déjà illustré avec l’utilisation de Github.
Une veille peut s’effectuer sur un très grand nombre de sources telles que les publications dans différents types de presse (généraliste, scientifique…), le web et, en particulier Google ou des sites spécialisés, les réseaux sociaux, les visites de foires et salons, les conférences…
Dans la plupart des entreprises, la veille brevet est souvent négligée. La veille brevet peut pourtant être une source d’informations précieuse pour l’intelligence concurrentielle. Elle permet de suivre l’évolution des technologies, d’identifier les concurrents, et d’exploiter toutes les opportunités de marché en développant une vraie stratégie. Entretien avec Philippe Borne, Délégué Régional de l’INPI pour la Région Grand Est (1), et également rédacteur occasionnel pour notre lettre BASES à titre d’expert.
On oublie trop souvent que les brevets ont un intérêt pour la veille concurrentielle. Et pourtant, en savoir un peu plus sur la politique brevet d’une entreprise est souvent très utile : par exemple, S’il s’agit de l’un de vos concurrents, cela peut être intéressant de connaître les techniques sur lesquelles il dispose d’une capacité d’interdiction, Si c’est un potentiel partenaire, cela peut être très pertinent avant de signer un accord de collaboration de connaître son niveau de sensibilité à la propriété industrielle. Et s’il s’agit d’un des fournisseurs auprès duquel vous vous approvisionnez en composants indispensables, s’il dispose de brevets sur ces composants, cela peut vouloir dire que vous ne pourrez vous fournir ailleurs. Et cette liste est loin d’être exhaustive.
Voilà des dizaines d’années qu’on lit cette expression dans de multiples documents de toutes natures ou qu’on l’entend prononcée lors de conférences. Pour illustrer la « popularité » de cette expression, une recherche dans Google avec l’expression « 80% of technical information is found only in patents » génère entre 8 et 10 millions de réponses. Si l’on cherche avec l’expression traduite en français, le nombre de documents annoncés est proche de 200 000 ! On sait que l’on ne pourra les visualiser tous, mais le chiffre est impressionnant.
Il existe de très nombreuses banques de données bibliographiques de littérature scientifique. Selon les cas, les possibilités de recherche sont plutôt rustiques ou, au contraire, plus ou moins sophistiquées (indexation, opérateurs de proximité, troncatures, conversion des orthographes américaine et anglaises, reconnaissance des abréviations, recherche sur des valeurs numériques, liens citants/cités, recherche par structures chimiques, recherche dans plusieurs banques de données à la fois…).
Il y a quelques années, on avait pu voir émerger des outils d’exploration des réseaux de citations des articles scientifiques. Ces outils s’avèrent très utiles pour trouver des articles scientifiques pertinents que l’on n’aurait pas forcément identifiés lors d’une recherche par mot-clé classique et sont donc complémentaires aux moteurs académiques.
OpenAlex est un nouvel outil qui vient se positionner sur le créneau de Google Scholar, Dimensions, Lens.org et les autres. Son but : devenir un catalogue qui recense un maximum de publications scientifiques, mais aussi chercheurs et institutions, une sorte de bibliothèque d’Alexandrie de l’IST version Web.
Nous avons déjà, à de multiples reprises, parlé des documents scientifiques d’origine chinoise référencés dans les banques de données et les serveurs d’origine chinoise ou occidentale.
Une citation est, dans un document donné, une référence à un autre document antérieur, traitant en général d’un sujet connexe. Les citations sont bien connues dans le domaine des articles scientifiques où leur nombre est souvent utilisé pour évaluer la qualité d’une publication.
L’intégration de l’IA dans les outils de recherche est le grand sujet de ce début d’année 2023. Et cela s’applique également au monde des moteurs de recherche académique.
Pendant longtemps, on a considéré que pour faire une recherche raisonnablement exhaustive de références bibliographiques scientifiques, il fallait, pour peu que l’on en ait les moyens, utiliser les serveurs ou agrégateurs payants tels que STN, Dialog, Scopus, ou encore Web of Science.
Tout le monde connaît Google Scholar pour rechercher dans la littérature académique (articles de revues scientifiques et académiques, thèses, preprints, comptes-rendus de conférences, etc.). On connaît moins les autres moteurs académiques qui composent le paysage et pourtant ils ont toute leur place dans la panoplie d’outils pour les chercheurs, les ingénieurs et les professionnels de l’information.
Rechercher des experts est une problématique courante de la recherche d’information scientifique et technique.
Malgré l’existence d’outils de recherche scientifiques, professionnels, payants et performants comme STN, Proquest Dialog, Scopus ou encore Web of Science, on constate au quotidien que Google Scholar et quelques autres moteurs académiques gratuits sont, et restent, des piliers de la recherche d’articles scientifiques. Soit en complément des serveurs et bases de données professionnelles soit comme point d’accès unique à la littérature scientifique.
Selon un « mantra » communément trouvé dans la littérature spécialisée, « 80 % de l’information technique trouvée dans les brevets n’est pas présente ailleurs ».
Canada Explore est un portail permettant d’accéder aux résultats de la recherche canadienne (cf. figure 1. Interface de Canada Explore).
Jusqu’à maintenant, l’outil se positionnait uniquement sur l’aspect recherche d’information. Depuis peu, il permet également de faire de la veille.
À la suite de la parution du récent numéro de NETSOURCES consacré aux outils de veille thématiques (N°155 - novembre/décembre 2021), l’une de nos lectrices Emilie Etienne, chargée de veille juridique chez Arkea, nous a soumis la question suivante : existe-t-il des outils de veille thématiques spécialisés sur l’univers de la banque et plus particulièrement de la réglementation bancaire ?
Dans le monde professionnel, nous sommes tous confrontés un jour ou l’autre, à la recherche de tarifs.
Threads, le réseau de micro-blogging de Meta, est accessible en France depuis quelques semaines. Le public commence à s’y rendre, y faire sa veille peut-il donc devenir intéressant ?
Sur Twitter, le nombre de fonctionnalités essentielles à la veille se réduisant drastiquement, nombreux sont les professionnels qui se questionnent sur les alternatives. Twitter a perdu encore 10 % d’abonnés en quelques mois, et les institutions, comme l’ENSSIB par exemple, commencent également à déserter cet espace.
Avec la multiplication des médias sociaux et les changements récents au sein de X (ex-Twitter) qui conduisent à se poser sérieusement la question d’une alternative, les professionnels de la veille sont amenés à tester, maintenant plus que jamais, de nouveaux canaux pour surveiller (et diffuser) leurs informations.
Le réseau social par excellence pour faire de la veille a longtemps été Twitter (désormais X), en raison des fonctionnalités qu’il proposait et de la gratuité de son API qui permettait l’existence d’un écosystème d’outils de qualité pour analyser, rechercher et faire de la veille sur le réseau social.
La veille métier veille/infodoc et la gestion des connaissances qui s’en suit fait partie de mes pratiques depuis de nombreuses années. Cela me permet notamment de rester à jour, m’aide à développer mes compétences métier et me sert aussi à trouver des idées de sujets pour Bases et Netsources, bénéficier d’une base de matière brute pour rédiger des articles, préparer des formations ou des conférences et plus largement nourrir ma réflexion.
Sur le Web, les commentaires publiés sous des articles, billet de blogs et sous les posts des réseaux sociaux peuvent parfois receler de véritables pépites mais ce sont des contenus difficiles à intégrer dans ses veilles et recherche d’information. En effet, on peut ponctuellement avoir besoin de plonger dans les commentaires sur les réseaux sociaux, par exemple pour une étude d’image, pour obtenir des informations complémentaires à l’article lui-même, pour y trouver des réponses, pour les analyser en vue d’une étude ou les sauvegarder en vue d’un usage futur.
Ne dites plus « lecteurs de flux RSS » mais « lecteurs d’information » ou « App d’actualité ». Nouvelles applis, nouvelles fonctionnalités, nouveaux looks, nouvelles promesses… Au cours de leur veille outils, les professionnels de l’info ont vu apparaître dernièrement de nouveaux acteurs, avec un discours marketing prometteur. Les lecteurs se moderniseraient-ils au point de gagner en notoriété ? Faut-il se préparer à remplacer Feedly ou Inoreader ? C’est à ces questions que nous nous proposons de répondre.
Pour ce nouvel article de « Focus IA », nous avons décidé de nous intéresser spécifiquement aux outils qui permettent de résumer et d’interroger des vidéos YouTube.
Il y a quelques mois maintenant, Twitter avait annoncé la fin de son API gratuite au profit d’une API payante. Après quelques mois de flottement, Twitter n’a finalement pas coupé l’accès à son API à la date prévue et a tout même annoncé garder une API gratuite allégée pour pouvoir publier du contenu directement sur Twitter. En revanche, impossible pour l’utilisateur de collecter, récupérer et analyser les contenus. Il y a quelques semaines, le couperet est finalement tombé, l’accès à l’API gratuite a été révoqué pour tous les acteurs qui l’utilisaient.
Des changements dans les flux algorithmiques qui modifient la veille
Les réseaux sociaux proposent pratiquement tous par défaut un flux d’information algorithmique que l’utilisateur peut faire défiler pour trouver des contenus susceptibles de l’intéresser.
Depuis le rachat effectif de Twitter par Elon Musk en octobre dernier (après des mois de tergiversations et de retournements en tous genres), le volume d’information et d’articles publiés à propos de Twitter a été très important avec une grande diversité de thèmes abordés : changements au niveau de la politique, licenciements massifs, avis négatifs et positifs sur le rachat, prospective sur l’avenir de ce réseau social, nouvelles fonctionnalités ou disparition de fonctionnalités existantes, etc.
Conçu il y a 10 ans, Inoreader, est l’un des rares agrégateurs qui permet d’aller le plus loin avec les flux RSS et réellement faire de la veille.
S’il y eut un temps où les réseaux sociaux proposaient pour la plupart des flux RSS sortants (sur des comptes, des requêtes, etc.), ce temps est bien révolu. En dépit du regain d’intérêt pour des solutions d’alertes du côté des géants du Web (voir notre article « Maîtriser le RSS, le socle inamovible de la veille »), il faut avoir conscience que ces acteurs ne remettront jamais de flux RSS en tant que tels puisque le but est de garder l’internaute captif de la plateforme. Le veilleur va devoir donc continuer d’essayer de récupérer des flux RSS.
Difficile à interroger, peu associé à une image professionnelle, Facebook ne semble pas le candidat idéal pour la veille ou la recherche d’information.
Né en octobre 2010 et racheté par Facebook dès 2012, Instagram compte aujourd’hui 1,386 milliard d’utilisateurs actifs mensuels, et 500 millions d’utilisateurs quotidiens dans le monde, ce qui en fait le 5e réseau social le plus utilisé.
LinkedIn est LE réseau social qui monte en puissance pour la veille et la recherche d’information. On y trouve de plus en plus de contenus pertinents qui pourront répondre à de multiples besoins informationnels : informations stratégiques, brevets, commerciales, concurrentielles, etc.
Reddit - ( pour « have you read it ? ») est un site web communautaire américain de discussion et de partage d’information, de médias et de liens. Découpé par espaces thématiques, ou communautés appelées aussi subreddits, chacune de ces communautés traite d’un sujet unique (actualité, science, ingénierie, politique, astuces et conseils, tutoriels, humour, jeux vidéo, art, etc.). Ainsi, Reddit comptabilise plus de 1,2 million de sujets divers.
Si on ne devait retenir qu’un seul réseau social pour sa veille et ses recherches d’information, ce serait sans aucun doute Twitter.
Les contenus multimédias et notamment les vidéos et les podcasts continuent de se multiplier sur le Web et les réseaux sociaux, avec des contenus potentiellement pertinents et professionnels pour la veille et la recherche d’information, que l’on ne retrouve pas nécessairement sous un autre format.
YouTube a été lancé en février 2005 en Californie par trois ex-employés de PayPal, avec comme objectif de mieux utiliser et valoriser la vidéo, un format jugé sous-exploité à l’époque par les trois fondateurs.
Lancé en Chine en 2016 et mondialement en 2017, TikTok est un réseau social de création et diffusion de vidéos au format court créé par l’entreprise chinoise Bytedance. Originellement uniquement sur smartphone, une interface sur ordinateur a été mise à disposition, ce qui permet aux professionnels de l’information de consulter plus facilement cette plateforme, notamment sans devoir nécessairement créer un compte.
Il est difficile, voire impossible aujourd’hui de se passer des réseaux sociaux quand on fait de la veille ou de la recherche d’information. Pour autant, il n’est pas toujours simple de les inclure à ses pratiques. Cela s’explique par plusieurs raisons.
Les réseaux sociaux, comme le Web et les moteurs de recherche dans leur ensemble évoluent à vive allure, que ce soit au niveau de leurs contenus, de leurs fonctionnalités, de leur modèle économique et de leur stratégie à long terme.
Les réseaux sociaux sont incontournables pour la veille et la recherche d’information. Contrairement à d’autres types de sources, il faut dans la plupart des cas posséder un compte ou un profil sur le réseau pour tout visualiser. Ce qu’on ne souhaite pas nécessairement faire…
Twitter est une source d’information incontournable pour le professionnel de l’information : qu’il s’agisse de réaliser une veille métier, un sourcing thématique, un premier tour d’horizon sur un sujet, une veille concurrentielle, Twitter apporte quasi systématiquement une valeur ajoutée à la recherche d’information et à la veille.
Philippe Masseron du gf2i (Groupement français de l’industrie de l’information) nous éclaire sur les enjeux cruciaux du droit d’auteur à l’ère de l’IA générative. Entre risques de prédation massive des contenus et opportunités d’accès et d’innovation portées par l’IA, les acteurs de la création et de l’information doivent se mobiliser pour défendre leurs intérêts et repenser leurs modèles de valorisation.
Dans une ère caractérisée par la volatilité des données numériques et le développement de l’IA dans notre sphère informationnelle, le rôle des professionnels continue de se transformer. Ceux-ci doivent affirmer toujours plus leur rôle de médiateur entre la technologie et les utilisateurs, et développer une compréhension critique des outils proposés.
L'intelligence artificielle révolutionne le paysage médiatique en introduisant de nouvelles fonctionnalités telles que des résumés automatisés, des podcasts générés par l'IA, la traduction de contenu et des chatbots.
Si 2023 a été l’année de ChatGPT et de la déferlante de nouveaux outils dopés à l’IA générative, 2024 sera celle de l’intégration de l’IA générative dans les outils traditionnels du pro de l’info. Explorez avec nous les diverses innovations des acteurs traditionnels en matière d’IA et interrogeons-nous sur la pertinence de délaisser les outils IA de la cuvée 2023 au profit des outils classiques.
La connaissance des médias est une compétence essentielle du sourcing et de l’analyse dans la veille informationnelle. Pourtant, les professionnels de la veille et des médias ne se côtoient que trop rarement. Or, connaître l’univers - et la diversité - médiatique est justement ce qui permet de constituer un corpus complet, c’est-à-dire qui prend en compte l’ensemble des opinions autour d’une question. Visite guidée, à l’aube d’une prochaine disruption médiatique.
Cette rubrique « FICHE DE SYNTHESE » se propose d’aider à comprendre en un clin d’œil les informations clés de chaque numéro de NETSOURCES. Cette rubrique sera également déclinée en version pédagogique « pas à pas » et commentée dans nos fiches pédagogiques « Les essentiels de la veille». Bonne lecture !
« Ça va trop vite, c’est difficile de trouver les bonnes sources, il y a trop d’outils et il y a trop d’aspects à maîtriser ». C’est avec ces mots que Franck Guigard, conseiller Performance et Management de l’information au sein de la CCI de la Drôme, résume la vague IA qui a déferlé sur sa veille métier.
La fiabilité des sources est un critère essentiel pour les professionnels de la veille. En effet, ils doivent s’assurer que les informations qu’ils collectent sont exactes et fiables afin de pouvoir les transmettre à leurs clients.
Le déploiement massif de ChatGPT et autres modèles d’IA entraîne une transformation significative des tâches, des processus et de la valeur ajoutée des professionnels de l’information, qui se trouvent en première ligne de cette révolution en cours.
L’intelligence artificielle s’invite dans le quotidien des professionnels de l’information. Lancée en tant que prototype le 30 novembre 2022, ChatGPT s’est imposé comme l’application connaissant la croissance la plus rapide de tous les temps. Parallèlement, les enregistrements de noms de domaine en .ai ont augmenté de 156% au cours de la dernière année, contre seulement 27% pour les domaines en .com au cours de la même période, selon Domain Name Stat.
Des changements dans les flux algorithmiques qui modifient la veille
Les réseaux sociaux proposent pratiquement tous par défaut un flux d’information algorithmique que l’utilisateur peut faire défiler pour trouver des contenus susceptibles de l’intéresser.