Alors que l’utilité des cartes mentales est relancée par le renouveau actuel du Personal Knowledge Management, une nouvelle génération, issue des IA génératives, arrive sur le marché.
Il y a quelques années, on avait pu voir émerger des outils d’exploration des réseaux de citations des articles scientifiques. Ces outils s’avèrent très utiles pour trouver des articles scientifiques pertinents que l’on n’aurait pas forcément identifiés lors d’une recherche par mot-clé classique et sont donc complémentaires aux moteurs académiques.
Les métiers des professionnels de l’information, - documentation, veille, KM et autres fonctions liées à la gestion de l’information, - ont toujours été en prise directe avec les évolutions du numérique.
La datavisualisation (souvent appelée dataviz) est une représentation graphique permettant de synthétiser des données quantitatives surtout mais aussi qualitatives.
Depuis quelques années, les plateformes de veille intègrent de plus en plus de fonctionnalités de dataviz.
Quand la datavisualisation n’est pas incluse ou pas suffisamment aboutie dans les outils de recherche ou de veille que l’on utilise au quotidien, il n’y a pas d’autre choix que de se tourner vers des outils dédiés à la représentation visuelle de données.
Dans le monde de la veille, on peut aisément s’imaginer que la dataviz a surtout un rôle à jouer au niveau de l’analyse et des livrables.
Produit documentaire classique, la newsletter a su devenir incontournable pour proposer des services, mais aussi valoriser des activités et l’image du service documentaire. Nous avons expérimenté deux outils de création et diffusion de contenus, Flashissue et MailChimp.
Google a récemment annoncé qu’il avait retiré le cache des pages Web dans les résultats du moteur. C’était pourtant une option bien utile quand une page ou un site n’était pas disponible.
L’année 2023 a été marquée par la démocratisation des IA génératives. Cette technologie de pointe, qui a émergé sur le marché en 2020, était alors réservée à quelques experts qui payaient une API. Amorcée par la mise sur le marché de l’interface gratuite ChatGPT d’OpenAI, dont la plupart des produits sont devenus payants dans les mois qui ont suivi, cette démocratisation pourrait néanmoins perdurer grâce au développement de modèles de langage sous licence ouverte (ou « open source »).
Les médias des collectivités locales sont des sources essentielles d’informations régionales au rôle bien singulier. Et comme l’intégration de ces ressources dans une veille reste un véritable défi, comment identifier, surveiller et intégrer ces médias à son système de veille.
La connaissance des médias est une compétence essentielle du sourcing et de l’analyse dans la veille informationnelle. Pourtant, les professionnels de la veille et des médias ne se côtoient que trop rarement. Or, connaître l’univers - et la diversité - médiatique est justement ce qui permet de constituer un corpus complet, c’est-à-dire qui prend en compte l’ensemble des opinions autour d’une question. Visite guidée, à l’aube d’une prochaine disruption médiatique.
Après les moteurs de recherche et les médias sociaux, l’IA générative redistribue de nouveau les cartes pour les médias d’information. Avec des impacts considérables sur la production, la diffusion et la monétisation du contenu. Comment les médias s’adaptent-ils et comment cela affecte-t-il l’activité de veille ? Petit tour des initiatives en cours.
Les médias locaux évoluent et cela impacte directement le sourcing et les pratiques de veille. Comment identifier et intégrer ces sources et verticales dans son sourcing ?
L’infobésité des sources est un défi de plus en plus difficile à gérer, pour un veilleur comme pour tout un chacun. L’une des pistes possibles pour en sortir passe par une méthode de « mise en veilleuse » basée sur l’intelligence des sources que nous développons dans cet article.
Microsoft vient de mettre à disposition du marché européen son offre IA adaptée à sa suite Office et son tarif, 30 €/mois/personne, n’est pas négligeable pour un service de veille.
Sur Twitter, le nombre de fonctionnalités essentielles à la veille se réduisant drastiquement, nombreux sont les professionnels qui se questionnent sur les alternatives. Twitter a perdu encore 10 % d’abonnés en quelques mois, et les institutions, comme l’ENSSIB par exemple, commencent également à déserter cet espace.
On oublie trop souvent que les brevets ont un intérêt pour la veille concurrentielle. Et pourtant, en savoir un peu plus sur la politique brevet d’une entreprise est souvent très utile : par exemple, S’il s’agit de l’un de vos concurrents, cela peut être intéressant de connaître les techniques sur lesquelles il dispose d’une capacité d’interdiction, Si c’est un potentiel partenaire, cela peut être très pertinent avant de signer un accord de collaboration de connaître son niveau de sensibilité à la propriété industrielle. Et s’il s’agit d’un des fournisseurs auprès duquel vous vous approvisionnez en composants indispensables, s’il dispose de brevets sur ces composants, cela peut vouloir dire que vous ne pourrez vous fournir ailleurs. Et cette liste est loin d’être exhaustive.
Le réseau social par excellence pour faire de la veille a longtemps été Twitter (désormais X), en raison des fonctionnalités qu’il proposait et de la gratuité de son API qui permettait l’existence d’un écosystème d’outils de qualité pour analyser, rechercher et faire de la veille sur le réseau social.
Parmi les outils IA, ceux qui proposent la fonctionnalité de Text-to-Speech (ou Text to Voice) représentent un gain de productivité. On les utilise pour écouter ses sources, ou pour faire écouter son livrable en format audio.
Depuis la sortie du générateur de texte ChatGpt il y a quelques mois, on commence à comprendre que l’impact de l’IA sur les usages du professionnel de l’information concerne surtout la création de contenu.
Sur le Web, les commentaires publiés sous des articles, billet de blogs et sous les posts des réseaux sociaux peuvent parfois receler de véritables pépites mais ce sont des contenus difficiles à intégrer dans ses veilles et recherche d’information. En effet, on peut ponctuellement avoir besoin de plonger dans les commentaires sur les réseaux sociaux, par exemple pour une étude d’image, pour obtenir des informations complémentaires à l’article lui-même, pour y trouver des réponses, pour les analyser en vue d’une étude ou les sauvegarder en vue d’un usage futur.
Ne dites plus « lecteurs de flux RSS » mais « lecteurs d’information » ou « App d’actualité ». Nouvelles applis, nouvelles fonctionnalités, nouveaux looks, nouvelles promesses… Au cours de leur veille outils, les professionnels de l’info ont vu apparaître dernièrement de nouveaux acteurs, avec un discours marketing prometteur. Les lecteurs se moderniseraient-ils au point de gagner en notoriété ? Faut-il se préparer à remplacer Feedly ou Inoreader ? C’est à ces questions que nous nous proposons de répondre.
Dans le cadre d’une recherche d’informations, le premier réflexe pour identifier des sources est généralement de cibler des médias, des experts, voire des annuaires. Mais il existe une autre ressource utile pour fournir de l’information et à laquelle on pense moins : les listes de sources disponibles sur des tableurs en ligne comme Google Sheets ou Airtable et qui se multiplient.
La datavisualisation a un rôle à jouer à toutes les étapes de la veille comme nous avons pu le voir dans le précédent numéro de NETSOURCES. Cela commence dès les premières étapes de la veille avec la définition précise d’un sujet ainsi que le choix des mots-clés et du champ lexical à utiliser pour créer de futures alertes.
Dans le monde de la veille, on peut aisément s’imaginer que la dataviz a surtout un rôle à jouer au niveau de l’analyse et des livrables.
Conçu il y a 10 ans, Inoreader, est l’un des rares agrégateurs qui permet d’aller le plus loin avec les flux RSS et réellement faire de la veille.
Feedly est aujourd’hui un des lecteurs RSS les plus utilisés par les veilleurs et professionnels de l’information. Et ce n’est pas sans raison. Il propose en effet de nombreuses fonctionnalités qui répondent aux besoins des pros de l’information.
Si Feedly et Inoreader sont aujourd’hui les deux lecteurs RSS les plus plébiscités pour la veille (non sans raison), ils ne conviennent pas nécessairement à tout le monde : soit en raison du prix qui ne cesse d’augmenter avec les années, soit en termes d’hébergement et de sécurité des données (certaines entreprises n’autorisent pas l’utilisation de certains outils hébergés en ligne), soit en termes de fonctionnalités (ils en ont beaucoup pour la veille, mais ne peuvent couvrir l’ensemble des besoins).
Le marché des outils de veille est un univers vaste qui regroupe aussi bien les grosses plateformes de veille et de social media monitoring que des outils moins onéreux comme les outils de surveillance de pages et les lecteurs de flux RSS.
Quand on réalise une veille pour soi-même (dans le cas d’une veille métier par exemple), des veilles qui ne nécessitent pas des milliers de sources, qui génèrent un volume d’information raisonnable ou qu’on dispose d’un budget limité, les lecteurs de flux RSS sont toujours aujourd’hui des outils incontournables.
Une newsletter ne se reçoit pas nécessairement par email. Certaines plateformes de création de newsletters offrent la possibilité de s’abonner aux nouveaux contenus via RSS.
Avant de vouloir à tout prix récupérer un flux RSS, il faut déterminer si la source et les contenus que l’on souhaite surveiller sont adaptés à ce format. Et si c’est bien le cas, il existe une méthode générale qui peut s’appliquer à tous les types de sources (sites web, moteurs, réseaux sociaux, bases de données, etc.) et que nous avons détaillée dans l’article « Comment déterminer la méthode la plus adaptée pour mettre une source en veille ? ».
Il est possible de récupérer des flux RSS sur certains moteurs et leurs verticales. C’est par exemple le cas de Google et de ses moteurs spécialisés comme Google Actualités ou même Google Scholar.
S’il y eut un temps où les réseaux sociaux proposaient pour la plupart des flux RSS sortants (sur des comptes, des requêtes, etc.), ce temps est bien révolu. En dépit du regain d’intérêt pour des solutions d’alertes du côté des géants du Web (voir notre article « Maîtriser le RSS, le socle inamovible de la veille »), il faut avoir conscience que ces acteurs ne remettront jamais de flux RSS en tant que tels puisque le but est de garder l’internaute captif de la plateforme. Le veilleur va devoir donc continuer d’essayer de récupérer des flux RSS.
Cela fait des années que l'on nous annonce tantôt la mort du RSS tantôt sa résurrection quand ce n’est pas les deux en même temps.
Si on ne devait retenir qu’un seul réseau social pour sa veille et ses recherches d’information, ce serait sans aucun doute Twitter.
Savoir réaliser des recherches d’image inversée sur le Web est une des compétences des professionnels de l’information. Si cette technique est toujours d’une utilité certaine, elle a quelque peu été malmenée au cours des dernières années. Et aujourd’hui, elle oscille entre une baisse significative de qualité et l’ajout récent de quelques nouveautés et innovations qui ouvrent de nouveaux horizons pour le veilleur.
La recherche d’information et la veille reposent avant tout sur un bon sourcing : le sourcing clé en main que l’on trouve dans les corpus que les professionnels utilisent au quotidien (agrégateurs de presse, plateformes de veille, etc.) et le sourcing « fait maison » que chacun se doit de mettre en place et faire évoluer régulièrement.
Les podcasts ont une place particulière dans le monde de la veille. C’est un type de sources qui a, sur certains sujets, une valeur inestimable. Ils peuvent en effet proposer des informations que l’on ne retrouve pas ailleurs, offrir de l’analyse et de la profondeur difficile à obtenir dans des contenus plus courts comme des articles par exemple, etc. De plus, les podcasts sont souvent gratuits, ce qui ne nécessite pas une souscription à un abonnement supplémentaire.
À côté des outils de reconnaissance faciale payants créés par Clearview, Thales ou Amazon, des moteurs de recherche faciale sont accessibles gratuitement sur le web, et à tout public. Mais que peut-on en tirer dans un contexte de recherche et de veille professionnelle ?
Le bouleversement de ce début d’année 2023, c’est bien évidemment le lancement grand public de ChatGPT et plus largement la course à l’intégration de l’IA générative dans tous les outils du quotidien et du monde professionnel.
L’innovation et l’actualité chez Google ne s’arrêtent jamais et ces derniers mois ne dérogent pas à la règle.
L’heure est indéniablement aux bonnes nouvelles du côté des moteurs. Alors qu’il n’y avait jusqu’à présent aucune alternative crédible à Google sur le terrain des moteurs Web pour la veille et la recherche d’information professionnelle, on voit enfin arriver sur le marché une nouvelle génération de moteurs en phase avec les problématiques des professionnels de l’information.
Cela fait 20 ans que de nouveaux moteurs apparaissent avec pour ambition de concurrencer voire détrôner Google. Et pratiquement tous ont le même créneau : le respect de la vie privée, domaine où il est clair que Google n’excelle pas.
Le moteur Brave fait partie des moteurs prometteurs à avoir dans sa boîte à outils de recherche.
L’entreprise spécialisée dans le SEO Ahrefs, basée à Singapour, mais fondée par l’Ukrainien Dmytro Gerasymenko, vient de dévoiler son propre moteur de recherche, Yep.com, qui se veut un émule du moteur Brave et ambitionne de prendre quelque part de marché au mastodonte Google et, dans une moindre mesure, à Bing.
Comme chaque année, Google organise au mois de mai sa fameuse conférence annuelle appelée Google I/O (pour Input/Output). Deux jours de show à l’américaine avec des annonces de nouveautés de produits et de fonctionnalités.
Dans le contexte actuel, les professionnels de l’information se retrouvent de plus en plus confrontés au besoin de se créer leurs propres outils de recherche thématiques pour ne pouvoir rechercher que sur un corpus restreint de sources qualifiées.
Philippe Masseron du gf2i (Groupement français de l’industrie de l’information) nous éclaire sur les enjeux cruciaux du droit d’auteur à l’ère de l’IA générative. Entre risques de prédation massive des contenus et opportunités d’accès et d’innovation portées par l’IA, les acteurs de la création et de l’information doivent se mobiliser pour défendre leurs intérêts et repenser leurs modèles de valorisation.
Parmi les promesses de l’IA concernant les métiers de l’information, le fact-checking figure en bonne place. À côté des outils payants, figurent nombre d’outils gratuits ou peu onéreux qui pourraient s’avérer utiles aux professionnels de l’information pour combattre la désinformation… Mais qu’en est-il dans la réalité ?
L'intelligence artificielle révolutionne le paysage médiatique en introduisant de nouvelles fonctionnalités telles que des résumés automatisés, des podcasts générés par l'IA, la traduction de contenu et des chatbots.
Pour rendre un livrable et une formation efficaces en vérifiant le niveau de compréhension de son public ou tout simplement pour rajouter une touche de divertissement, le quiz est un outil pédagogique qui peut s’avérer un précieux allié. Et aujourd’hui avec les modèles d’IA générative, un quiz peut être créé en une minute, ou presque. Florilège de nos 4 outils préférés.
Depuis les années 90, l’Open Access, porté par l’essor d’Internet et la philosophie de la science ouverte, a profondément transformé l’accès aux publications scientifiques en démocratisant la diffusion des connaissances.
En France, pays champion européen de l’open data, on parle souvent des startups qui parviennent à exploiter des données accessibles en accès gratuit, pour en faire des services, avec parfois une option payante, à l’instar de Pappers ou Doctrine.
L’année 2023 a été marquée par la démocratisation des IA génératives. Cette technologie de pointe, qui a émergé sur le marché en 2020, était alors réservée à quelques experts qui payaient une API. Amorcée par la mise sur le marché de l’interface gratuite ChatGPT d’OpenAI, dont la plupart des produits sont devenus payants dans les mois qui ont suivi, cette démocratisation pourrait néanmoins perdurer grâce au développement de modèles de langage sous licence ouverte (ou « open source »).
Depuis la sortie du générateur de texte ChatGpt il y a quelques mois, on commence à comprendre que l’impact de l’IA sur les usages du professionnel de l’information concerne surtout la création de contenu.
Si 2023 a été l’année de ChatGPT et de la déferlante de nouveaux outils dopés à l’IA générative, 2024 sera celle de l’intégration de l’IA générative dans les outils traditionnels du pro de l’info. Explorez avec nous les diverses innovations des acteurs traditionnels en matière d’IA et interrogeons-nous sur la pertinence de délaisser les outils IA de la cuvée 2023 au profit des outils classiques.
S’il n’est pas la seule clé du succès pour garantir un résultat satisfaisant d’un outil IA, un bon prompt augmente néanmoins ses chances d’obtenir satisfaction. Des milliers d’outils permettent de copier, améliorer ou encore stocker ses prompts. Ils varient en fonction des algorithmes concernés, des thèmes et des formats à générer et/ou des usages. En voici quatre sur une trentaine testés, sélectionnés pour leur efficacité et leur facilité de prise en main : Prompt Genius, PromptBase, SnackPrompt et FlowGPT.
Après les moteurs de recherche et les médias sociaux, l’IA générative redistribue de nouveau les cartes pour les médias d’information. Avec des impacts considérables sur la production, la diffusion et la monétisation du contenu. Comment les médias s’adaptent-ils et comment cela affecte-t-il l’activité de veille ? Petit tour des initiatives en cours.
L’Information scientifique et technique intéresse particulièrement les développeurs d’outils IA. En 2023, nous avons repéré au total plus de 20 outils IA spécifiquement dédiés à l’IST. Voici un tour d’horizon, le plus complet possible, pour aider le professionnel de la recherche d’information et de la veille à y voir plus clair et comprendre quelle place leur donner dans son activité.
Microsoft vient de mettre à disposition du marché européen son offre IA adaptée à sa suite Office et son tarif, 30 €/mois/personne, n’est pas négligeable pour un service de veille.
« Ça va trop vite, c’est difficile de trouver les bonnes sources, il y a trop d’outils et il y a trop d’aspects à maîtriser ». C’est avec ces mots que Franck Guigard, conseiller Performance et Management de l’information au sein de la CCI de la Drôme, résume la vague IA qui a déferlé sur sa veille métier.
La veille métier veille/infodoc et la gestion des connaissances qui s’en suit fait partie de mes pratiques depuis de nombreuses années. Cela me permet notamment de rester à jour, m’aide à développer mes compétences métier et me sert aussi à trouver des idées de sujets pour Bases et Netsources, bénéficier d’une base de matière brute pour rédiger des articles, préparer des formations ou des conférences et plus largement nourrir ma réflexion.
Le professionnel de l’information se retrouve très touché par le développement exponentiel de l’IA et l’arrivée de ChatGPT au début de l’année 2023, notamment en termes de compétences à développer et en connaissances à acquérir.
La question de la surcharge informationnelle, créée par l’explosion de la sphère numérique, se pose de façon toujours plus aiguë pour les métiers de l’information.
La fiabilité des sources est un critère essentiel pour les professionnels de la veille. En effet, ils doivent s’assurer que les informations qu’ils collectent sont exactes et fiables afin de pouvoir les transmettre à leurs clients.
Parmi les outils IA, ceux qui proposent la fonctionnalité de Text-to-Speech (ou Text to Voice) représentent un gain de productivité. On les utilise pour écouter ses sources, ou pour faire écouter son livrable en format audio.
L’intelligence artificielle s’invite dans le quotidien des professionnels de l’information. Lancée en tant que prototype le 30 novembre 2022, ChatGPT https://openai.com/blog/chatgpt s’est imposé comme l’application connaissant la croissance la plus rapide de tous les temps. Parallèlement, les enregistrements de noms de domaine en .ai ont augmenté de 156% au cours de la dernière année, contre seulement 27% pour les domaines en .com au cours de la même période, selon Domain Name Stat.
Depuis la sortie du générateur de texte ChatGpt il y a quelques mois, on commence à comprendre que l’impact de l’IA sur les usages du professionnel de l’information concerne surtout la création de contenu.
L’IA générative a un rôle à jouer à certaines étapes de la veille et de la recherche d’information et notamment lors de la phase d’analyse notamment pour tout ce qui a trait aux résumés de documents, de pages Web ou encore contenus audio et vidéo et à la possibilité d’interroger et d’interagir avec ces documents.
Pour ce nouvel article de « Focus IA », nous avons décidé de nous intéresser spécifiquement aux outils qui permettent de résumer et d’interroger des vidéos YouTube.
L’un des thèmes récurrents autour de ChatGPT et autres IA génératives concerne la question des prompts - c’est-à-dire les requêtes utilisées pour communiquer avec l’IA - avec l’idée que la qualité des réponses et contenus produits par ces outils dépendraient de la qualité des prompts.
Le déploiement massif de ChatGPT et autres modèles d’IA entraîne une transformation significative des tâches, des processus et de la valeur ajoutée des professionnels de l’information, qui se trouvent en première ligne de cette révolution en cours.
On découvre chaque jour, dans la déferlante des applis, extensions et plug-ins, tout le potentiel de ChatGPT et de l’IA pour nos métiers de l’information. Malgré les réserves très compréhensibles que l’on peut avoir, on ne peut nier l’intérêt de ces puissants modèles d’intelligence linguistique pour l’ensemble des opérations de traitement des données qui sont pour partie le socle de la veille et de l’activité documentaire.
Le bouleversement de ce début d’année 2023, c’est bien évidemment le lancement grand public de ChatGPT et plus largement la course à l’intégration de l’IA générative dans tous les outils du quotidien et du monde professionnel.
2023 sera-t-elle l’année où l’utilisation de l’intelligence artificielle (IA) se démocratise au sein de l’activité de veille ? En attendant de le confirmer, notre sélection dans l’actualité de la veille montre que l’IA s’intègre, doucement mais sûrement, dans nos outils quotidiens. Florilège.
L’intégration de l’IA dans les outils de recherche est le grand sujet de ce début d’année 2023. Et cela s’applique également au monde des moteurs de recherche académique.
Nul n’a pu y échapper. Dans les médias, au bureau… on ne parle que de cela : ChatGPT est-il en train de ringardiser Google ?
Parmi les promesses de l’IA concernant les métiers de l’information, le fact-checking figure en bonne place. À côté des outils payants, figurent nombre d’outils gratuits ou peu onéreux qui pourraient s’avérer utiles aux professionnels de l’information pour combattre la désinformation… Mais qu’en est-il dans la réalité ?
En septembre dernier, nous évoquions la question de la veille sur les réseaux sociaux, qui depuis le déclin de X (Twitter) devient de plus en plus fragmentée (cf. La veille sur les réseaux sociaux s’annonce de plus en plus fragmentée, BASES n°417, Septembre 2023). Si cette question subsiste et continue à rendre la veille sur les réseaux sociaux toujours plus complexe et chronophage, ce n’est pas la seule difficulté à laquelle est aujourd’hui confronté le veilleur.
Savoir réaliser des recherches d’image inversée sur le Web est une des compétences des professionnels de l’information. Si cette technique est toujours d’une utilité certaine, elle a quelque peu été malmenée au cours des dernières années. Et aujourd’hui, elle oscille entre une baisse significative de qualité et l’ajout récent de quelques nouveautés et innovations qui ouvrent de nouveaux horizons pour le veilleur.
Les réseaux sociaux sont incontournables pour la veille et la recherche d’information. Contrairement à d’autres types de sources, il faut dans la plupart des cas posséder un compte ou un profil sur le réseau pour tout visualiser. Ce qu’on ne souhaite pas nécessairement faire…
Depuis quelques années, le sujet du respect de la vie privée et de l’anonymat sur le Web prend de l’ampleur et les internautes adaptent leurs méthodes pour laisser moins de traces sur le Web. On ne cesse de voir des articles qui nous expliquent comment être le moins visible possible et comment préserver son anonymat.
Comme nous l’avons vu dans l’article « La veille Web sans trace : un pari impossible ? », laisser le moins de traces possible lors de ses recherches et veilles sur le Web n’est pas chose facile.
Cela fait des années que l’on entend parler de Cross-Language Information Retrieval (CLIR) pour la recherche d’information. Il s’agit de la capacité à rechercher dans une langue et à recueillir des résultats dans d’autres langues. Jusqu’à maintenant, les produits ou fonctionnalités de ce type étaient rares et n’ont jamais véritablement décollé, à l’instar de la fonctionnalité proposée par Google de 2007 à 2013.
Nous sommes à un moment charnière où l’intelligence humaine va s’enrichir considérablement de l’intelligence artificielle pour devenir encore plus puissante. Et les secteurs de l’information, de la communication et de la langue, terrains de prédilection d’un modèle de langage tel que ChatGPT, sont certainement parmi les premiers bénéficiaires de cet enrichissement inédit et renversant. Même si l’on peut naturellement craindre l’autre versant, beaucoup moins optimiste, de cette promesse, avec des effets négatifs encore difficiles à caractériser et à évaluer à ce stade.
Identifier des sources dans une langue étrangère nécessite de sortir de sa zone de confort. Il faut non seulement se plonger dans un paysage médiatique et culturel différent, mais aussi minimiser son risque d’erreur d’interprétation.
Toute veille débute par une phase d’identification des mots-clés qui serviront aux futures requêtes et alertes. Cette étape cruciale se complexifie quand la veille est internationale et nécessite de prendre en compte la question du multilinguisme.
Search : Arc ouvre la voie à de nouvelles pratiques de recherche (04/2024)
Comprendre le paysage médiatique actuel pour maîtriser sa veille (12/2023)
Comment utiliser les journaux des collectivités locales ? (12/2023)
Médias et IA : ce que cela change pour la veille (12/2023)
Sourcing : l'info locale se renouvelle (12/2023)
Google News Showcase : un nouvel espace pour les articles de presse nationale et régionale (11/2022)
Sourcing : comment détecter des médias réellement nouveaux ? (02/2022)
La veille «médias» en 2021 : un champ complexe et diversifié (02/2021)
Recherche et veille sur les articles de presse : entre tradition et renouveau (02/2021)
Le no-code au service des veilleurs (10/2023)
Maîtriser le RSS, le socle inamovible de la veille (09/2022)
Comment récupérer un flux RSS sur les moteurs web et Google Actualités ? (09/2022)
Comment récupérer des flux RSS sur les réseaux sociaux ? (09/2022)
Comment transformer une newsletter en flux RSS ? (09/2022)
Comment récupérer un flux RSS sur la majorité des sites web ? (09/2022)
Github : le self-service du veilleur fauché, mais très motivé (11/2021)
Comment se repérer dans le paysage des outils de veille gratuits et bon marché ? (07/2021)
Veille : les outils de surveillance de pages gratuits et freemiums au banc d’essai (07/2021)
ResearchGate est un réseau social consacré aux chercheurs leur permettant d’échanger entre eux sur différentes questions et de partager leurs publications.
Dans le cadre d’une veille technologique, souvent couplée à une démarche d’innovation/diversification, il peut être intéressant de surveiller non seulement les publications (articles, conférences, brevets), mais aussi les technologies cessibles.
Les Sociétés d’Accélération du Transfert de Technologies (SATT) en France jouent un grand rôle dans le développement technologique des innovations issues de la recherche publique française.
La documentation brevet constitue une source inestimable d’information pour établir une veille technologique et concurrentielle, ou même évaluer la valeur d’une entreprise. Au moins une vingtaine de bases de données brevet totalement ou partiellement gratuit sont désormais disponibles sur le WEB. S’il est difficile d’établir une hiérarchie entre elles, deux produits se détachent du lot : Espacenet, produit par l’Office Européen des Brevets, et Patentscope de l’OMPI (Organisation Mondiale de la Propriété Intellectuelle). Quel produit choisir, et faut-il choisir ?
Depuis les années 90, l’Open Access, porté par l’essor d’Internet et la philosophie de la science ouverte, a profondément transformé l’accès aux publications scientifiques en démocratisant la diffusion des connaissances.
En France, pays champion européen de l’open data, on parle souvent des startups qui parviennent à exploiter des données accessibles en accès gratuit, pour en faire des services, avec parfois une option payante, à l’instar de Pappers ou Doctrine.
Il faut revenir aux années 90 pour voir émerger le mouvement de la science ouverte, principalement sous la forme de l’« open access », porté par la volonté de donner un accès libre et gratuit aux publications scientifiques.
Notre habitude est de construire des stratégies complexes, mêlant synonymes, mots écrits de différentes façons (crosslink ou « cross link » par exemple), avec des opérateurs booléens, de proximité, des possibilités d’exclure des thématiques et, enfin, de multiples possibilités de combiner des étapes. Autant le dire tout de suite, ces stratégies ne sont pas transposables en l’état dans ces nouveaux outils.
Après la période de vide laissé par le départ en retraite de Martine Michel, CAS (Chemical Abstracts Services qui gère STN en collaboration avec FIZ Karlsruhe) vient de recréer son équipe en charge de la France.
En septembre dernier, le nouveau moteur académique Matilda était officiellement lancé. Explorez ses fonctionnalités de recherche avancées, ses fonctionnalités de veille, son vaste corpus et découvrez comment il se positionne par rapports aux outils de recherche académique.
Les Business cases sont une source originale d’information sur des problématiques d’entreprises, des questions de management ou d’éthique. Si, dans quelques cas, l’accès à ces études appliquées au milieu des affaires est réservé au monde universitaire (enseignants et étudiants), très souvent, leur accès peut être ouvert à d'autres publics. On recommandera dans tous les cas de bien vérifier les droits d'auteur et les exploitations possibles.
L’Information scientifique et technique intéresse particulièrement les développeurs d’outils IA. En 2023, nous avons repéré au total plus de 20 outils IA spécifiquement dédiés à l’IST. Voici un tour d’horizon, le plus complet possible, pour aider le professionnel de la recherche d’information et de la veille à y voir plus clair et comprendre quelle place leur donner dans son activité.
Comme nous avons pu le voir dans l’article « Comment enrichir sa veille concurrentielle avec les brevets ? » de ce même numéro, l’information brevet a un rôle à jouer dans tous les types de veille mais l’inverse est aussi vrai. L’information non-brevet, comme l’information business, financière, presse, etc. a aussi un rôle à jouer pour enrichir et améliorer la veille brevet.
Depuis quelques années, le mouvement no-code / low-code s’inscrit dans l’actualité des outils de veille. Ces outils permettent incontestablement d’imaginer et de réaliser des tâches qu’il était impossible de réaliser soi-même auparavant sans savoir coder (ou juste un peu, pour le low-code). Or, comme la datavisualisation , le no-code constitue un véritable moteur de transformation non seulement des usages, mais du métier dans son ensemble, tant il est vrai que le professionnel de l’information agit de concert avec les avancées informatiques comme nous l’avions déjà illustré avec l’utilisation de Github.
Une veille peut s’effectuer sur un très grand nombre de sources telles que les publications dans différents types de presse (généraliste, scientifique…), le web et, en particulier Google ou des sites spécialisés, les réseaux sociaux, les visites de foires et salons, les conférences…
Dans la plupart des entreprises, la veille brevet est souvent négligée. La veille brevet peut pourtant être une source d’informations précieuse pour l’intelligence concurrentielle. Elle permet de suivre l’évolution des technologies, d’identifier les concurrents, et d’exploiter toutes les opportunités de marché en développant une vraie stratégie. Entretien avec Philippe Borne, Délégué Régional de l’INPI pour la Région Grand Est (1), et également rédacteur occasionnel pour notre lettre BASES à titre d’expert.
On oublie trop souvent que les brevets ont un intérêt pour la veille concurrentielle. Et pourtant, en savoir un peu plus sur la politique brevet d’une entreprise est souvent très utile : par exemple, S’il s’agit de l’un de vos concurrents, cela peut être intéressant de connaître les techniques sur lesquelles il dispose d’une capacité d’interdiction, Si c’est un potentiel partenaire, cela peut être très pertinent avant de signer un accord de collaboration de connaître son niveau de sensibilité à la propriété industrielle. Et s’il s’agit d’un des fournisseurs auprès duquel vous vous approvisionnez en composants indispensables, s’il dispose de brevets sur ces composants, cela peut vouloir dire que vous ne pourrez vous fournir ailleurs. Et cette liste est loin d’être exhaustive.
Voilà des dizaines d’années qu’on lit cette expression dans de multiples documents de toutes natures ou qu’on l’entend prononcée lors de conférences. Pour illustrer la « popularité » de cette expression, une recherche dans Google avec l’expression « 80% of technical information is found only in patents » génère entre 8 et 10 millions de réponses. Si l’on cherche avec l’expression traduite en français, le nombre de documents annoncés est proche de 200 000 ! On sait que l’on ne pourra les visualiser tous, mais le chiffre est impressionnant.
Il existe de très nombreuses banques de données bibliographiques de littérature scientifique. Selon les cas, les possibilités de recherche sont plutôt rustiques ou, au contraire, plus ou moins sophistiquées (indexation, opérateurs de proximité, troncatures, conversion des orthographes américaine et anglaises, reconnaissance des abréviations, recherche sur des valeurs numériques, liens citants/cités, recherche par structures chimiques, recherche dans plusieurs banques de données à la fois…).
Il y a quelques années, on avait pu voir émerger des outils d’exploration des réseaux de citations des articles scientifiques. Ces outils s’avèrent très utiles pour trouver des articles scientifiques pertinents que l’on n’aurait pas forcément identifiés lors d’une recherche par mot-clé classique et sont donc complémentaires aux moteurs académiques.
OpenAlex est un nouvel outil qui vient se positionner sur le créneau de Google Scholar, Dimensions, Lens.org et les autres. Son but : devenir un catalogue qui recense un maximum de publications scientifiques, mais aussi chercheurs et institutions, une sorte de bibliothèque d’Alexandrie de l’IST version Web.
Nous avons déjà, à de multiples reprises, parlé des documents scientifiques d’origine chinoise référencés dans les banques de données et les serveurs d’origine chinoise ou occidentale.
Une citation est, dans un document donné, une référence à un autre document antérieur, traitant en général d’un sujet connexe. Les citations sont bien connues dans le domaine des articles scientifiques où leur nombre est souvent utilisé pour évaluer la qualité d’une publication.
L’intégration de l’IA dans les outils de recherche est le grand sujet de ce début d’année 2023. Et cela s’applique également au monde des moteurs de recherche académique.
Pendant longtemps, on a considéré que pour faire une recherche raisonnablement exhaustive de références bibliographiques scientifiques, il fallait, pour peu que l’on en ait les moyens, utiliser les serveurs ou agrégateurs payants tels que STN, Dialog, Scopus, ou encore Web of Science.
Tout le monde connaît Google Scholar pour rechercher dans la littérature académique (articles de revues scientifiques et académiques, thèses, preprints, comptes-rendus de conférences, etc.). On connaît moins les autres moteurs académiques qui composent le paysage et pourtant ils ont toute leur place dans la panoplie d’outils pour les chercheurs, les ingénieurs et les professionnels de l’information.
Rechercher des experts est une problématique courante de la recherche d’information scientifique et technique.
Malgré l’existence d’outils de recherche scientifiques, professionnels, payants et performants comme STN, Proquest Dialog, Scopus ou encore Web of Science, on constate au quotidien que Google Scholar et quelques autres moteurs académiques gratuits sont, et restent, des piliers de la recherche d’articles scientifiques. Soit en complément des serveurs et bases de données professionnelles soit comme point d’accès unique à la littérature scientifique.
Selon un « mantra » communément trouvé dans la littérature spécialisée, « 80 % de l’information technique trouvée dans les brevets n’est pas présente ailleurs ».
Canada Explore est un portail permettant d’accéder aux résultats de la recherche canadienne (cf. figure 1. Interface de Canada Explore).
Jusqu’à maintenant, l’outil se positionnait uniquement sur l’aspect recherche d’information. Depuis peu, il permet également de faire de la veille.
À la suite de la parution du récent numéro de NETSOURCES consacré aux outils de veille thématiques (N°155 - novembre/décembre 2021), l’une de nos lectrices Emilie Etienne, chargée de veille juridique chez Arkea, nous a soumis la question suivante : existe-t-il des outils de veille thématiques spécialisés sur l’univers de la banque et plus particulièrement de la réglementation bancaire ?
Dans le monde professionnel, nous sommes tous confrontés un jour ou l’autre, à la recherche de tarifs.
Les nouvelles promesses de la recherche multilingue en action (02/2024)
Que valent les outils de reconnaissance faciale pour la veille image ou l’investigation ? (05/2023)
Nous avons testé Kagi Search, un nouveau challenger de Google (10/2022)
Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info (09/2022)
Utiliser la fonctionnalité Goggles de Brave Search en complément de Google CSE (09/2022)
Nous avons testé Yep.com, un nouveau moteur de recherche à l’index maison (08/2022)
Vidéo, image et traduction : les dernières innovations de Google à la loupe (05/2022)
Nous avons testé Latlas.pro, un nouveau moteur de recherche thématique personnalisable (04/2022)
Tous les outils pour rechercher dans les archives du Web (02/2022)
Investiguer localement en France : sortir des médias d’information traditionnels (02/2021)
Les outils et moteurs spécialisés sur les conférences, salons, congrès (09/2020)
Méthodologie et outils pour la recherche de statistiques (03/2020)
Comment trouver des outils de recherche d’information thématiques ? (01/2020)
Comment construire ses propres outils de recherche d’information thématiques ? (01/2020)
Threads, le réseau de micro-blogging de Meta, est accessible en France depuis quelques semaines. Le public commence à s’y rendre, y faire sa veille peut-il donc devenir intéressant ?
Sur Twitter, le nombre de fonctionnalités essentielles à la veille se réduisant drastiquement, nombreux sont les professionnels qui se questionnent sur les alternatives. Twitter a perdu encore 10 % d’abonnés en quelques mois, et les institutions, comme l’ENSSIB par exemple, commencent également à déserter cet espace.
Avec la multiplication des médias sociaux et les changements récents au sein de X (ex-Twitter) qui conduisent à se poser sérieusement la question d’une alternative, les professionnels de la veille sont amenés à tester, maintenant plus que jamais, de nouveaux canaux pour surveiller (et diffuser) leurs informations.
Le réseau social par excellence pour faire de la veille a longtemps été Twitter (désormais X), en raison des fonctionnalités qu’il proposait et de la gratuité de son API qui permettait l’existence d’un écosystème d’outils de qualité pour analyser, rechercher et faire de la veille sur le réseau social.
La veille métier veille/infodoc et la gestion des connaissances qui s’en suit fait partie de mes pratiques depuis de nombreuses années. Cela me permet notamment de rester à jour, m’aide à développer mes compétences métier et me sert aussi à trouver des idées de sujets pour Bases et Netsources, bénéficier d’une base de matière brute pour rédiger des articles, préparer des formations ou des conférences et plus largement nourrir ma réflexion.
Sur le Web, les commentaires publiés sous des articles, billet de blogs et sous les posts des réseaux sociaux peuvent parfois receler de véritables pépites mais ce sont des contenus difficiles à intégrer dans ses veilles et recherche d’information. En effet, on peut ponctuellement avoir besoin de plonger dans les commentaires sur les réseaux sociaux, par exemple pour une étude d’image, pour obtenir des informations complémentaires à l’article lui-même, pour y trouver des réponses, pour les analyser en vue d’une étude ou les sauvegarder en vue d’un usage futur.
Ne dites plus « lecteurs de flux RSS » mais « lecteurs d’information » ou « App d’actualité ». Nouvelles applis, nouvelles fonctionnalités, nouveaux looks, nouvelles promesses… Au cours de leur veille outils, les professionnels de l’info ont vu apparaître dernièrement de nouveaux acteurs, avec un discours marketing prometteur. Les lecteurs se moderniseraient-ils au point de gagner en notoriété ? Faut-il se préparer à remplacer Feedly ou Inoreader ? C’est à ces questions que nous nous proposons de répondre.
Pour ce nouvel article de « Focus IA », nous avons décidé de nous intéresser spécifiquement aux outils qui permettent de résumer et d’interroger des vidéos YouTube.
Il y a quelques mois maintenant, Twitter avait annoncé la fin de son API gratuite au profit d’une API payante. Après quelques mois de flottement, Twitter n’a finalement pas coupé l’accès à son API à la date prévue et a tout même annoncé garder une API gratuite allégée pour pouvoir publier du contenu directement sur Twitter. En revanche, impossible pour l’utilisateur de collecter, récupérer et analyser les contenus. Il y a quelques semaines, le couperet est finalement tombé, l’accès à l’API gratuite a été révoqué pour tous les acteurs qui l’utilisaient.
Des changements dans les flux algorithmiques qui modifient la veille
Les réseaux sociaux proposent pratiquement tous par défaut un flux d’information algorithmique que l’utilisateur peut faire défiler pour trouver des contenus susceptibles de l’intéresser.
Depuis le rachat effectif de Twitter par Elon Musk en octobre dernier (après des mois de tergiversations et de retournements en tous genres), le volume d’information et d’articles publiés à propos de Twitter a été très important avec une grande diversité de thèmes abordés : changements au niveau de la politique, licenciements massifs, avis négatifs et positifs sur le rachat, prospective sur l’avenir de ce réseau social, nouvelles fonctionnalités ou disparition de fonctionnalités existantes, etc.
Conçu il y a 10 ans, Inoreader, est l’un des rares agrégateurs qui permet d’aller le plus loin avec les flux RSS et réellement faire de la veille.
S’il y eut un temps où les réseaux sociaux proposaient pour la plupart des flux RSS sortants (sur des comptes, des requêtes, etc.), ce temps est bien révolu. En dépit du regain d’intérêt pour des solutions d’alertes du côté des géants du Web (voir notre article « Maîtriser le RSS, le socle inamovible de la veille »), il faut avoir conscience que ces acteurs ne remettront jamais de flux RSS en tant que tels puisque le but est de garder l’internaute captif de la plateforme. Le veilleur va devoir donc continuer d’essayer de récupérer des flux RSS.
Difficile à interroger, peu associé à une image professionnelle, Facebook ne semble pas le candidat idéal pour la veille ou la recherche d’information.
Né en octobre 2010 et racheté par Facebook dès 2012, Instagram compte aujourd’hui 1,386 milliard d’utilisateurs actifs mensuels, et 500 millions d’utilisateurs quotidiens dans le monde, ce qui en fait le 5e réseau social le plus utilisé.
LinkedIn est LE réseau social qui monte en puissance pour la veille et la recherche d’information. On y trouve de plus en plus de contenus pertinents qui pourront répondre à de multiples besoins informationnels : informations stratégiques, brevets, commerciales, concurrentielles, etc.
Reddit - ( pour « have you read it ? ») est un site web communautaire américain de discussion et de partage d’information, de médias et de liens. Découpé par espaces thématiques, ou communautés appelées aussi subreddits, chacune de ces communautés traite d’un sujet unique (actualité, science, ingénierie, politique, astuces et conseils, tutoriels, humour, jeux vidéo, art, etc.). Ainsi, Reddit comptabilise plus de 1,2 million de sujets divers.
Si on ne devait retenir qu’un seul réseau social pour sa veille et ses recherches d’information, ce serait sans aucun doute Twitter.
Les contenus multimédias et notamment les vidéos et les podcasts continuent de se multiplier sur le Web et les réseaux sociaux, avec des contenus potentiellement pertinents et professionnels pour la veille et la recherche d’information, que l’on ne retrouve pas nécessairement sous un autre format.
YouTube a été lancé en février 2005 en Californie par trois ex-employés de PayPal, avec comme objectif de mieux utiliser et valoriser la vidéo, un format jugé sous-exploité à l’époque par les trois fondateurs.
Lancé en Chine en 2016 et mondialement en 2017, TikTok est un réseau social de création et diffusion de vidéos au format court créé par l’entreprise chinoise Bytedance. Originellement uniquement sur smartphone, une interface sur ordinateur a été mise à disposition, ce qui permet aux professionnels de l’information de consulter plus facilement cette plateforme, notamment sans devoir nécessairement créer un compte.
Il est difficile, voire impossible aujourd’hui de se passer des réseaux sociaux quand on fait de la veille ou de la recherche d’information. Pour autant, il n’est pas toujours simple de les inclure à ses pratiques. Cela s’explique par plusieurs raisons.
Les réseaux sociaux, comme le Web et les moteurs de recherche dans leur ensemble évoluent à vive allure, que ce soit au niveau de leurs contenus, de leurs fonctionnalités, de leur modèle économique et de leur stratégie à long terme.
Les réseaux sociaux sont incontournables pour la veille et la recherche d’information. Contrairement à d’autres types de sources, il faut dans la plupart des cas posséder un compte ou un profil sur le réseau pour tout visualiser. Ce qu’on ne souhaite pas nécessairement faire…
Twitter est une source d’information incontournable pour le professionnel de l’information : qu’il s’agisse de réaliser une veille métier, un sourcing thématique, un premier tour d’horizon sur un sujet, une veille concurrentielle, Twitter apporte quasi systématiquement une valeur ajoutée à la recherche d’information et à la veille.
Identifier des podcasts pour sa veille (11/2023)
Rechercher et faire de la veille sur la radio et la télévision : un monde à part (02/2021)
Outils de recherche d’images : vers la reconnaissance de texte, objet et visage (12.2019)
La révolution multimédia bouscule la veille (12/2019)
Mettre en place une veille sur les contenus multimédias (12/2019)
La veille face aux nouveaux médias : podcasts, Stories, Lives, etc. (06/2019)
Outils de recherche de vidéos : des métadonnées au speech to text (12/2019)
Outils de recherche sur les contenus audios : un segment encore pauvre (12/2019)
Comment enrichir son sourcing grâce à Google Sheets, Airtable & les autres ? (03/2023)
Google améliore la recherche : le point sur les nouvelles fonctionnalités (11/2022)
Google, toujours à l’affût de nouveaux créneaux porteurs (02/2020)
Faut-il proscrire les opérateurs booléens sur Google ? nous avons testé (04/2020)
Faut-il préférer l’opérateur site: de Google ou la création d’un moteur CSE ? (03/2021)
Veille publicitaire : Google donne accès à l'historique des publicités des annonceurs (gratuit)
Comment rechercher des données chiffrées sur Google et moteurs de recherche généralistes ? (03/2020)
Ces petits détails qui peuvent influencer les résultats d’une recherche Google - (gratuit)
Quelques conseils pour effectuer une recherche « neutre » sur Google - (gratuit)
Comment effectuer une recherche d’information efficace sur Google News ? (gratuit)
Comment faire sa veille tarifaire ? les outils spécialisés et investigations manuelles (01/2022)
Veilleformation : comme son nom l’indique ! (11/2021)
Follaw.sv, une plateforme clé en main pour la veille sur les affaires publiques (11/2021)
Flint Business : des robots à l’œuvre pour la veille thématique (11/2021)
Wabtch, entre bookmarking et recommandation de contenus (11/2021)
Du Dark Web au Clear Web : Aleph Networks, une nouveauté pour la veille ? (04/2021)
Plateformes de veille : qu’ont-elles à offrir aux PME et TPE ? (04/2021)
Le marché des plateformes de veille se consolide (03/2021)
Quand les outils de veille intègrent les contenus payants à leurs offres (02/2019)
Trois nouveaux outils de recherche au banc d’essai (Geotrend, Needle et Netguide) (09/2019)
La Fondation Gates bouleverse le paysage de la publication scientifique (06/2024)
Scopus AI : une nouvelle façon de rechercher dans SCOPUS avec l’intelligence artificielle (05/2024)
ResearchGate développe ses liens avec les éditeurs (04/2024)
Matilda, le nouveau moteur académique sans IA (01/2024)
Europe PMC, une banque de données augmentée en sciences de la vie (09/2023)
La Chine facilite l'accès à sa littérature scientifique (03/2023)
Consensus, un moteur académique dopé à l’IA (01/2023)
Zendy : un moteur académique 100 % open access (09/2022)
Recherche bibliographique : moteurs gratuits ou grands serveurs payants, que choisir ? (06/2022)
Elicit, un nouveau moteur scientifique au banc d’essai (06/2022)
Le CEA facilite la recherche d’experts scientifiques grâce à son moteur CEA360 (06/2022)
Canada Explore : un portail pour accéder aux résultats de la recherche canadienne (03/2022)
Des informations académiques africaines dans AJOL (11/2021)
ResearchGate contraint de supprimer 200 000 articles (11/2021)
Inspec, une base dédiée à l’ingénierie, la physique et l’informatique (01/2021)
Retour de l’indexation de la littérature chinoise dans Chemical Abstracts (02/2021)
Dialog : Embase French Literature devient accessible à tous (02/2021)
ORCID et les autres outils d’identification des auteurs de publications scientifiques (04/2021)