Il existe de très nombreuses banques de données bibliographiques de littérature scientifique. Selon les cas, les possibilités de recherche sont plutôt rustiques ou, au contraire, plus ou moins sophistiquées (indexation, opérateurs de proximité, troncatures, conversion des orthographes américaine et anglaises, reconnaissance des abréviations, recherche sur des valeurs numériques, liens citants/cités, recherche par structures chimiques, recherche dans plusieurs banques de données à la fois…).
Europe PMC (https://europepmc.org/) va plus loin même si elle n’offre pas toutes ces possibilités et nous n’hésitons pas à la qualifier de banque de données augmentée car elle permet, d’une part, de focaliser la recherche sur certaines parties d’un article, par exemple les éléments de méthodologie ou les figures. Elle permet aussi, ce qui est original, d’établir, à partir du contenu d’une référence des liens avec plusieurs banques de données externes plutôt factuelles/numériques, spécialisées dans le domaine des sciences de la vie telles que ChEMBL-small molecules ou MGnify-Metagenomics.
Pour ce nouvel article de « Focus IA », nous avons décidé de nous intéresser spécifiquement aux outils qui permettent de résumer et d’interroger des vidéos YouTube.
Nous avons identifié une vingtaine d’outils répondant à nos critères et nous les avons tous testés sur quatre vidéos : une vidéo d’actualité en français émanant d’un grand média français et une autre en anglais émanant d’un média américain, un webinaire d’une heure proposé par un éditeur de veille en français et enfin une vidéo tech en anglais recommandant plusieurs extensions ChatGPT.
Parmi la vingtaine d’outils, nombreux sont très décevants mais quatre sortent du lot et produisent des résultats intéressants pour les professionnels de l’information. Voici notre sélection !
Lire aussi :
Les meilleurs outils IA pour résumer et interroger les contenus de la veille
Notre sélection d’annuaires d'outils IA
Il y a quelques années, on avait pu voir émerger des outils d’exploration des réseaux de citations des articles scientifiques. Ces outils s’avèrent très utiles pour trouver des articles scientifiques pertinents que l’on n’aurait pas forcément identifiés lors d’une recherche par mot-clé classique et sont donc complémentaires aux moteurs académiques.
Parmi cette première génération d’outils, il existait deux grandes catégories : ceux qui étaient visuels proposant donc une représentation graphique, et ceux qui étaient uniquement textuels
Voir notre article « La recherche de citations et de références boostées par l’IA et les “open citations” » paru en avril 2019 - BASES n° 369.
Si les outils textuels ont bien résisté et ont aujourd’hui une place de choix dans le paysage de l’IST, les outils visuels n’ont pour la plupart pas eu le même destin. Parmi les outils de dataviz de première génération, on comptait des acteurs comme Citigraph, Yewno ou encore Citation Gecko, qui ont tous fermé leurs portes. Dans cette catégorie, seul VosViewer continue sa route et a été intégré très discrètement au moteur académique Dimensions.
Au cours des deux dernières années, une nouvelle génération d’outils visuels d’exploration des réseaux de citations est apparue, avec une petite dizaine d’acteurs cette fois-ci, toujours portée par l’amplification du mouvement de l’open (open access et open citations) dans le monde académique.
Dans cet article, nous dressons un panorama de ces différents outils et de leurs spécificités. Nous les avons également tous testés pour évaluer leur performance et vous aider à faire le bon choix.
On découvre chaque jour, dans la déferlante des applis, extensions et plug-ins, tout le potentiel de ChatGPT et de l’IA pour nos métiers de l’information. Malgré les réserves très compréhensibles que l’on peut avoir, on ne peut nier l’intérêt de ces puissants modèles d’intelligence linguistique pour l’ensemble des opérations de traitement des données qui sont pour partie le socle de la veille et de l’activité documentaire.
Nul doute que le professionnel de l’information doive évaluer tous les outils en fonction de leur apport technique et fonctionnel sur l’ensemble de la chaîne de valeur des opérations. Leur intégration conduit progressivement à l’optimisation, voire le ré-engineering, des processus internes.
● Face aux enjeux, nos méthodologies et recommandations d’outils dans BASES et NETSOURCES intègrent de plus en plus les contributions des premières IA commercialisées. À titre d'exemple : la «Revue des moteurs de recherche à l’heure de ChatGPT» (BASES N°413) et notre prochain NETSOURCES dédié à ChatGPT et autres outils d'IA.
● Nous consacrerons désormais notre rubrique ACTUALITES à l’exploration des outils «du moment» dans un domaine fonctionnel donné, afin de sortir des discours euphoriques et faire émerger ceux qui nous paraissent les plus prometteurs dans un contexte incertain.
Nous avons décidé de commencer cette nouvelle série d’articles par les nouveaux annuaires IA car c’est une des portes d’entrée de choix vers les nouveaux outils dopés à l’IA générative. Parmi les nombreux annuaires sur le marché, nous en avons sélectionné quatre que nous avons jugés les plus pertinents.
OpenAlex est un nouvel outil qui vient se positionner sur le créneau de Google Scholar, Dimensions, Lens.org et les autres. Son but : devenir un catalogue qui recense un maximum de publications scientifiques, mais aussi chercheurs et institutions, une sorte de bibliothèque d’Alexandrie de l’IST version Web.
OpenAlex est un projet de l’organisation à but non lucratif OurResearch financé par Arcadia, un fonds qui œuvre pour la préservation de la culture et la promotion du libre accès.
Nous avons testé la version Alpha (la bêta sortira en juillet prochain) pour savoir ce qu’elle avait à nous offrir et quelle pouvait être sa valeur ajoutée par rapport aux outils déjà en place.
Lire aussi :
De nouveaux moteurs gratuits pour concurrencer Google Scholar
Elicit, un nouveau moteur scientifique au banc d’essai
Recherche bibliographique : moteurs gratuits ou grands serveurs payants, que choisir ? (06/2022)
Linkedin a une place de plus en plus importante pour les professionnels de la veille et les derniers déboires de Twitter ne font que renforcer sa place comme source d’information incontournable. D’où la nécessité de trouver des outils et méthodes pour l’inclure au mieux dans ses processus de veille.
Hélas, la plateforme de LinkedIn propose peu de fonctionnalités de recherche, encore moins de veille, et son API extrêmement restrictive limite considérablement le nombre d’outils qui pourraient permettre de rechercher, analyser ou encore récupérer des données issues de LinkedIn.
Dans ce contexte, le récent lancement de WhatsIn, une extension Chrome, qui permet d’analyser et d’évaluer de manière visuelle un profil LinkedIn constitue une vraie nouveauté et ouvre un éventail de possibilités jusqu’alors inaccessibles au veilleur. Nous l’avons testée pour vous.
Lire aussi :
Réussir à utiliser LinkedIn pour la veille et la recherche d’information (06/2022)
Le veilleur face au défi de la représentation des données (12/2022)
Quelles dataviz tout au long du process de veille ? (12/2022)
La dataviz semble désormais être partout dans notre monde de l’information professionnelle, dans les demandes des clients et… dans les plateformes de veille.
Cette irruption du quantitatif, de l’analytique et du visuel dans des masses d’information documentaire longtemps sous-exploitées est à notre sens extrêmement positive, tant l’extraction et l’interprétation des données, rendue possible par la dataviz, donnent du sens à celles-ci et valorisent le travail de collecte et capitalisation des professionnels de l’information et de la veille.
Mais attention, utiliser la cartographie dans le but d’embellir une présentation ou, pire, en faire un argument de vente à une direction d’entreprise en promettant de générer «automatiquement» du sens via des graphes et représentations diverses, est en soi une aberration trop souvent observée… La dataviz comme pensée «automatisée», voire magique, est un facteur de risque, de contresens et confusion.
Depuis la mise à jour du moteur en juillet dernier (et le remplacement de son interface), nombreux sont les professionnels qui regrettent l’ancienne interface.
Qu’à cela ne tienne, Légifrance a procédé à quelques améliorations récemment au niveau de la recherche. Outre une dizaine de corrections de bugs, on notera les nouveautés suivantes :
Nul n’a pu y échapper. Dans les médias, au bureau… on ne parle que de cela : ChatGPT est-il en train de ringardiser Google ?
Au regard de la recherche d’informations, ChatGPT n’est pourtant pas assez fiable pour être utilisé de façon professionnelle. D’ailleurs, ce bot conversationnel n’a pas vocation à devenir un moteur de recherche. En revanche, son impact sur la recherche d’information est réel et il est intéressant d’explorer dès maintenant les usages en la matière, en ce qu’ils préfigurent ceux des années à venir.
Difficile de résumer ChatGPT, un bot gonflé à l’intelligence artificielle, à une seule fonctionnalité : créateur de contenu (et de code), moteur de réponse, traducteur, générateur de résumé… ChatGPT fait tout cela à la fois. Il peut donc être utilisé à chaque étape de la veille, qu’il s’agisse de l’identification des besoins, du sourcing, ou de l’analyse.
Pourquoi est-il populaire ? Du fait de son interface de dialogue simplifiée, à laquelle on accède après inscription. Une fois cette formalité établie, une barre de dialogue s’ouvre en bas de page. C’est là que l’on pose ses questions. L’outil y répond en haut et la conversation défile, comme une conversation avec n’importe quel chatbot.
L’innovation et l’actualité chez Google ne s’arrêtent jamais et ces derniers mois ne dérogent pas à la règle.
Dans cet article, nous faisons le point sur ces innovations récentes et nous testons les fonctionnalités et les produits, dans une perspective de veille et de recherche professionnelles.
En septembre dernier, Google a animé son rendez-vous annuel Search-On où il dévoile toutes ses nouveautés en lien avec son moteur et la recherche d’information.
À cette occasion, nous avons découvert de nouvelles fonctionnalités intéressantes.
Les guillemets dans Google ont toujours servi à rechercher des expressions exactes même si cela n’empêche pas Google de passer outre, de temps à autre, quand il le juge nécessaire.
L’usage des guillemets a récemment évolué, mais c’est au niveau des résultats que cela fait une différence. Les guillemets permettent toujours de rechercher une expression exacte, mais dans les résultats proposés, on peut maintenant visualiser un extrait du contenu contenant spécifiquement cette expression, ce qui permet donc de voir dans quel contexte l’expression est utilisée et déterminer la pertinence du résultat par rapport à ses besoins.
Lire aussi :
Nous avons testé Kagi Search, un nouveau challenger de Google
Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info
Si Feedly et Inoreader sont aujourd’hui les deux lecteurs RSS les plus plébiscités pour la veille (non sans raison), ils ne conviennent pas nécessairement à tout le monde : soit en raison du prix qui ne cesse d’augmenter avec les années, soit en termes d’hébergement et de sécurité des données (certaines entreprises n’autorisent pas l’utilisation de certains outils hébergés en ligne), soit en termes de fonctionnalités (ils en ont beaucoup pour la veille, mais ne peuvent couvrir l’ensemble des besoins).
Pour cet article, nous avons sélectionné 6 agrégateurs de flux RSS parmi tous ceux sur le marché qui sont sur le papier les plus prometteurs et intéressants pour toute personne faisant de la veille : Feedbro, Fresh RSS, New Sloth, Feedbin, Newsblur et Feeder.
Nous les avons testés, avons évalué leur potentiel pour le veilleur et avons analysé leurs particularités et leur valeur ajoutée par rapport aux autres outils du marché et notamment Feedly et Inoreader.
Lire aussi :
Maîtriser le RSS, le socle inamovible de la veille
Comment choisir la méthode la plus adaptée pour mettre une source en veille à partir d'un flux RSS
Comment récupérer un flux RSS sur la majorité des sites web ?
Comment récupérer des flux RSS sur les réseaux sociaux ?
Comment transformer une newsletter en flux RSS ?
Comment récupérer un flux RSS sur les moteurs web et Google Actualités ?
Conçu il y a 10 ans, Inoreader, est l’un des rares agrégateurs qui permet d’aller le plus loin avec les flux RSS et réellement faire de la veille.
Ses utilisateurs connaissent déjà les fonctionnalités qui ont assuré son succès, comme les « règles », pour automatiser le filtrage par mots-clés, le classement par « tags » ou « à lire plus tard », mais aussi la recherche et la surveillance facilitée de Google Actualités dans 25 langues, la « tasse à café » pour lire un article gratuit dans son intégralité ou encore la suppression des doublons. C’est l’une des raisons pour lesquelles il est l’outil privilégié des professionnels de l’information qui souhaitent maitriser leurs flux.
Sa tarification est une autre raison. Depuis sa création, Inoreader ne cesse de proposer de nouvelles fonctionnalités très utiles pour la veille, ce qui le hisse peu à peu en véritable concurrent frontal de certaines plateformes de veille... pour un budget beaucoup plus réduit. Si l’abonnement Pro est accessible à moins de 9 euros par mois, il faut cependant savoir que ses fonctionnalités les plus évoluées sont limitées en nombre. Il est toujours possible d’en acheter davantage pour compléter son dispositif, ce qui augmente le prix de l’abonnement, qui reste malgré tout bien en-deçà des propositions alternatives sur le marché
Inoreader est aujourd’hui doté d’au moins quatre avantages concurrentiels: la création de flux RSS, l’écoute de sa veille sous forme de playlist, son « moteur de recherche personnalisé » et sa newsletter automatique.
Lire aussi :
Maîtriser le RSS, le socle inamovible de la veille
Comment choisir la méthode la plus adaptée pour mettre une source en veille à partir d'un flux RSS
Comment récupérer un flux RSS sur la majorité des sites web ?
Comment récupérer des flux RSS sur les réseaux sociaux ?
Comment transformer une newsletter en flux RSS ?
Comment récupérer un flux RSS sur les moteurs web et Google Actualités ?
Quand on réalise une veille pour soi-même (dans le cas d’une veille métier par exemple), des veilles qui ne nécessitent pas des milliers de sources, qui génèrent un volume d’information raisonnable ou qu’on dispose d’un budget limité, les lecteurs de flux RSS sont toujours aujourd’hui des outils incontournables.
Mais il n’est pas toujours simple de choisir parmi tous les lecteurs/agrégateurs les plus adaptés pour la veille, car il y a de nombreux critères à prendre en compte.
C’est ce que nous explorons dans cet article.
Lire aussi :
Maîtriser le RSS, le socle inamovible de la veille
Comment choisir la méthode la plus adaptée pour mettre une source en veille à partir d'un flux RSS
Comment récupérer un flux RSS sur la majorité des sites web ?
Comment récupérer des flux RSS sur les réseaux sociaux ?
Comment transformer une newsletter en flux RSS ?
Comment récupérer un flux RSS sur les moteurs web et Google Actualités ?
Feedly est aujourd’hui un des lecteurs RSS les plus utilisés par les veilleurs et professionnels de l’information. Et ce n’est pas sans raison. Il propose en effet de nombreuses fonctionnalités qui répondent aux besoins des pros de l’information.
Le Feedly d’aujourd’hui n’a plus grand-chose à voir avec l’outil lancé en 2008. Au départ, Feedly est un lecteur de flux RSS gratuit proposant des fonctionnalités on ne peut plus basiques. L’outil reste relativement méconnu pendant des années, jusqu’à la disparition de Google Reader, lorsqu’il réussira intelligemment à se positionner comme alternative à Google Reader.
Avec les années, Feedly a su ajouter de nombreuses fonctionnalités utiles à toute personne faisant de la veille, mais semble de plus en plus vouloir se tourner vers d’autres types de publics.
Dans cet article, nous explorons en détail les fonctionnalités de Feedly afin de pouvoir l’utiliser au maximum de ses possibilités dans un contexte de veille, mais aussi de recherche d’information.
Lire aussi :
Maîtriser le RSS, le socle inamovible de la veille
Comment choisir la méthode la plus adaptée pour mettre une source en veille à partir d'un flux RSS
Comment récupérer un flux RSS sur la majorité des sites web ?
Comment récupérer des flux RSS sur les réseaux sociaux ?
Comment transformer une newsletter en flux RSS ?
Comment récupérer un flux RSS sur les moteurs web et Google Actualités ?
L’heure est indéniablement aux bonnes nouvelles du côté des moteurs. Alors qu’il n’y avait jusqu’à présent aucune alternative crédible à Google sur le terrain des moteurs Web pour la veille et la recherche d’information professionnelle, on voit enfin arriver sur le marché une nouvelle génération de moteurs en phase avec les problématiques des professionnels de l’information.
Après le lancement du très prometteur Neeva (voir notre article « Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info » - BASES n°406 - septembre 2022) voici venir un autre moteur tout aussi intéressant appelé Kagi Search (https://kagi.com/).
Kagi a lui aussi opté pour un positionnement où la qualité des résultats et de la recherche et le respect de la vie privée priment. Et ce choix passe également par un modèle économique freemium.
Dans cet article, nous présentons en détail ce nouveau moteur, son positionnement et ses fonctionnalités et nous évaluons sa capacité à intégrer la panoplie des veilleurs et des professionnels de l’information.
Lire aussi :
Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info
Utiliser la fonctionnalité Goggles de Brave Search en complément de Google CSE
Nous avons testé Yep.com, un nouveau moteur de recherche à l’index maison
Cela fait 20 ans que de nouveaux moteurs apparaissent avec pour ambition de concurrencer voire détrôner Google. Et pratiquement tous ont le même créneau : le respect de la vie privée, domaine où il est clair que Google n’excelle pas.
Quand on recherche de l’information dans un contexte professionnel, le respect de la vie privée est certes important, mais il faut aussi pouvoir obtenir des résultats pertinents et de qualité et avoir à disposition des fonctionnalités de recherche dignes de ce nom. Et c’est malheureusement rarement le cas des différents moteurs que nous avons pu tester ces dernières années tels que Qwant, DuckDuckGo, Yep.com ou encore You.
Un nouvel entrant pourrait bien venir changer les règles du jeu dans le monde des moteurs grâce à sa bonne compréhension des requêtes et la qualité de ses résultats.
Il s’agit du moteur Neeva qui arrive enfin en Europe après avoir été lancé aux États-Unis en 2021. Et le moins que l’on puisse dire, c’est que ce moteur a de très nombreuses qualités, allant de la longue expérience de ses fondateurs chez Google à des fonctionnalités qui servent vraiment les professionnels de l’information.
Zendy est un moteur académique qui a été lancé il y a quelques années, mais qui reste méconnu en France (cf. figure 1. Interface de Zendy).
L’idée de départ est de rendre plus accessible la littérature académique notamment dans les pays et régions où il est difficile de souscrire à des bases de données et serveurs payants.
Développé par Knowledge E, une société basée à Dubaï qui propose des solutions de bibliothèques numériques, Zendy a donc noué des partenariats avec de grands acteurs de l’édition académique pour indexer leurs contenus et en mettre une partie gratuitement à disposition de ses utilisateurs.
Lire aussi :
Elicit, un nouveau moteur scientifique au banc d’essai (06/2022)
L’entreprise spécialisée dans le SEO Ahrefs, basée à Singapour, mais fondée par l’Ukrainien Dmytro Gerasymenko, vient de dévoiler son propre moteur de recherche, Yep.com, qui se veut un émule du moteur Brave et ambitionne de prendre quelque part de marché au mastodonte Google et, dans une moindre mesure, à Bing.
À la différence des moteurs tels qu’Ecosia et DuckDuckGo, Yep.com dit utiliser pour son moteur un index développé en interne, à l’instar de Brave Search (voir notre article « Brave Search, You et Presearch : les nouveaux moteurs passés au crible », BASES n° 397 de novembre 2021), et non sur des API dérivant ou s’appuyant sur les index de Google et Bing.
L’index s’appuie donc pour l’instant sur AhrefsBot, un crawler « fait maison » pour indexer le Web, au rythme de 8 milliards de pages web toutes les 24 heures, selon la société.
La prochaine étape prévue sera de créer un YepBot indépendant des algorithmes d’Ahrefs.
Lire aussi :
Brave Search, You et Presearch : les nouveaux moteurs passés au crible
Alors que ces dernières années, l’interface de Google Actualités n’avait pratiquement plus aucun un intérêt pour la veille et la recherche et qu’il valait mieux passer par l’onglet « Actualités » du moteur web de Google, Google Actualités (ou Google News) a récemment introduit des fonctionnalités inédites.
Plusieurs d’entre elles découlent d’une utilisation accrue de l’IA et sont particulièrement prometteuses pour la veille et la recherche d’information, à tel point qu’elles pourraient bien amener le professionnel de l’info à reconsidérer l’interface pour ses recherches, en plus du moteur web classique.
Google Actualités a récemment lancé une nouvelle interface pour Google Actualités. Cette nouvelle version reste dans la droite ligne des dernières évolutions de Google sur l’ensemble de ses produits et Google cherche à collecter le plus d’informations possible sur le profil et les habitudes de ses usagers.
Google précise d’ailleurs sans détour son parti pris concernant sa politique de contenu dans le court disclaimer suivant :
« Ces articles sont classés en fonction de leur qualité, de l’originalité et de l’actualité de leur contenu, de votre activité et de vos achats précédents dans Google Actualités, ainsi que de votre activité dans d’autres produits Google. Google peut avoir un contrat de licence avec certains éditeurs, mais cela n’a aucun impact sur le classement des résultats. »
Tout le monde connaît Google Scholar pour rechercher dans la littérature académique (articles de revues scientifiques et académiques, thèses, preprints, comptes-rendus de conférences, etc.). On connaît moins les autres moteurs académiques qui composent le paysage et pourtant ils ont toute leur place dans la panoplie d’outils pour les chercheurs, les ingénieurs et les professionnels de l’information.
Dans cet article, nous avons choisi de tester un nouveau moteur académique : Elicit.
Comment vient-il se positionner dans l’univers des moteurs académiques et quelle est sa valeur ajoutée par rapport à des outils comme Google Scholar, Lens, Dimensions quand on a besoin de rechercher de l’information scientifique et technique ?
Lire aussi :
De nouveaux moteurs gratuits pour concurrencer Google Scholar
Les nouveaux outils de recommandation pour l’IST
L’outil de veille scientifique Meta sacrifié sur l’autel de Facebook
De la référence bibliographique au texte intégral des articles scientifiques, il n’y a pas toujours qu’un pas
Les contenus multimédias et notamment les vidéos et les podcasts continuent de se multiplier sur le Web et les réseaux sociaux, avec des contenus potentiellement pertinents et professionnels pour la veille et la recherche d’information, que l’on ne retrouve pas nécessairement sous un autre format.
Mais tous ces contenus restent difficiles à appréhender et à intégrer pleinement dans nos processus de veille ou de recherche. À tous les niveaux d’ailleurs, qu’il s’agisse du sourcing, de la collecte, de l’analyse ou de la diffusion.
Trouver ces contenus est un premier défi, car on ne recherche généralement que sur les métadonnées (titre, descriptif, tags), ce qui est très (trop) restrictif. Et les solutions qui indexent en texte intégral et permettent de rechercher efficacement sur le contenu sont généralement onéreuses.
Une fois que l’on a identifié des vidéos a priori pertinentes, les analyser et capitaliser sur leur contenu est un défi tout aussi grand.
C’est à cette phase que nous allons nous intéresser dans cet article avec un outil qui coche pratiquement toutes les cases : Azure Video Indexer qui est gratuit, performant et simple à utiliser.
Lire aussi :
Comment intégrer YouTube dans votre dispositif de veille
Avec le Live Streaming, les médias innovent mais le veilleur souffre
Recherche et veille Radio Télévision : les meilleurs outils
Mediatree veut faire profiter les veilleurs et professionnels de l’information de sa technologie de veille audiovisuelle
La révolution multimédia bouscule la veille
On a le choix entre :
Acheter des contenus sous licence (par exemple des photos de stocks : Fotolia, 123Ref, etc…)
Recourir au tout gratuit en se limitant aux contenus sous licence Creative Commons.
Quora, le site de questions-réponses américain vient d’annoncer le lancement d’une version en langue française. Elle est pour le moment en version bêta.
Quora existe depuis 2009 et permet à ses utilisateurs de poser n’importe quelle question auxquelles les autres utilisateurs peuvent répondre de manière publique.
Même si le format n’est pas le même, Quora peut paraître assez proche de Wikipédia sans pour autant avoir la même notoriété. Quora, dans sa version anglaise, compte tout de même plus de 100 millions d’utilisateurs mensuels dont une grande partie basée en Amérique du Nord.
Dans une récente interview à Libération, l’un des cofondateurs explique que la principale différence avec Wikipédia, c’est que leurs sources n’ont rien d’anonyme. Les utilisateurs doivent en effet s’inscrire sous leur vrai nom via Facebook, leur compte Google ou leur e-mail.
Autre différence constatée : là où Wikipédia s’apparente à une encyclopédie, Quora, de par son format de questions/réponses est plus propice aux informations du type listes/palmarès (les meilleurs outils de veille, le top 100 des entreprises dans le secteur de l’énergie, liste de blogs dans le secteur automobile etc).
La semaine dernière, nous avions consacré un billet à la stratégie de Bing par rapport à Google : « La guerre Bing versus Google : Bing contre-attaque sur de nouveaux terrains » .
Dans cet article nous mentionnions Bing Custom Search, un moteur de recherche personnalisable lancé par Microsoft il y a quelques mois, qui n’est ni plus ni moins qu’un concurrent direct de Google CSE.
Les moteurs personnalisables représentent un intérêt indéniable pour la veille et la recherche d’information. Mais maintenant qu’il existe une alternative a priori crédible à Google CSE, lequel est le plus performant et dans quels cas choisir l’un plutôt que l’autre ? C’est ce que nous avons cherché à savoir cette semaine en comparant les deux services.
Quel que soit le type de veille ou de recherche d’information, on ne saurait faire l’impasse sur les médias et la presse. La presse généraliste ou spécialisée, les magazines d’informations, la presse locale, professionnelle ou encore les sites d’actualités sont bien souvent une mine d’informations que l’on ne saurait négliger.
Pour interroger et surveiller la presse gratuitement, on dispose depuis 2002 de Google Actualités, un service lancé par Google lui-même, indexant uniquement des sites de presse, sites et blogs d’actualités.
Pour le professionnel, cela offre un accès centralisé à la presse et aux sites d’actualités avec des fonctionnalités de recherche semblables à celles du moteur Web de Google.
Et pour la veille, Google Actualités offrait encore il y a peu la possibilité de générer des flux RSS à partir d’une recherche dans le moteur.
Lire aussi :
Comment bien interroger Google en 2018 ?
Gratuité de l’information pour la veille : la fin d’une époque ?
La veille et la recherche d’information à l’heure de la recommandation de contenus
Depuis plusieurs années déjà, on entend régulièrement parler de la baisse de qualité de Google alertes. Quel est aujourd’hui l’intérêt de ce type d’outil pour la veille ? Google Alertes est-il réellement le meilleur de sa catégorie ? Ou bien faut-il se tourner vers des alternatives comme Talkwalker Alerts par exemple ?
Quand on souhaite mettre en place une veille concurrentielle, stratégique ou encore e-réputation on a le choix entre plusieurs approches.
La première consiste à identifier un certain nombre de sources pertinentes et à les mettre ensuite sous surveillance, via un bookmark ou outil de crawling web.
La seconde consiste à mettre en place des alertes par mots-clés (avec des requêtes plus ou moins complexes) dans différents outils comme les outils d’alertes Web (à l'image de Google Alertes), les plateformes de social media monitoring, les agrégateurs de presse, les bases de données professionnelles, etc. pour surveiller les nouveaux contenus publiés sur le Web ou dans les corpus pré-intégrés dans ces outils.
Ces deux approches sont complémentaires.
IA, deep learning, recherche sémantique, classification automatique : ces termes sont de plus en plus fréquents dans le monde des bases de données brevets.
Vont-ils renvoyer les tenants de la recherche traditionnelle au rayon des archives du monde des professionnels de l’information brevet ? Les codes CIB, CPC, les mots-clés représenteront-ils bientôt des techniques démodées à remiser au placard ? Qui sont ces nouveaux outils et condamnent-ils réellement des techniques éprouvées depuis plusieurs dizaines d’années, ou au contraire ne font-ils que les complémenter ? Enfin, quel est leur niveau de performance et comment les utilise-t-on ?
Les informations ici présentées résultent également d’un échange avec les équipes d’IPRally.
Parmi les nombreuses et complexes fonctions qu’un outil de veille spécialisé doit remplir, il en est une assez confidentielle, mais essentielle dans un dispositif de veille : la surveillance de pages d’un site web. Si les outils dédiés à cette fonction ont pourtant été les premiers à apparaître sur le marché de la veille à la fin des années 90, ils sont vite passés au second plan pour finalement devenir quasi-invisibles.
Aujourd’hui, même si la surveillance des sources se fait souvent de façon globale, soit via des agrégateurs de presse, soit via des outils ou plateformes de veille fournis clefs en main, on a encore souvent besoin d’« attaquer » une source de façon spécifique en utilisant son site web et en mettant sous contrôle une ou plusieurs pages :
Lire aussi :
Comment se repérer dans le paysage des outils de veille gratuits et bon marché ?
La question du lecteur : faut-il à tout prix automatiser sa veille ?
Détection de flux RSS : meilleurs outils et bonnes pratiques en 2021
Quel lecteur de flux RSS choisir en 2020 ?
Plateformes de veille : qu’ont-elles à offrir aux PME et TPE ?
Google Keen et Google Discover : les nouveaux Google Alertes ?
The Lens est un moteur de recherche lancé en 2000 par une organisation à but non lucratif, Cambia, basée au sein de l’Université de Technologie du Queensland à Brisbane en Australie.
Particularité distinctive, il donne accès à trois bases de données, dont une base de publications scientifiques, objet de l’article de François Libmann dans ce même numéro « The Lens pour la littérature scientifique : des contenus mal valorisés », une base de séquences et une base de données brevets en accès libre. Cette dernière est l’objet de cet article.
Dans l’article précédent « The Lens, un outsider au fort potentiel pour la recherche brevet gratuite », Philippe Borne s’est focalisé de façon détaillée sur la partie brevet de The Lens.
Dans cet article nous examinerons la partie consacrée à la littérature scientifique de The Lens que l’on atteint en cliquant sur « Scholary works » dans le menu déroulant « Our apps » sur la page d’accueil.
La recherche dans la littérature scientifique sous forme numérique est disponible depuis très longtemps à de multiples endroits de façon gratuite ou payante. Ici, elle est limitée aux documents dont les références sont en accès libre, ce qui ne préjuge pas de la gratuité ou non de l’accès au document lui-même (41 millions sont en accès libre).
Ces références proviennent de Crossref, Pubmed, Core et Microsoft Academic, sachant que Microsoft vient d’annoncer l’arrêt de son service Microsoft Academic, ce qui risque de poser problème.