Nous avons le plaisir d’accueillir dans nos colonnes Marydee Ojala, professionnelle de l’information américaine très connue. Elle est rédactrice en chef de la revue ONLINE SEARCHER.
Nous avons adapté pour BASES l’article de Marydee, précédemment publié dans sa version originale en anglais dans la section ONLINE SEARCHER du numéro 5, volume 44, paru en juin 2024 de la revue COMPUTERS IN LIBRARIES sous le titre « The perils and power of NOT in prompting Chatbots » dans la rubrique « Voices of the searchers »
La plupart des professionnels de l’information connaissent bien les commandes booléennes de base : AND, OR et NOT. Elles fonctionnent parfaitement pour la recherche dans les bases de données traditionnelles. Lorsque nous enseignons les techniques de recherche, nous nous appuyons sur des exemples et des diagrammes de Venn pour démontrer la puissance de la recherche booléenne. J’ai toujours pensé que nous devrions souligner les dangers de la commande NOT, en particulier dans les ressources en texte intégral proposant des documents volumineux.
Entre les annonces de Google et d’OpenAI, l’utilisation de l’IA dans la recherche redessine irrémédiablement les pratiques sur Internet. Aux agrégateurs traditionnels comme les moteurs de recherche et les médias sociaux, s’ajoutent donc les moteurs avec IA. Pour les veilleurs, le challenge se déplace de la synthèse à la vérification des résultats de recherche.
Il y a quelques jours, OpenAI volait la vedette à Google qui présentait pourtant sa Keynote, événement phare des groupes de la tech. La rumeur, qu’Open AI ne s’est pas empressé de démentir, annonçait le lancement de son propre moteur de recherche. Finalement, ce dernier a (en attendant?) présenté un nouveau modèle gratuit qui intègre le web et les GPTs, des fonctionnalités jusqu’alors payantes (environ 20 €/mois). Si l’on ajoute la liste d’accords de licences avec les médias qui s’allonge chaque semaine, on comprend que l’ambition de ce dernier est réelle et se veut à la hauteur des attentes.
Les utilisateurs utilisent en effet les chats d’IA comme des moteurs de recherche et y font leurs recherches malgré le risque d’hallucination. La recherche d’informations fait ainsi partie des usages inattendus des modèles de langage, créés à l’origine pour deviner des suites de phrases. D’après une étude de The Verge, 53 % des utilisateurs et 61 % des Millenials utilisent les chats IA plutôt que les moteurs de recherche traditionnels pour faire leurs recherches.
Deux études récentes révèlent que la durabilité des informations sur le web est loin d’être garantie.
La première traite des liens DOI et montre qu’environ 27 % des documents ne sont pas conservés dans des archives pérennes. La seconde étude indique que 25 % des pages web créées il y a dix ans ont disparu, et de nombreux liens sur ces pages sont brisés. Ces résultats mettent en lumière les défis de la préservation de l’information numérique à long terme.
C’est un grand changement si on se réfère à l’ère du papier qui a débuté en 1 450 et a duré environ cinq siècles sans partage. En effet, pendant cette période, le support papier pour l’information paraissait relativement éternel préservé au moins pendant très longtemps dans les bibliothèques sauf incident majeur tel qu’un incendie ou les conséquences d’un conflit armé.
Utiliser un assistant IA monotâche comme les GPTs d’OpenAI permet d’utiliser un modèle de langage dans un but spécifique et de façon plus précise qu’avec un chatbot généraliste comme ChatGPT, Gemini ou Copilot. Nous en avons testé une vingtaine dédiés à la recherche et voici les résultats de notre sélection.
Les agents virtuels ne sont pas simplement capables de converser et de guider l’utilisateur comme un chatbot, mais ils peuvent aussi adapter leurs réponses au contexte et à l’intention de celui-ci.
Les plus connus sont les GPTs d’OpenAI, même si d’autres agents sont apparus comme les Hugging Chat Assistants de Hugging Face et les copilotes de Microsoft.
Mais les GPTs d’OpenAI, d’après nos tests, restent les plus opérationnels. Attention, ils ne sont toutefois disponibles qu’avec la version payante GPT Plus, pour un résultat qui reste inégal.
La nouvelle fonctionnalité de recherche IA « Browse for Me » du navigateur Arc n’est disponible que sur iPhone et elle fait déjà grand bruit.
Non seulement elle a été rapidement adoptée par les utilisateurs, mais la presse y voit une fonctionnalité qui réinvente la façon de s’informer… et pourrait être le pire cauchemar des éditeurs.
Disponible depuis quelques mois sur Windows après avoir été adopté par les utilisateurs de Mac (voir notre article « Arc browser réinvente la navigation en ligne », BASES N° 420, décembre 2023), le navigateur Arc vient à nouveau d’attirer l’attention du monde de la tech avec sa nouvelle fonctionnalité « Browse for Me » (que l’on pourrait traduire en français par « cherche pour moi »).
Disponible uniquement sur les iPhones actuellement, le bouton « Browse for Me » apparaît au cours de l’écriture dans la barre de recherche (voir Figure 1).
Cela fait des années que l’on entend parler de Cross-Language Information Retrieval (CLIR) pour la recherche d’information. Il s’agit de la capacité à rechercher dans une langue et à recueillir des résultats dans d’autres langues. Jusqu’à maintenant, les produits ou fonctionnalités de ce type étaient rares et n’ont jamais véritablement décollé, à l’instar de la fonctionnalité proposée par Google de 2007 à 2013.
Et pourtant, il y a là un vrai besoin notamment pour les professionnels de l’information : dans un monde globalisé, il est en effet souvent nécessaire d’élargir à des sources en anglais (ce qui est souvent gérable), mais aussi à des sources dans des langues dont on ne maîtrise pas toujours les rudiments.
Si on peut malgré tout à mettre en place un système qui fonctionne en s’aidant de dictionnaires et d’outils de traduction, le processus reste long et fastidieux (voir NETSOURCES n°163, Avril 2023 consacré à la veille multilingue).
Lire aussi :
Sourcing, de la théorie à l’épreuve de la pratique
Les nouvelles dimensions du multilinguisme pour la veille
Veille multilingue : comment trouver ses mots ?
Veille internationale : comment trouver des sources en langue étrangère ?
Comprendre les résultats de sa veille multilingue en un clin d’œil
Depuis quelques mois, un nouveau navigateur baptisé Arc est souvent évoqué comme une alternative à Chrome non seulement crédible, mais salutaire. Nous avons donc testé ce nouveau navigateur, accessible jusqu’alors à tous les utilisateurs de Mac, rejoints depuis ce mois-ci par les premiers utilisateurs de Windows PC inscrits sur liste d’attente. Spoiler : on a très vite oublié Chrome.
Le navigateur Arc a été créé par The Browser Company, une société américaine créée en 2019 qui réunit d’anciens salariés d’Instagram, Amazon, ou encore… Google Chrome. Josh Miller et Hursh Agrawal, de leur côté, avaient revendu une précédente startup à Facebook en 2014.
Comme beaucoup de professionnels de la veille, on a déjà testé de nombreux navigateurs, mais le nombre d’extensions utilisées sur Chrome uniquement ne rend pas le départ aisé. Or, c’est un premier frein important levé par Arc.
L’intelligence artificielle s’invite dans le quotidien des professionnels de l’information. Lancée en tant que prototype le 30 novembre 2022, ChatGPT https://openai.com/blog/chatgpt s’est imposé comme l’application connaissant la croissance la plus rapide de tous les temps. Parallèlement, les enregistrements de noms de domaine en .ai ont augmenté de 156% au cours de la dernière année, contre seulement 27% pour les domaines en .com au cours de la même période, selon Domain Name Stat.
Selon l’OCDE, 14 % des emplois seront ainsi exposés à un enjeu majeur d’automatisation, tandis que 32 % des emplois pourraient être transformés substantiellement. Qu’en est-il pour les professionnels de la veille ?
Face à cette ascension fulgurante, il reste difficile d’appréhender son nouvel environnement. Nous nous proposons donc de partager les bases de fonctionnement d’un système IA utiles aux métiers de la veille et de la recherche d’information et d’esquisser, à chaque étape du processus de veille, les premiers bouleversements expérimentés.
Le professionnel de la veille, parce qu’il manipule l’information qui transite entre l’intelligence humaine et l’intelligence artificielle, doit ainsi apprendre de nouveaux modèles de langage et d’apprentissage : ceux utilisés par l’IA.
Lire aussi :
Comment l’IA enrichit les livrables de veille multilingue ? (04/2023)
Revue des moteurs de recherche à l’heure de ChatGPT (04/2023)
Quels outils utiliser pour bénéficier de ChatGPT ? (01/2023)
Détecter un contenu écrit par ChatGPT : IA face à l’IA (gratuit - 02/2023)
Notre sélection d’annuaires d'outils IA (article en accès libre)
Le bouleversement de ce début d’année 2023, c’est bien évidemment le lancement grand public de ChatGPT et plus largement la course à l’intégration de l’IA générative dans tous les outils du quotidien et du monde professionnel.
Les moteurs de recherche Web dans leur ensemble se sont tous précipités pour intégrer cette dimension à leurs moteurs, certains intégrant directement GPT-3 ou 4 comme Bing et d’autres préférant utiliser d’autres modèles.
Cette intégration de l’IA générative et conversationnelle dans les moteurs apporte sans conteste une dimension nouvelle à la recherche d’information sur le Web.
Mais est-ce que cela améliore réellement les moteurs Web ? Cela permet-il de trouver plus rapidement de l’information, de trouver des informations qui n’arrivaient pas à émerger dans les moteurs de recherche, d’explorer plus en profondeur la fameuse longue traîne ?
Lire aussi :
Les moteurs gratuits, c’est fini
L’actu du Veilleur : plein phare sur l’IA
Quels outils utiliser pour bénéficier de ChatGPT ?
Nous avons testé Kagi Search, un nouveau challenger de Google
Presearch permet de chercher depuis la localisation de son choix
Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info
Dans le cadre d’une recherche d’informations, le premier réflexe pour identifier des sources est généralement de cibler des médias, des experts, voire des annuaires. Mais il existe une autre ressource utile pour fournir de l’information et à laquelle on pense moins : les listes de sources disponibles sur des tableurs en ligne comme Google Sheets ou Airtable et qui se multiplient.
La volonté de partager des listes de sources sur le Web a toujours existé, surtout avec l’avènement du Web 2.0. Mais le format ainsi que les outils de partage et d’hébergement de ces listes ont évolué. Il y a eu le temps des annuaires (qui sont finalement des sortes de listes), le temps des blogrolls sur les blogs, des outils de bookmarking, des FollowFriday et des listes sur Twitter, etc.
Aujourd’hui, outre Google Sheets, de nouveaux outils de création de bases de données ‘no-code’ et de tableurs en ligne ont vu le jour, dont le plus connu est Airtable (https://airtable.com/). Ces tableurs sont souvent partagés publiquement par des experts, consultants ou autres acteurs d’un secteur particulier, qui disposent en échange de la gratuité du service.
Ces listes plus ou moins exhaustives peuvent se révéler précieuses, car elles constituent un pré-tri de l’information opéré par une personne suffisamment intéressée et experte pour entreprendre ce travail de recherche et de structuration. Elles permettent donc d’aller au-delà pour dénicher des sources utiles, voire des pépites, ou même des idées de structuration de l’information.
Le nouveau moteur de recherche Kagi Search travaille actuellement sur un nouveau projet de recherche baptisé « Mother ».
Lorsqu’on pose une question à Mother, une IA de recherche sur le web « user-centric », « maman » ne se contente pas de fournir une liste de sources, mais en fait le résumé automatique.
Si on lui demande par exemple de comparer le nombre d’habitants entre deux villes, elle fournira directement une réponse synthétique issue de plusieurs sources, et non une liste de sources où aller chercher. Elle répond aussi à des questions comme « Pourquoi la terre est ronde ? ».
L’heure est indéniablement aux bonnes nouvelles du côté des moteurs. Alors qu’il n’y avait jusqu’à présent aucune alternative crédible à Google sur le terrain des moteurs Web pour la veille et la recherche d’information professionnelle, on voit enfin arriver sur le marché une nouvelle génération de moteurs en phase avec les problématiques des professionnels de l’information.
Après le lancement du très prometteur Neeva (voir notre article « Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info » - BASES n°406 - septembre 2022) voici venir un autre moteur tout aussi intéressant appelé Kagi Search (https://kagi.com/).
Kagi a lui aussi opté pour un positionnement où la qualité des résultats et de la recherche et le respect de la vie privée priment. Et ce choix passe également par un modèle économique freemium.
Dans cet article, nous présentons en détail ce nouveau moteur, son positionnement et ses fonctionnalités et nous évaluons sa capacité à intégrer la panoplie des veilleurs et des professionnels de l’information.
Lire aussi :
Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info
Utiliser la fonctionnalité Goggles de Brave Search en complément de Google CSE
Nous avons testé Yep.com, un nouveau moteur de recherche à l’index maison
Cela fait 20 ans que de nouveaux moteurs apparaissent avec pour ambition de concurrencer voire détrôner Google. Et pratiquement tous ont le même créneau : le respect de la vie privée, domaine où il est clair que Google n’excelle pas.
Quand on recherche de l’information dans un contexte professionnel, le respect de la vie privée est certes important, mais il faut aussi pouvoir obtenir des résultats pertinents et de qualité et avoir à disposition des fonctionnalités de recherche dignes de ce nom. Et c’est malheureusement rarement le cas des différents moteurs que nous avons pu tester ces dernières années tels que Qwant, DuckDuckGo, Yep.com ou encore You.
Un nouvel entrant pourrait bien venir changer les règles du jeu dans le monde des moteurs grâce à sa bonne compréhension des requêtes et la qualité de ses résultats.
Il s’agit du moteur Neeva qui arrive enfin en Europe après avoir été lancé aux États-Unis en 2021. Et le moins que l’on puisse dire, c’est que ce moteur a de très nombreuses qualités, allant de la longue expérience de ses fondateurs chez Google à des fonctionnalités qui servent vraiment les professionnels de l’information.
Le moteur Brave fait partie des moteurs prometteurs à avoir dans sa boîte à outils de recherche.
Il a récemment introduit une fonctionnalité intéressante appelée « Goggles », permettant à tout internaute de créer un moteur pour rechercher sur des corpus de sources personnalisés.
Les moteurs personnalisés sont une véritable aubaine pour les professionnels de l’information et de la veille et on note d’ailleurs un regain d’intérêt pour ces outils, comme en témoigne le lancement de cette fonctionnalité chez Brave, les possibilités de personnalisation chez Neeva ou encore le lancement de l’Atlas.pro
Voir nos articles « Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info » et « Nous avons testé Latlas.pro, un nouveau moteur de recherche thématique personnalisable », BASES n° 402, avril 2022.
Tous ces outils et fonctionnalités ne sont d’ailleurs pas sans rappeler le moteur personnalisé proposé par Google appelé Google CSE, qui existe toujours et qui vient d’ailleurs de rajeunir son interface. Créer un moteur personnalisé sur Brave n’est malheureusement pas aussi simple que la création du moteur CSE sur Google, mais ce n’est pas insurmontable.
Dans cet article, nous vous expliquons pas à pas comment créer vos propres corpus de recherche sur Brave et nous évaluons la valeur ajoutée de ces moteurs personnalisés par rapport à Google CSE.
Lire aussi :
Brave Search, You et Presearch : les nouveaux moteurs passés au crible
Nous avons testé Yep.com, un nouveau moteur de recherche à l’index maison
Nous avons testé Latlas.pro, un nouveau moteur de recherche thématique personnalisable
Faut-il préférer l’opérateur site: de Google ou la création d’un moteur CSE ?
L’entreprise spécialisée dans le SEO Ahrefs, basée à Singapour, mais fondée par l’Ukrainien Dmytro Gerasymenko, vient de dévoiler son propre moteur de recherche, Yep.com, qui se veut un émule du moteur Brave et ambitionne de prendre quelque part de marché au mastodonte Google et, dans une moindre mesure, à Bing.
À la différence des moteurs tels qu’Ecosia et DuckDuckGo, Yep.com dit utiliser pour son moteur un index développé en interne, à l’instar de Brave Search (voir notre article « Brave Search, You et Presearch : les nouveaux moteurs passés au crible », BASES n° 397 de novembre 2021), et non sur des API dérivant ou s’appuyant sur les index de Google et Bing.
L’index s’appuie donc pour l’instant sur AhrefsBot, un crawler « fait maison » pour indexer le Web, au rythme de 8 milliards de pages web toutes les 24 heures, selon la société.
La prochaine étape prévue sera de créer un YepBot indépendant des algorithmes d’Ahrefs.
Lire aussi :
Brave Search, You et Presearch : les nouveaux moteurs passés au crible
Alors que ces dernières années, l’interface de Google Actualités n’avait pratiquement plus aucun un intérêt pour la veille et la recherche et qu’il valait mieux passer par l’onglet « Actualités » du moteur web de Google, Google Actualités (ou Google News) a récemment introduit des fonctionnalités inédites.
Plusieurs d’entre elles découlent d’une utilisation accrue de l’IA et sont particulièrement prometteuses pour la veille et la recherche d’information, à tel point qu’elles pourraient bien amener le professionnel de l’info à reconsidérer l’interface pour ses recherches, en plus du moteur web classique.
Google Actualités a récemment lancé une nouvelle interface pour Google Actualités. Cette nouvelle version reste dans la droite ligne des dernières évolutions de Google sur l’ensemble de ses produits et Google cherche à collecter le plus d’informations possible sur le profil et les habitudes de ses usagers.
Google précise d’ailleurs sans détour son parti pris concernant sa politique de contenu dans le court disclaimer suivant :
« Ces articles sont classés en fonction de leur qualité, de l’originalité et de l’actualité de leur contenu, de votre activité et de vos achats précédents dans Google Actualités, ainsi que de votre activité dans d’autres produits Google. Google peut avoir un contrat de licence avec certains éditeurs, mais cela n’a aucun impact sur le classement des résultats. »
ArchiRès est le nom d’un réseau de bibliothèques des écoles nationales supérieures d’architecture (ENSA) et du paysage en France, mais également d’instituts en Belgique, au Maroc et au Liban. C’est aussi un portail documentaire du même nom qui donne accès à un catalogue de recherche commun aux différents organismes membres d’Archirès.
Une nouvelle version de ce portail vient de voir le jour le 28 mars dernier.
Nous avons exploré pour vous cette ressource et évalué son intérêt pour la veille et la recherche d’information.
Lire aussi :
Zoom sur les ressources de l’AURG pour l’urbanisme et l’aménagement
Zoom sur le portail de l’INRS sur la santé et sécurité au travail
Zoom sur Cerema Doc, la plateforme documentaire du climat et territoires de demain
Zoom sur le portail documentaire Eau & Biodiversité
Même bien avant l’invention du Web, il a toujours existé un besoin de sources et outils capables de proposer, d’agréger et de structurer des listes de personnes, d’entreprises, de sources, etc. qualifiées par rapport à une thématique donnée ou un type de contenus. C’est le principe même des annuaires, dont on retrouve les premières traces dès le Moyen-âge.
Et ces annuaires et répertoires, papier d’abord puis numériques (on se souvient de l’annuaire de Yahoo ou de Dmoz) ont toujours été d’une grande utilité pour le veilleur et ont longtemps fait partie de la panoplie de base du professionnel de l’information. Ils constituaient en quelque sorte de riches portails agrégateurs de flux thématiques.
Pourtant, ils se sont fait de plus en plus discrets avec les années, quitte à disparaître pour un grand nombre d’entre eux ou ont simplement été délaissés par les internautes et les professionnels.
Les moteurs de recherche généralistes comme Google, Bing et les autres ne sont pas sans responsabilité dans leur disparition. D’un côté les moteurs eux-mêmes ont tout fait pour marginaliser ces acteurs en limitant leur visibilité dans les résultats de leur propre moteur. Et de l’autre, les internautes ont naturellement choisi la voie de la simplicité et de l’efficacité en choisissant des outils les menant directement à la réponse à leur question plutôt que des outils les conduisant vers des sources pertinentes qu’il faut ensuite explorer et interroger.
Mais le vent pourrait bien être en train de tourner…
Lire aussi :
Comment identifier des sources d’information locales ?
Comment trouver des outils de recherche d’information thématiques ?
Comme nous l’avons vu dans l’article « La veille Web sans trace : un pari impossible ? », laisser le moins de traces possible lors de ses recherches et veilles sur le Web n’est pas chose facile.
Et pourtant, il existe des cas où cette stratégie est intéressante, voire même indispensable. On pensera ainsi aux cas où il faut limiter les biais liés à la personnalisation des résultats, et aux cas où il faut éviter de trop se dévoiler dans le cadre de sujets stratégiques, concurrentiels ou confidentiels.
Alors, comment s’y prendre ?
Dans cet article, nous analysons les différentes possibilités, méthodes et outils existants aujourd’hui. Nous couvrons un large champ de solutions allant de la plus simple et rapide à la plus complexe et chronophage. Pour chacune d’entre elles, nous évaluons les cas concrets où elles peuvent avoir une utilité et quels sont les avantages et inconvénients pour le processus de veille et de recherche d’information en lui-même.
Lire aussi :
Optimiser sa veille avec des extensions Chrome ou Firefox
Brave Search, You et Presearch : les nouveaux moteurs passés au crible
Depuis quelques années, le sujet du respect de la vie privée et de l’anonymat sur le Web prend de l’ampleur et les internautes adaptent leurs méthodes pour laisser moins de traces sur le Web. On ne cesse de voir des articles qui nous expliquent comment être le moins visible possible et comment préserver son anonymat.
Les méthodes pour y parvenir sont multiples, allant de conseils simples à implémenter, à des méthodes nettement plus chronophages et compliquées : de l’utilisation de moteurs plus respectueux de la vie privée à l’utilisation de VPN, installation de TOR, etc.
Si la question se pose de manière bien réelle dans le cadre de sa vie privée, qu’en est-il dans un contexte professionnel de recherche d’information et de veille ? Qu’a-t-on à gagner à laisser peu ou pas de traces sur le Web ou bien qu’a-t-on à y perdre ? Faut-il adapter ses méthodes de veille et de recherche d’information et en faire une démarche systématique ou bien l’utiliser dans certains cas bien précis ?
C’est ce que nous avons analysé dans ce nouveau numéro de NETSOURCES.
Lire aussi :
Google et la « recherche personnalisée » : quel impact pour les professionnels de l’information ?
Le Web change à vive allure et les sites Web que l’on voit aujourd’hui n’ont plus grand-chose à voir avec ceux d’il y a 5, 10 ou 20 ans. Si cette évolution est bien normale, elle pose un important problème en termes de conservation des données : tous les contenus qui se trouvaient sur ces sites qui ont disparu sont aujourd’hui inaccessibles directement sur le Web ou les moteurs. Et il n’existe que peu de moyens pour les retrouver.
Pour le professionnel à la recherche de contenus anciens (même s’il ne s’agit que de remonter quelques années en arrière), cette quête peut vite devenir compliquée, voire même perdue d’avance.
On a d’un côté les médias qui conservent dans la plupart des cas leurs archives Web. Ainsi une recherche d’antériorité sur ces contenus reste relativement simple. Les médias sociaux quant à eux conservent l’ensemble des contenus (sauf ceux supprimés volontairement par l’utilisateur), comme Twitter par exemple qui permet de rechercher jusqu’en 2006, année de son lancement. Là aussi, une recherche d’antériorité ne pose pas de problème majeur.
Mais pour de nombreux autres sites comme les sites d’entreprises, les sites institutionnels, les sites personnels, il ne subsiste rien quand le site fait peau neuve ou disparaît.
Lire aussi :
Comment retrouver de vieux articles de presse ?
Conseil Veille du 12 mai 2021 pour naviguer dans les archives d’un site web
Outils de recherche sur les contenus audios : un segment encore pauvre
Tout le monde ou presque utilise Google pour rechercher de l’information. S’y limiter présente néanmoins quelques risques : l’un des plus importants étant de passer à côté de contenus pertinents non accessibles sur le Web ouvert ou mal référencés.
Pour mener une recherche efficace sur Google, on peut bien évidemment tirer parti des différentes fonctionnalités proposées par le moteur (recherche sur un site ou une extension précise, recherche sur certains types de fichiers, recherche sur les titres de pages, etc).
Les fonctionnalités sont toujours nombreuses mais certaines ont disparu ces dernières années et d'autres n’ont tout simplement jamais fonctionné correctement (comme l’opérateur de proximité AROUND par exemple).
Mais saviez-vous que certains concurrents de Google comme Bing, DuckDuckGo ou encore Yandex proposent quelques fonctionnalités originales ou innovantes que l’on ne retrouve pas chez le géant américain ?
La phase de sourcing, c’est-à-dire l’identification des sources d’informations pertinentes est un élément essentiel de tout processus de veille. On peut bien évidemment créer des alertes sur des moteurs, réseaux sociaux, agrégateurs de presse tous azimuts ce qui peut générer un bruit considérable mais on a aussi et surtout intérêt à identifier et mettre sous surveillance des sources précises en lien avec son sujet.
Différentes méthodes sont possibles pour y parvenir : interroger des moteurs de recherche, des médias sociaux en testant plusieurs stratégies de recherche plus ou moins ciblées, explorer des sites de référence à la recherche d’une rubrique « liens » qui redirigerait vers d’autres sites pertinents, etc.
Le marché des moteurs de recherche «à modération humaine », comme les qualifie Phil Bradley sur son blog orienté internet & médias sociaux, n’en finit pas de mourir et de se régénérer. La disparition du moteur ChaCha coïncide avec l’arrivée d’Askwonder. Les interfaces et les business models varient mais ces moteurs reposent tous sur un même principe : le client sous-traite sa recherche d’informations (sur tous sujets) à une armée d’experts distants via un site web.
A priori effrayants, - on pense à tous les emplois détruits des vrais professionnels de l’information, remplacés par des cohortes de chercheurs incertains et surtout invisibles, - ces moteurs, de par cette perpétuelle renaissance, sont intéressants à plus d’un titre.
Ils sont d’abord la preuve vivante que les moteurs de type Google n’ont pas remplacé le besoin d’expertise et de médiation humaine face à l’outil. Même pratiquée dans des conditions dégradées, l’intervention humaine demeure nécessaire et elle est ici toujours reconnue et fortement valorisée, puisque ces moteurs se lancent à coût d’investissements importants.
Pour interroger la presse que ce soit pour la France ou à l’étranger, on pense généralement aux solutions suivantes :
Mais ces différentes solutions ne permettent malheureusement pas d’accéder à une très grande antériorité notamment au delà des années 90. Alors, comment faire ?
Google est le leader incontesté des moteurs de recherche et on a du mal à voir qui pourrait le détrôner un jour.
Pourtant, régulièrement, on voit surgir de nouvelles initiatives, notamment en France, de moteurs de recherche dits "révolutionnaires" et "innovants".
Ces nouveaux moteurs peuvent-ils avoir un intérêt pour la veille ou la recherche d’information ?
Pour le moment, aucun, malheureusement, n’a réussi à renverser la tendance.
Alors qu’à ses débuts Google était un moteur de recherche qui se limitait exclusivement aux mots-clés entrés par les internautes, la recherche sémantique prend aujourd’hui une part de plus en plus prépondérante dans le fonctionnement de Google.
Ces évolutions représentent un changement important pour tous les professionnels de l’information et de la veille qui n’ont plus nécessairement besoin d’entrer une longue requête avec les différentes formes d’un mot et synonymes puisque le moteur élargit en principe automatiquement la recherche à ses différentes variantes.
Nous avions d’ailleurs eu l’occasion d’aborder en détail cette question dans un article de Bases intitulé : « la mort annoncée de la recherche booléenne » (Bases n°340 – septembre 2016) où l’on découvrait d’ailleurs que les longues requêtes booléennes sur Google pouvaient en réalité avoir l’effet inverse à celui escompté.
Les salons professionnels représentent souvent une source d’information intéressante pour la veille et la recherche d’information.
Cela permettra par exemple :
d’identifier des salons en lien avec son activité pour y devenir exposant ou simple visiteur
de traquer la présence de concurrents sur les salons dans le cadre d’une veille concurrentielle
de repérer des fournisseurs et partenaires éventuels
d’identifier des médias spécialisés sur une thématique précise dans le cadre d’un sourcing
de repérer de nouveaux acteurs, start-ups et produits et services innovants dans un secteur bien précis pour une veille innovation, etc…
La semaine dernière, nous avions consacré un billet à la stratégie de Bing par rapport à Google : « La guerre Bing versus Google : Bing contre-attaque sur de nouveaux terrains » .
Dans cet article nous mentionnions Bing Custom Search, un moteur de recherche personnalisable lancé par Microsoft il y a quelques mois, qui n’est ni plus ni moins qu’un concurrent direct de Google CSE.
Les moteurs personnalisables représentent un intérêt indéniable pour la veille et la recherche d’information. Mais maintenant qu’il existe une alternative a priori crédible à Google CSE, lequel est le plus performant et dans quels cas choisir l’un plutôt que l’autre ? C’est ce que nous avons cherché à savoir cette semaine en comparant les deux services.
Depuis maintenant quelques années, Google propose sur la première page de résultats et, pour certaines requêtes seulement, des featured snippets, appelés en français extraits optimisés même si le terme français est beaucoup moins utilisé.
Affiché dans un cadre spécifique et au-dessus des résultats dits « naturels », en « position 0 », il constitue une réponse à la question posée par l’internaute et est extrait directement d’une page Web.
Ainsi, si vous demandez à Google « qu’est-ce que la veille stratégique ? », un encadré apparaît au dessus des résultats naturels contenant une définition de la veille stratégique issue de la page Wikipédia du même nom. Il n’est ainsi même pas nécessaire de se rendre sur cette page Web pour avoir la réponse à sa question. Du moins, en principe...
Est-ce que ces résultats apporte une réelle valeur ajoutée et un gain de temps pour la recherche d’information ou bien au contraire représentent-ils un pas de plus vers la mort des moteurs de recherche et l’avènement de l’ère de l’assistance ?