Google Scholar a été créé en 2004 par deux chercheurs. Son objectif a été et est toujours de référencer de grandes quantités d’articles, de rapports, de comptes-rendus de conférences, de livres ou de thèses pour peu qu’ils relèvent du secteur académique.
Sa devise « Standing on the shoulders of giants » signifie que Google Scholar existe parce que des chercheurs ont écrit et accumulé d’immenses quantités de connaissances. Cela a justifié la création de Google Scholar pour aider à naviguer dans cet océan d’information et y trouver des réponses à ses questions.
Les raisons de cette large utilisation sont très simples.
D’une part, l’accès est gratuit alors que de nombreuses sources d’information scientifique sont payantes. C’était particulièrement vrai il y a vingt ans, mais moins aujourd’hui.
D’autre part, l’étendue de sa couverture a pour conséquence qu’il est rare de ne pas trouver au moins quelques réponses intéressantes et bien souvent un nombre non négligeable à une question scientifique.
Enfin, son utilisation est simple, voire très simple, même si quelques possibilités avancées sont disponibles bien que pas toujours très mises en avant.
En revanche, la troncature n’existe pas alors que c’est un « must » pratiquement partout. On ne peut pas non plus entrer une chaîne de recherche experte sans même parler de combinaisons d’étapes totalement impossibles.
En ce qui concerne le traitement des réponses, leur nombre est limité à 1 000 ce qui est largement suffisant pour une simple lecture, mais ne l’est plus pour faire du data mining.
Même si ses utilisateurs semblent être toujours aussi nombreux, on voit poindre une série de critiques plus ou moins fondamentales.
Google intensifie sa politique de diversité linguistique en annonçant l'ajout de huit nouvelles langues aux options de traduction de ses résultats de recherche, portant le total à 21. Parmi les langues ajoutées figurent l'arabe, le gujarati (une langue indienne), le coréen, le persan, le thaï, l'ourdou (parlé en Inde et au Pakistan), et le vietnamien.
Par ailleurs, Google Translate s'enrichit considérablement avec l'introduction de 110 nouvelles langues, y compris des langues régionales de France telles que le breton et l'occitan.
Les langues africaines sont également mises à l'honneur, un quart des nouvelles langues étant parlées sur le continent africain, comme le wolof, le fon, le kikongo.
Par ailleurs, on notera le tibétain et le cantonais, principal dialecte chinois depuis longtemps réclamé. Ces ajouts permettent à Google Translate de toucher plus de 614 millions de personnes supplémentaires.
Cette initiative s'inscrit dans le cadre du projet ambitieux lancé en 2022 visant à traduire les 1 000 langues les plus parlées à travers le monde.
En outre, Google améliore la reconnaissance vocale en apprenant à comprendre une multitude d'accents issus de diverses langues, renforçant ainsi son accessibilité et sa pertinence à l'échelle mondiale.
Google a récemment annoncé qu’il avait retiré le cache des pages Web dans les résultats du moteur. C’était pourtant une option bien utile quand une page ou un site n’était pas disponible.
Le cache est cependant toujours disponible si on utilise l’opérateur dédié dans la requête : cache:bases-publications.com
. Mais cette fonctionnalité a aussi vocation à disparaître dans les prochains mois.
Danny Sullivan, un des porte-parole de Google a expliqué que le cache « était destiné à aider les gens à accéder aux pages quand, à l’époque, on ne pouvait souvent pas compter sur le chargement d’une page. De nos jours, les choses se sont grandement améliorées. Il a donc été décidé de le retirer. »
Heureusement, il existe plusieurs options quand on souhaite visualiser l’historique d’un site ou quand il n’est tout simplement pas disponible. La plus connue et que l’on ne présente plus est la Wayback Machine proposée par Internet Archive (https://archive.org/), même si elle est loin d’être parfaite.
Une autre solution intéressante peut consister à utiliser le site CachedView (https://cachedview.nl/).
Au sommaire de ce numéro, 3 actualités soigneusement sélectionnées qui pourront avoir un impact sur les professionnels de l’info, veilleurs et analystes à court ou moyen terme.
Google SGE met en avant des pages habituellement absentes de la première page
IST et IA – Le passage à l’indexation automatique dans Medline et Pubmed : 47% des articles contiennent désormais des erreurs
L’essor des newsletters locales
Une récente analyse d'Authoritas sur Google SGE (la fonctionnalité d’IA de génération de réponses directement intégrée en haut des résultats de Google mais qui n’est pas encore disponible en Europe) a révélé que les réponses générées par SGE ne correspondent presque jamais (dans 93.8% des cas) aux liens des 10 premiers résultats de recherche organique.
Cela pourrait donc permettre à des sites habituellement mal référencés ou en tout cas absents du top 10 d’être plus visibles. Et par extension, pour le professionnel de l’information de voir des pages et sites pertinents qu’il n’avait pas nécessairement l’habitude de voir apparaître. Mais attention à ne pas se réjouir trop vite : SGE vient tout juste d’arriver et personne ne sait encore quelles sont les techniques et méthodes pour réussir à bien s’y positionner. Quand ce sera le cas, il est possible que les sites habituellement bien référencés reprennent tout simplement leur position de leaders…
Toujours est-il qu’il y a quand même une tendance générale à vouloir mieux faire émerger des contenus de qualité, mais peu visibles :
Et sinon, on peut continuer à utiliser les méthodes des professionnels des informations pour aller dénicher des pépites et trésors sur le Web :
- Sourcing, de la théorie à l’épreuve de la pratique
- Comment enrichir son sourcing grâce à Google Sheets, Airtable & les autres ?
- Identifier des podcasts pour sa veille
- Sourcing : comment détecter des médias réellement nouveaux ?
- Veille internationale : comment trouver des sources en langue étrangère ?
On s’intéressera maintenant à une présentation qui a été faite lors de la conférence annuelle 2023 de l’association des bibliothèques de la santé du Canada et dont le support vient d’être récemment mis en ligne à propos de l’usage de l’indexation (MeSH) par IA dans Medline.
On rappellera que dans Medline et PubMed, les articles sont indexés avec un système de mots-clés hiérarchisés appelé MeSH (Medical Subject Headings). Et cela s’avère très utile pour la recherche d’information.
Depuis avril 2022, tous les articles se voient attribués leur MeSH via l'indexation automatisée (IA). La présentation examine la capacité de l'IA à identifier et représenter correctement les concepts clés d'un article. Les résultats montrent que 47 % des articles examinés présentaient des problèmes au niveau des MeSH, affectant ainsi leur récupération potentielle lors de recherches.
Le basculement à un système d’indexation 100% IA montre à ce stade une dégradation de la qualité de l’indexation et par extension de la recherche. Car on aura dans les résultats à la fois plus de bruit avec des articles non pertinents qui ont reçu des MeSH qui ne les concernent pas et à la fois un risque accru de passer à côté d’articles pertinents qui, eux, n’ont pas reçu le(s) MeSH qu’ils devraient avoir.
La recherche via l’indexation MeSH ne peut ainsi plus, à ce stade, être considérée comme aussi fiable que le passé et nécessite une attention accrue.
Il est donc nécessaire de ne pas se reposer uniquement sur l’indexation pour effectuer ses recherches mais aussi de réaliser des recherches par mot-clés classiques sur le titre, abstract, etc.
On comprend en lisant la présentation que la vérification par un humain de l’indexation automatisée n’a ici rien de systématique : « Selon la NLM (National Library of Medicine), les MeSH attribués par l'IA sont déterminés sur la base des termes du titre, du résumé et des termes et de l'indexation des enregistrements "voisins et connexes", avec un examen humain et une curation des résultats "le cas échéant". »
Et cela n’augure rien de bon pour l’avenir de Medline et Pubmed en termes de qualité d’indexation. L’IA peut indéniablement avoir un rôle à jouer pour l’indexation en faisant gagner du temps et en ingérant de très gros volume de données mais l’IA fait aussi beaucoup d’erreurs et a besoin d’être améliorée, corrigée et entraînée en permanence. Il y a donc besoin d’une couche de vérification humaine pour corriger les erreurs mais aussi améliorer l’algorithme.
Sur ce thème, on conseillera un récent épisode du podcast « Le code a changé » de France Inter intitulé « Les dames de l’algorithmes » qui nous parle d'un groupe d'annotatrices travaillant pour le Palais de Justice et qui entraînent un programme d'IA sur un programme d'anonymisation automatique des décisions de justice. Et qui nous rappelle par la même occasion que l’IA n’a rien de magique et que derrière, il y a souvent beaucoup d’humain !
Pour aller plus loin sur la question de l’intégration de l’IA dans les métiers de l’information :
Faire de la veille, c’est d’abord réussir à identifier les meilleures sources d’information sur les sujets qui nous intéresse. Et ces sources peuvent se présenter sous de multiples formats : sites Web, blogs, comptes sur les réseaux sociaux, mais aussi de plus en plus newsletters.
Et l’une des tendances que l’on peut observer du côté des newsletters, c’est la multiplication de newsletters locales ou hyperlocales développées par des médias et journalistes à travers le monde.
Le magazine britannique The Lead a par exemple annoncé le lancement de 10 newsletters locales, chacune dédiée à une ville du nord de l’Angleterre. Toujours en Angleterre, on retrouve ce modèle de newsletter locale comme avec The Mill, une newsletter d’actualités dédiée à la ville de Manchester ou The Sheffield Tribune pour la ville de Sheffield. Et en France, Nice Matin ne cesse de développer son offre de newsletters locales. Derniers ajouts en date : FicaNice pour Nice et De la Rade au Faron pour Toulon.
Quand on a une dimension locale à inclure à sa veille en France ou à l’international, on ne pense pas nécessairement aux newsletters locales, d’autant que les newsletters ont eu un gros passage à vide pendant des années avant de revenir en force depuis quelques années (voir notre article de 2021 « Substack ou le symbole du retour en force des newsletters pour la veille »).
On a donc grandement intérêt à aller investiguer dans la direction de newsletters locales même si elles ne sont pas toujours faciles à identifier.
Dans notre récent article « Sourcing : l'info locale se renouvelle », on décrypte pour vous cette tendance des newsletters locales mais aussi les nouvelles formes que peut prendre l’information locale bien loin du schéma traditionnel du titre de presse classique et on vous explique comment réussir à les identifier.
Contrairement à la recherche classique, Google ne propose pas de filtre de date personnalisé pour ses recherches sur Google Images. Nous pouvons entrer l’intervalle de dates de son choix en sélectionnant des « périodes », comme « depuis 24 heures » ou « depuis une semaine », mais impossible de personnaliser (pas même dans l’option « recherche avancée »).
Pour contourner cette restriction par défaut et parvenir à nos fins, nous vous conseillons d’utiliser les opérateurs before:AAAA-MM-DD
et after:AAAA-MM-DD
, à la suite de son mot-clé dans la barre de recherche.
Par exemple en entrant : Netsources after:2022-07-31
dans Google Image, on obtiendra tous les visuels correspondant aux publications de Netsources depuis le 31 juillet 2022.
NB : Merci à @henkvaness pour son partage ! Nous avons simplifié ses opérateurs en supprimant les parenthèses et crochets et cela fonctionne tout aussi bien !
L’innovation et l’actualité chez Google ne s’arrêtent jamais et ces derniers mois ne dérogent pas à la règle.
Dans cet article, nous faisons le point sur ces innovations récentes et nous testons les fonctionnalités et les produits, dans une perspective de veille et de recherche professionnelles.
En septembre dernier, Google a animé son rendez-vous annuel Search-On où il dévoile toutes ses nouveautés en lien avec son moteur et la recherche d’information.
À cette occasion, nous avons découvert de nouvelles fonctionnalités intéressantes.
Les guillemets dans Google ont toujours servi à rechercher des expressions exactes même si cela n’empêche pas Google de passer outre, de temps à autre, quand il le juge nécessaire.
L’usage des guillemets a récemment évolué, mais c’est au niveau des résultats que cela fait une différence. Les guillemets permettent toujours de rechercher une expression exacte, mais dans les résultats proposés, on peut maintenant visualiser un extrait du contenu contenant spécifiquement cette expression, ce qui permet donc de voir dans quel contexte l’expression est utilisée et déterminer la pertinence du résultat par rapport à ses besoins.
Lire aussi :
Nous avons testé Kagi Search, un nouveau challenger de Google
Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info
Il y a peu Google a lancé en grande pompe son nouvel espace dans Google Actualités appelé Google Showcase.
Quelle place et quel intérêt peut-il avoir pour le veilleur ? C’est ce que nous avons exploré dans cet article.
Il s’agit d’un nouveau service destiné à mettre en avant les médias de référence d’un pays. Le service est proposé dans différents pays, mais seuls les médias du pays de l’internaute sont disponibles.
En ce qui nous concerne, Google Showcase dispose d’une page dédiée sur Google Actualités qui affiche une sélection d’articles issus de 130 médias français, essentiellement de la presse nationale et locale appartenant à de grands groupes de presse. Pour chaque média, on dispose de trois articles sélectionnés.
Chaque jour ces 130 médias choisissent quelques articles qu’ils mettent à disposition sur Google News Showcase. En échange, Google les rémunère.
Lire aussi :
Comment récupérer un flux RSS sur les moteurs web et Google Actualités ?
L’IA au cœur du nouveau Google Actualités : à réintégrer absolument dans son dispositif de veille
Sourcing : comment détecter des médias réellement nouveaux ?
Peut-on encore utiliser les kiosques numériques pour la recherche presse ?
Lorsqu’on souhaite mettre en place une veille concurrentielle, une typologie de sources classiques est à surveiller : site du concurrent, presse nationale, locale, spécialisée, etc. La publicité en ligne comme les résultats sponsorisés et annonces publicitaires sur Google et Facebook peut également représenter une piste très intéressante.
Car comprendre la stratégie publicitaire d’un acteur peut en dire long sur sa stratégie globale à court, moyen et long terme. Quels produits ou services choisit-il de mettre en valeur, dans quels pays et quelles régions focalise-t-il ses actions ?
En matière de publicité en ligne, le marché est très largement dominé par Google et Facebook puis dans une moindre mesure Amazon. Ainsi, si nos concurrents ont choisi d’investir dans la publicité en ligne, il y a toutes les chances qu’ils aient choisi Google, Facebook ou bien les deux. Il va donc falloir trouver des solutions pour accéder aux données de Google Ads et de Facebook Ads.
Pendant des années, c’était tout simplement mission impossible, car ni Google ni Facebook ne partageaient librement la moindre donnée en la matière. Une veille sur la publicité en ligne ne pouvait donc se faire qu’en testant des requêtes susceptibles de faire apparaître les publicités de ses concurrents, ce qui ne fournissait que des résultats aléatoires et évidemment incomplets ou en faisant appel à des acteurs spécialisés sur les mesures d’audience et la veille publicitaire.
Lire aussi :
Information et publicité : des liaisons dangereuses pour la veille ?
Il est possible de récupérer des flux RSS sur certains moteurs et leurs verticales. C’est par exemple le cas de Google et de ses moteurs spécialisés comme Google Actualités ou même Google Scholar.
Le moteur Bing permet de récupérer des flux RSS à partir de ses recherches en utilisant l’url suivante : https://www.bing.com/search?q=motcle&format=rss
Google n’offre pas de fonctionnalité équivalente, mais il est possible de créer des alertes sur Google Alertes que l’on pourra récupérer au format RSS.
Il faut cependant avoir conscience que les résultats pourront différer de ce que l’on trouve directement dans le moteur web de Google.
Les autres moteurs ne permettent pas à notre connaissance de récupérer de flux RSS.
Lire aussi :
L’IA au cœur du nouveau Google Actualités : à réintégrer absolument dans son dispositif de veille
Google lance une fonctionnalité "révolutionnaire" pour la veille ... et nous prend pour des pigeon
Google Keen et Google Discover : les nouveaux Google Alertes ?
Quelles alternatives crédibles à Google Actualités en 2020 ? Dossier spécial Agrégateurs de presse
Alors que ces dernières années, l’interface de Google Actualités n’avait pratiquement plus aucun un intérêt pour la veille et la recherche et qu’il valait mieux passer par l’onglet « Actualités » du moteur web de Google, Google Actualités (ou Google News) a récemment introduit des fonctionnalités inédites.
Plusieurs d’entre elles découlent d’une utilisation accrue de l’IA et sont particulièrement prometteuses pour la veille et la recherche d’information, à tel point qu’elles pourraient bien amener le professionnel de l’info à reconsidérer l’interface pour ses recherches, en plus du moteur web classique.
Google Actualités a récemment lancé une nouvelle interface pour Google Actualités. Cette nouvelle version reste dans la droite ligne des dernières évolutions de Google sur l’ensemble de ses produits et Google cherche à collecter le plus d’informations possible sur le profil et les habitudes de ses usagers.
Google précise d’ailleurs sans détour son parti pris concernant sa politique de contenu dans le court disclaimer suivant :
« Ces articles sont classés en fonction de leur qualité, de l’originalité et de l’actualité de leur contenu, de votre activité et de vos achats précédents dans Google Actualités, ainsi que de votre activité dans d’autres produits Google. Google peut avoir un contrat de licence avec certains éditeurs, mais cela n’a aucun impact sur le classement des résultats. »
Comme chaque année, Google organise au mois de mai sa fameuse conférence annuelle appelée Google I/O (pour Input/Output). Deux jours de show à l’américaine avec des annonces de nouveautés de produits et de fonctionnalités.
Nous les avons analysées en détail pour voir comment cela allait faire évoluer la recherche d’information et la veille professionnelle.
Trois grands axes d’innovation ressortent cette année : l’un concernant la vidéo et notamment YouTube, un second l’image et un usage accentué de l’IA et le dernier la traduction appliquée à différents types de contenus.
Lire aussi :
Comment intégrer YouTube dans votre dispositif de veille
La recherche sur Google se meurt, et maintenant ?
Comment s’adapter aux nouveautés et restrictions de la recherche d’image inversée sur le Web ?
Google n’est plus un moteur de recherche ni de réponses, mais un assistant virtuel
Le professionnel de l’info face à un Google en perpétuel mouvement
Comment utiliser Google pour des questions complexes ? Restez simple
Il y a quelques semaines, la publication d’un article intitulé « Google Search is dying » (« La recherche Google se meurt ») suscitait de nombreuses réactions sur le Web et notamment sur les réseaux sociaux et sur les forums.
S’il est intéressant de voir que ce sujet suscite de l’engagement, le constat en lui-même n’est pas fondamentalement nouveau. Cela fait des années que de nombreuses voix s’élèvent pour dénoncer cette dégradation, notamment celles des professionnels en contact direct avec les outils de recherche (professionnels de l’information, du SEO, etc.)
Quoiqu’on en dise, Google Translate est d’une aide précieuse pour les veilles et recherches d’informations à l’international sur des langues que l’on ne maîtrise que très peu ou même pas du tout.
Pour traduire un mot ou une expression, l’utilisation d’un véritable dictionnaire en ligne ou même papier sera généralement plus judicieux.
Pour des longs passages de texte, des articles de presse ou même des pages et sites Web dans leur intégralité, l’outil aura le mérite de faire ressortir le sens général, de pointer vers quelques détails et surtout permettra de déterminer si de plus amples investigations sont nécessaires.
Google est le leader incontesté des moteurs de recherche et on a du mal à voir qui pourrait le détrôner un jour.
Pourtant, régulièrement, on voit surgir de nouvelles initiatives, notamment en France, de moteurs de recherche dits "révolutionnaires" et "innovants".
Ces nouveaux moteurs peuvent-ils avoir un intérêt pour la veille ou la recherche d’information ?
Pour le moment, aucun, malheureusement, n’a réussi à renverser la tendance.
Alors qu’à ses débuts Google était un moteur de recherche qui se limitait exclusivement aux mots-clés entrés par les internautes, la recherche sémantique prend aujourd’hui une part de plus en plus prépondérante dans le fonctionnement de Google.
Ces évolutions représentent un changement important pour tous les professionnels de l’information et de la veille qui n’ont plus nécessairement besoin d’entrer une longue requête avec les différentes formes d’un mot et synonymes puisque le moteur élargit en principe automatiquement la recherche à ses différentes variantes.
Nous avions d’ailleurs eu l’occasion d’aborder en détail cette question dans un article de Bases intitulé : « la mort annoncée de la recherche booléenne » (Bases n°340 – septembre 2016) où l’on découvrait d’ailleurs que les longues requêtes booléennes sur Google pouvaient en réalité avoir l’effet inverse à celui escompté.
La semaine dernière, nous avions consacré un billet à la stratégie de Bing par rapport à Google : « La guerre Bing versus Google : Bing contre-attaque sur de nouveaux terrains » .
Dans cet article nous mentionnions Bing Custom Search, un moteur de recherche personnalisable lancé par Microsoft il y a quelques mois, qui n’est ni plus ni moins qu’un concurrent direct de Google CSE.
Les moteurs personnalisables représentent un intérêt indéniable pour la veille et la recherche d’information. Mais maintenant qu’il existe une alternative a priori crédible à Google CSE, lequel est le plus performant et dans quels cas choisir l’un plutôt que l’autre ? C’est ce que nous avons cherché à savoir cette semaine en comparant les deux services.
Depuis maintenant quelques années, Google propose sur la première page de résultats et, pour certaines requêtes seulement, des featured snippets, appelés en français extraits optimisés même si le terme français est beaucoup moins utilisé.
Affiché dans un cadre spécifique et au-dessus des résultats dits « naturels », en « position 0 », il constitue une réponse à la question posée par l’internaute et est extrait directement d’une page Web.
Ainsi, si vous demandez à Google « qu’est-ce que la veille stratégique ? », un encadré apparaît au dessus des résultats naturels contenant une définition de la veille stratégique issue de la page Wikipédia du même nom. Il n’est ainsi même pas nécessaire de se rendre sur cette page Web pour avoir la réponse à sa question. Du moins, en principe...
Est-ce que ces résultats apporte une réelle valeur ajoutée et un gain de temps pour la recherche d’information ou bien au contraire représentent-ils un pas de plus vers la mort des moteurs de recherche et l’avènement de l’ère de l’assistance ?
A l’origine, les moteurs de recherche comme Google, Bing ou encore Yahoo permettaient de voir s’afficher tous les résultats citant les termes d’une requête, à condition bien sûr que les pages soient bien présentes dans leurs index.
Les moteurs de recherche visaient l’exhaustivité du Web ouvert là où les annuaires opéraient déjà une sélection.
Les moteurs offraient une bonne vision d’ensemble des contenus gratuits présents sur le Web là où les outils de recherche et de veille professionnels tiraient leur épingle du jeu sur les contenus payants ou des fonctionnalités de recherche plus sophistiquées.
Mais aujourd’hui, recourir à Google en pensant pouvoir accéder à la majorité des pages Web et contenus Web gratuits citant les termes de sa requête est un leurre.
En effet, quelle que soit la requête, Google, Bing et les autres n’affichent pas l’intégralité des pages correspondants à la requête. Ils opèrent une sélection des pages présentes dans leurs index.
Et cela a des conséquences importantes pour la veille et la recherche d’information.
Dans notre précédent billet « Google Actualités évolue à son tour : bonne ou mauvaise nouvelle pour la veille ? », nous avions analysé la nouvelle interface de Google Actualités (plus communément appelé Google News) afin de voir ce que cela changeait pour la veille et la recherche d’informations.
Et le constat final n’était malheureusement pas très encourageant...
Nous allons donc aujourd’hui tester l’aspect méthodologie de recherche. Existe t-il une façon réellement efficace de l’interroger ?
Pour rappel, Google Actualités est un moteur, lancé en 2002 mais en 2009 seulement pour la France, qui n’indexe que des contenus provenant de sites de presse, site d’actualités et quelques blogs de référence.
Quel que soit le type de veille ou de recherche d’information, on ne saurait faire l’impasse sur les médias et la presse. La presse généraliste ou spécialisée, les magazines d’informations, la presse locale, professionnelle ou encore les sites d’actualités sont bien souvent une mine d’informations que l’on ne saurait négliger.
Pour interroger et surveiller la presse gratuitement, on dispose depuis 2002 de Google Actualités, un service lancé par Google lui-même, indexant uniquement des sites de presse, sites et blogs d’actualités.
Pour le professionnel, cela offre un accès centralisé à la presse et aux sites d’actualités avec des fonctionnalités de recherche semblables à celles du moteur Web de Google.
Et pour la veille, Google Actualités offrait encore il y a peu la possibilité de générer des flux RSS à partir d’une recherche dans le moteur.
Lire aussi :
Comment bien interroger Google en 2018 ?
Gratuité de l’information pour la veille : la fin d’une époque ?
La veille et la recherche d’information à l’heure de la recommandation de contenus
Depuis plusieurs années déjà, on entend régulièrement parler de la baisse de qualité de Google alertes. Quel est aujourd’hui l’intérêt de ce type d’outil pour la veille ? Google Alertes est-il réellement le meilleur de sa catégorie ? Ou bien faut-il se tourner vers des alternatives comme Talkwalker Alerts par exemple ?
Quand on souhaite mettre en place une veille concurrentielle, stratégique ou encore e-réputation on a le choix entre plusieurs approches.
La première consiste à identifier un certain nombre de sources pertinentes et à les mettre ensuite sous surveillance, via un bookmark ou outil de crawling web.
La seconde consiste à mettre en place des alertes par mots-clés (avec des requêtes plus ou moins complexes) dans différents outils comme les outils d’alertes Web (à l'image de Google Alertes), les plateformes de social media monitoring, les agrégateurs de presse, les bases de données professionnelles, etc. pour surveiller les nouveaux contenus publiés sur le Web ou dans les corpus pré-intégrés dans ces outils.
Ces deux approches sont complémentaires.
Depuis le début de l’année 2018, de nouveaux acteurs sont apparus sur le marché des moteurs de recherche d’articles scientifiques gratuits.
Qui sont-ils ? Comment se différencient-ils de Google Scholar ? Et quelle peut-être leur valeur ajoutée dans un contexte de veille scientifique ou de recherche d’information bibliographique et de revue de littérature ?
C’est à toutes ces questions que nous avons répondues dans le dernier numéro de BASES n°361 : « Recherche d’information académique : enfin une comparaison concrète entre gratuit et payant ». Dans ce post nous vous présentons deux des multiples acteurs analysés dans l'article de BASES.
Lire aussi :
Du nouveau du côté des moteurs académiques
Google Scholar : ami ou ennemi des outils professionnels ?
Retrouver légalement les versions gratuites des articles scientifiques
Depuis plus de 10 ans maintenant, Google a recours à ce qu’il appelle la « recherche personnalisée ».
Concrètement, cela signifie que Google personnalise la liste des résultats naturels de ses utilisateurs en fonction de différents critères : localisation, historique de recherche, historique de navigation ou encore présence et contacts sur les médias sociaux, etc.
Deux personnes effectuant une même requête au même moment n’ont donc pas nécessairement les mêmes résultats.
Et quand on sait que Google n’affiche en réalité pas plus de 200/300 résultats au maximum par requête, même s’il indique à première vue des milliers voire des millions de réponses, on risque vite de passer à côté d’informations et de sources pertinentes...
Lire aussi :
Google évolue, les documentalistes plus utiles que jamais ?
Très récemment, Google annonçait une nouvelle interface pour le moteur de recherche de son app mobile. Si cette refonte est avant tout esthétique, elle rappelle que depuis quelques années Google mise pratiquement tout sur la recherche mobile.
Et il est loin d’être le seul car c’est là que se trouvent aujourd’hui les internautes et le trafic. Les autres géants du Web comme LinkedIn par exemple ne proposent pas exactement les mêmes fonctionnalités dans leur interface mobile et desktop.
Mais ce n’est forcément là que l’on trouve les professionnels de l’information qui réalisent encore l’essentiel de leur travail depuis un ordinateur et utilisent donc les versions desktop des outils et sources d’information.
Depuis quelques mois, Google annonce à tour de bras de nouvelles extensions et fonctionnalités pour Chrome et d’autres de ses produits. Le but affiché est de permettre aux internautes de gagner en productivité sans avoir à sortir de l’univers Google.
Google a récemment annoncé tester sur Chrome Android aux Etats-Unis une nouvelle fonctionnalité « Follow » permettant de suivre les nouveaux contenus publiés sur un site web. Le retour du RSS en quelque sorte, sauf qu’il s’agit ici de recevoir directement les nouveaux contenus dans l’interface de Google Chrome.
Notre avis : Même si cela est indéniablement moins performant que de véritables lecteurs de flux RSS, cette initiative aura peut-être au moins le mérite d’inciter certains éditeurs à réintégrer des flux RSS sur leurs sites. On peut toujours rêver…
A Lire sur Chromium
La publicité ne fait pas naturellement partie du spectre de la recherche d’information et de la veille. Et pourtant, il est souvent intéressant de repérer, suivre et analyser les publicités de certains acteurs et notamment ses concurrents. Aujourd’hui, ce sont Google et Facebook qui monopolisent le marché de la publicité en ligne et c’est donc dans ces deux directions qu’on a intérêt à porter son regard pour faire de la veille publicitaire.
Lire aussi :
Google vient d’annoncer sur son blog qu’il allait déployer dans les prochains mois aux Etats-Unis d’abord puis dans le reste du monde en 2022 des « pages annonceurs » permettant notamment visualiser l’historique des campagnes d’un annonceur sur les 30 derniers jours (publicités vidéos sur YouTube, adwords, annonces Shopping, etc.).
Google vient d’annoncer une nouvelle fonctionnalité, qui à en croire une des personnes en charge du projet aurait pour vocation à devenir « incroyable » (« awesome »).
Comme d’habitude, le « storytelling » est bien rodé avec une première annonce au mois de mai dernier pour annoncer qu’une nouvelle fonctionnalité est en test. L’information est reprise immédiatement par la presse et les sites d’actualités Tech du monde entier.
Et il y a quelques jours, même schéma, on apprenait cette fois-ci qu’elle était désormais disponible sur Android. Il en sera de même dans quelques mois quand la fonctionnalité arrivera sur IOS et desktop…
Google est décidément très fort dans l’art de créer des effets d’annonces. On serait presque tenté de s’acheter un téléphone Android rien que pour avoir accès à cette incroyable fonctionnalité...
Mais au fait, de quoi s’agit-il exactement ?
L’extension, G Map Extractor vous permettra d’extraire les données de vos recherches sur Google Maps sans encombre.
Pour compléter un annuaire de contacts ou construire un listing d’adresses postales, cet outil de scraping est capable, à partir des résultats de recherche sur Google Maps, de générer un fichier CSV téléchargeable comprenant le nom d'un établissement ou d'une société cible, son adresse, le code postal, le téléphone, le site web ainsi que les coordonnées GPS.
Source : Korben.info
Google est depuis 20 ans maintenant un acteur incontournable dans le paysage de l’information et de la veille.
On a beau le détester autant que l’aimer, quand il s’agit de rechercher de l’information, il faut être pragmatique. Et sur ce point, pas de doute, il reste bien meilleur que les autres moteurs Web gratuits pour trouver ce que l’on cherche.
Mais encore faut-il comprendre précisément comment il fonctionne, ses grandes évolutions, ses spécificités actuelles pour réussir à en extraire la substantifique moelle.
C’est ce que nous allons faire ici en emmenant le lecteur derrière la barre de recherche de Google à la rencontre des mécanismes et algorithmes qui le pilotent aujourd’hui. Car ce n’est qu’en comprenant ces aspects techniques que l’on pourra l’utiliser au mieux.
Lire aussi :
Le professionnel de l’info face à un Google en perpétuel mouvement
Comment utiliser Google pour des questions complexes ? Restez simple !
Comment retrouver une ancienne étude interne citée dans la littérature académique ?
Les Knowledge Graphs vont-ils enfin révolutionner la recherche d’information professionnelle ?
Google lance une fonctionnalité "révolutionnaire" pour la veille ... et nous prend pour des pigeons
Moteurs de recherche et innovation : du discours officiel à la réalité du terrain