Google est depuis 20 ans maintenant un acteur incontournable dans le paysage de l’information et de la veille.
On a beau le détester autant que l’aimer, quand il s’agit de rechercher de l’information, il faut être pragmatique. Et sur ce point, pas de doute, il reste bien meilleur que les autres moteurs Web gratuits pour trouver ce que l’on cherche.
Mais encore faut-il comprendre précisément comment il fonctionne, ses grandes évolutions, ses spécificités actuelles pour réussir à en extraire la substantifique moelle.
C’est ce que nous allons faire ici en emmenant le lecteur derrière la barre de recherche de Google à la rencontre des mécanismes et algorithmes qui le pilotent aujourd’hui. Car ce n’est qu’en comprenant ces aspects techniques que l’on pourra l’utiliser au mieux.
Visuellement, Google a finalement assez peu changé avec les années : interface de recherche limitée à son strict minimum, liste de liens bleus même s’ils sont maintenant entourés d’images, vidéos et autres snippets en tous genres.
Mais le « cerveau » Google, lui, a considérablement évolué en une dizaine d’années et est de plus en plus complexe à appréhender en arrière-plan. Le Google d’il y a 10 ans n’a plus rien à voir avec le Google d’aujourd’hui en termes techniques.
Google n’est plus un moteur de recherche, pas plus qu’un moteur de réponses comme il se plaisait à se décrire il y a encore quelques années, mais bel et bien un « assistant virtuel » en devenir.
Le cerveau Google : un index gigantesque et des algorithmes de plus en plus sophistiqués
Derrière la barre de recherche Google, il y a deux éléments principaux : un index gigantesque et des algorithmes qui ont pour rôle de faire le tri dans cette immense masse de données et sélectionner les pages web qui seront visibles pour l’internaute.
Cet assistant évolue en permanence avec l’intégration de nouveaux types de contenus et de nouvelles fonctionnalités de recherche.
Le professionnel de l’information doit évidemment suivre ce rythme effréné, mais il faut aussi évaluer sans cesse la possible adéquation entre ces nouveautés, ces évolutions, ces innovations avec les pratiques professionnelles de recherche d’information.
Et ce n’est pas simple, car Google n’a jamais été conçu pour les professionnels de l’information. Ceux-ci ont néanmoins toujours pu traiter certaines questions avec Google mais la situation empire…
En effet, le professionnel se retrouve dans une situation inconfortable où il a à la fois toujours besoin de Google, car il y trouve des contenus qu’il n’a pratiquement aucune chance de repérer ailleurs (l’inverse est également vrai !) et à la fois, il a de plus en plus de mal à communiquer avec le moteur de manière satisfaisante.
En tant que professionnels de la veille et de la recherche d’information, comment se positionner aujourd’hui par rapport à Google ?
Il indexe des contenus toujours plus diversifiés, mais faut-il réellement l’utiliser pour retrouver n’importe quel type de contenu ?
Il propose sans cesse de nouvelles fonctionnalités, mais ont-elles un quelconque intérêt dans un contexte professionnel ?
Sa transformation en assistant accentue la personnalisation des résultats et surtout leur instabilité. Peut-on continuer à avoir une démarche structurée et reproductible dans un tel contexte ?
Ce n’est pas parce que Google a un index gigantesque qu’il donne accès à tous les contenus qui pourraient être utiles à l’internaute. Au contraire, plus les années passent, moins il y a de résultats pour une question ou une requête donnée.
Google est devenu un assistant de recherche qui fournit sur un plateau une sélection de résultats qu’il juge lui-même pertinents. Et il a une assez haute idée de ses capacités et compétences en la matière. Pour faire simple, il sait tout mieux que vous.
Utiliser Google pour des questions simples, factuelles ou pour retrouver un document précis ne présente généralement pas de difficulté majeure. Mais cela se complexifie quand il s’agit d’utiliser Google pour répondre à des questions complexes.
En effet, malgré sa volonté de réussir à répondre à des questions complexes, Google admet qu’il a encore du mal.
Dans un article de recherche publié en 2021 appelé « Hurdles to Progress in Long-form Question Answering », les chercheurs de Google mettent en évidence la difficulté à répondre à des questions qui nécessitent des réponses longues ou nuancées.
À l’heure actuelle, les auteurs estiment que les moteurs sont bons pour répondre à des questions du type « Factoid Open-domain Question Answering or simply Open-domain Question Answering», c’est-à-dire des questions factuelles courtes.
Mais pour les questions complexes qui nécessitent plus que quelques mots ou lignes de réponses, la route est encore longue. Et les moteurs ont du mal à faire ressortir les pages et sites qui répondent à des questions complexes de ce genre.
Il va donc falloir se mettre à son niveau pour réussir à le conduire dans la bonne direction. Et il n’y a qu’une solution : rester simple !
À partir de notre expérience du moteur, nos tests, nos lectures sur ce qu’est Google au premier plan, mais aussi tout ce qui se cache en arrière-plan, nous proposons ici une méthodologie et des conseils pour nous donner toutes les chances de trouver ce que l’on cherche.
Nous recevons régulièrement des demandes de nos lecteurs cherchant des pistes ou méthodes pour certaines de leurs recherches ou qui souhaitent de plus amples informations sur certains outils de veille.
Ce mois-ci, nous avons choisi la question d’un lecteur à la recherche d’un document ancien, ce qui permet de mettre en œuvre différentes méthodologies en utilisant différents outils de recherche, dont les moteurs généralistes comme Google. Comme toujours avec les documents anciens, il n’y a jamais de garantie de réussite et la recherche de ce type de document relève parfois de la chasse au trésor où il faut faire preuve de créativité. Un bon défi en quelque sorte !
Notre lecteur était à la recherche d’une étude interne menée et publiée en 1990 par le géant de la chimie Dupont, sur l’emploi des personnes handicapées. Il avait trouvé la référence bibliographique d’un article parlant de cette étude sur le site de la British Library, mais n’arrivait pas à obtenir ce document. Il souhaitait donc obtenir ce document et par la suite l’étude elle-même.
Notre point de départ et nos maigres indices tenaient donc dans cette référence bibliographique qui était la suivante :
1990: Equal to the Task II
Drach, R. L. ; Perlman, L. G. ; Hansen, C. E.
Switzer monograph.; Employment and disability: trends and issues for the 1990s; Washington; DC, 1990; May 1990, 74-75 -- Alexandria, Virginia; National Rehabilitation Association; 1990 Part: Part 14; (pages 74-75) -- 1990
Etape 1 : Retrouver l’article « 1990: Equal to the Task II »
La Bristish Library propose un service de fourniture de documents primaires pour les documents présents dans son catalogue. En principe, on devrait pouvoir acheter le document et le recevoir par e-mail ou PDF. Malheureusement, dans notre cas, il est indiqué que le document n’est pas disponible (« Item is not currently available »).