À l’aube d’une nouvelle ère de l’information bouleversée par l’intelligence artificielle, Véronique Mesguich nous offre une troisième édition actualisée et enrichie de son ouvrage « Rechercher l’information stratégique sur le web - Sourcing, veille et analyse à l’heure de l’IA », publié chez De Boeck Supérieur.
Cette troisième édition à jour explore l’univers des IA génératives et leur impact sur la recherche d’informations et la veille. On y découvre (après une préface d’Anne Marie Libmann), comment les IA transforment les pratiques de la recherche web, ainsi que des exemples concrets d’utilisation de l’IA pour l’extraction et l’analyse d’informations stratégiques.
L’ouvrage aborde également d’autres méthodes de recherche et de veille, basées sur la maitrise des sources et l’OSINT.
Anne-Marie Libmann : Est-ce que l’introduction des IA génératives dans cette nouvelle édition marque une véritable évolution par rapport à vos précédents ouvrages sur la veille stratégique ? Comment la décrivez-vous ?
Véronique Mesguich : Les grandes mutations arrivent souvent de façon inattendue… C’est le cas des IA génératives illustrées par le succès fulgurant de ChatGPT. Certes, les technologies mises en œuvre ne sont pas si récentes. Les premières IA basées sur les Transformers (cette technologie représentée par le T de GPT et du modèle de langage BERT de Google) sont ainsi apparues il y a plus de cinq ans. Mais le coup de génie d’OpenAI, c’est d’avoir rendu ces modèles de langage très largement accessibles via le principe des robots conversationnels.
Les IA génératives sont ainsi en train de bouleverser nos usages numériques, dans la sphère professionnelle comme dans notre vie quotidienne. Ces IA apportent une véritable disruption que j’explicite dans plusieurs chapitres du livre ; car on peut les appliquer aux différentes phases du processus de veille ou de recherche approfondie.
Les IAG peuvent interpréter (à défaut de comprendre réellement) des requêtes en langage naturel, en toutes langues, générer des réponses plausibles sous forme de texte rédigé et synthétiser en temps réel des réponses provenant de diverses sources. ChatGPT et ses concurrents n’ont pas été conçus comme des outils de recherche d’information, mais peuvent être mis en relation avec des moteurs de recherche ou des bases de connaissance, et jouer le rôle d’assistants personnalisés.
Là encore, l’idée n’est pas si nouvelle : cela fait plusieurs années que les moteurs de recherche (à commencer par Google) ont l’ambition de fournir aux utilisateurs « la » réponse à leurs questions (et non plus seulement des liens vers des réponses censées être pertinentes). Cela est rendu possible par plusieurs évolutions technologiques de ces dernières années : l’essor de l’apprentissage profond (deep learning), l’explosion du volume des données numériques, qui ont pu constituer une matière première pour l’apprentissage, et l’augmentation fulgurante de la puissance de calcul grâce aux processeurs graphiques. Sans oublier, bien sûr, le développement de modèles de langage et d’algorithmes très puissants.
Mais comme souvent, une nouvelle vague ne remplace pas ce qui existait avant : dans cette nouvelle édition, j’évoque largement l’impact des IA génératives sur la recherche et l’analyse de l’information stratégique, mais je détaille également des méthodes, des outils et des sources « classiques » qui demeurent incontournables ! Et j’ai ajouté dans cette troisième édition des nouvelles méthodes et outils d’investigation OSINT.
AML : Quel avenir pour Google, dont la situation semble inquiétante face aux IAG qui bouleversent son business model basé sur la monétisation des contenus référencés ? Comment imaginer l’avenir des moteurs de recherche et des sites en général ?
VM : Je ne me fais pas trop de souci pour la marque Google, même si on n’utilise désormais certainement plus le moteur comme on le fait depuis des années. Avec ses modèles de langage Gemini et Gemma, Google est en train de rattraper son retard par rapport à OpenAI. Des annonces ont été faites récemment concernant la généralisation d’ici la fin de l’année des « AI Overviews » (connus auparavant sous le nom de SGE), sous la forme d’une interface qui fournira des synthèses de réponses directement sur la page des résultats de recherche. Ce qui aura un impact considérable sur l’audience des sites, surtout dans certains domaines.
Pour autant, les débuts ne sont pas faciles : le lancement des AI Overviews a suscité récemment de nombreuses critiques des utilisateurs mécontents de réponses inexactes.
De façon plus générale, il est certain que les IA génératives vont avoir un impact sur l’évolution des interfaces utilisateurs. Par exemple, la navigation classique pourrait être remplacée par des assistants virtuels destinés à générer des réponses ou accomplir des tâches. Le SEO classique sera également impacté : il ne suffira plus de produire du contenu pour correspondre aux algorithmes de classement, mais de faire en sorte que ses contenus soient visibles dans les réponses générées par l’IA.
Ce qui est à craindre à mon sens, c’est la prolifération de contenus sans intérêt, très standardisés (sans parler bien sûr des contenus contrefaits et faux) générés par des IA. On le constate déjà sur le web, les réseaux sociaux… et jusqu’à la production d’articles académiques.
AML : Que penser des récents développements et partenariats entre les éditeurs de contenus et les acteurs de l’IA ?
VM : Les partenariats vont se multiplier… Le partenariat entre Le Monde et OpenAI, en mars dernier, a suscité de nombreuses questions, parmi les journalistes et aussi de la part d’autres médias. Bien sûr, il y a des enjeux financiers importants… et de nombreuses négociations sont en cours actuellement entre des éditeurs de contenus et les acteurs de l’IA, dans le domaine de la presse, mais aussi du droit et d’autres contenus spécialisés.
Il est important que les IA soient entraînées avec des contenus de qualité, et qu’il y ait davantage de transparence dans les sources utilisées, mais quel sera le bénéfice pour les utilisateurs ? Et quel modèle économique ? On risque là encore de se retrouver face à un éparpillement des accès aux contenus.
AML : Avec l’intégration rapide des IA génératives dans les pratiques professionnelles, comment les personnes que vous formez vivent-elles cette transition ? et comment analysez-vous les défis pour les professionnels de l’information ?
Déjà abonné ? Connectez-vous...