« Ça va trop vite, c’est difficile de trouver les bonnes sources, il y a trop d’outils et il y a trop d’aspects à maîtriser ». C’est avec ces mots que Franck Guigard, conseiller Performance et Management de l’information au sein de la CCI de la Drôme, résume la vague IA qui a déferlé sur sa veille métier.
Avec l’IA, ce sont non seulement des milliers de nouveaux outils à évaluer, trier, tester… mais c’est aussi toute une méthodologie à revoir :
● Faut-il ajouter des sources spécifiques à sa veille métier ?
● Quels sont les nouveaux mots-clés à surveiller ?
● Comment optimiser son temps de lecture ? Avec un résumé ? Sous quel format ?
● Peut-on la partager de façon plus attractive ? Dans une autre langue ? Sous quel format ?
Même si la veille métier est caractérisée par son objectif prospectif, il n’en demeure pas moins que la « vague IA » a pris de court la majorité des professionnels de l’information. Six mois après l’arrivée de ChatGPT dans le monde de l’information, comment les veilleurs surfent-ils sur la vague ?
Pour le savoir, nous avons interrogé plusieurs professionnels qui ont accepté de partager le fruit de leur réflexion.
La veille métier étant souvent peu visible, chronophage (et souvent sur son temps personnel), la première question que l’on pourrait se poser serait : « est-il possible de déléguer l’ensemble de sa veille à une IA ? ».
Pour Emmanuel Barthe, veilleur juridique auprès d’un cabinet d’avocats international et auteur du blog Precisement.org, c’est un questionnement récurrent :
"En tant que documentaliste on y pense à chaque évolution technologique. Comme la veille est une activité récurrente de recherche et de sélection, les chatbots peuvent, en théorie, automatiser cette activité.
Mais il y a deux freins majeurs :
Les chatbots ne peuvent pas donner de tendances fiables. À l’instar de Google Trends, on ne sait pas si les informations sur lesquelles ils se basent sont scientifiquement prouvées, ni s’il s’agit de sources actuelles ou anciennes, ni même si cela correspond précisément à nos mots-clés ;
Les IA dépendent de fonds pour s’entraîner, et pour l’instant la presse française refuse soit de leur fournir tout court, soit de les leur fournir sans rémunération."
« J’ai deux projets sur lesquels m’interroger pour la rentrée, l’IA et le Knowledge Management, déclare Franck Guigard en nous montrant le fameux livre de Tiago Forte « Construire un second cerveau », sa lecture estivale. Mais les mettre en application demain, pas encore. »
Pour Franck Guigard comme pour Stéphanie Barthélémi, consultante indépendante et enseignante en veille, l’heure est à la « veille passive » (sans but précis), comme l’explique Stéphanie. Et en cas de question supplémentaire, ils étendent simplement leurs recherches ponctuelles.
Si Franck s’est inscrit aux newsletters « Les outils IA » de Matthieu Cortesy (consultant et formateur en stratégie digitale) et de Fidel Navamuel (connu pour sa newsletter Outils TICE), Stéphanie suit le compte X (ex-Twitter) de Yann Le Cun (@ylecun), professeur-chercheur en IA à la NYU et Chief IA Scientist chez Meta, le compte LinkedIn de Sylvain Peyronnet, expert IA et SEO et enfin le flux RSS de l’INRIA.
Et tous les deux ont prévu de suivre très vite une ou plusieurs formations, au regard de la densité de l’information à digérer. Leur veille n’est ainsi pas trop surchargée et reste sous contrôle, avec un flux « digeste », d’autant que le temps alloué à cette activité s’exerce souvent en plus de sa propre charge de travail.
Pour ajouter de nouveaux médias via les flux RSS on pensera à suivre des flux :
Surtout utile en phase de mise en place, la recherche de mots-clés n’est pas le plus courant pour une veille métier. Pourtant, c’est là que l’IA semble la plus efficace de façon fiable.
Pour Stéphanie Barthélémi, « les générateurs de texte sont intéressants pour identifier des mots-clés. Quand j’essaie de m’approprier un domaine, avec des ingénieurs par exemple, cela m’aide à construire des cocons sémantiques, auxquels même les ingénieurs n’auraient pas pensé ! Mais il y a tellement de choses à faire qu’il faudrait y être à 100 % ».
Son truc pour améliorer sa veille en la matière ? Explorer l’impact de l’IA dans le SEO afin de « bien comprendre et analyser les contenus des concurrents pour trouver leurs forces et leurs faiblesses ». Un choix d’autant plus pertinent que le marketing constitue le secteur pour lequel ChatGPT a été créé.
Même écho chez Emmanuel Barthe « Ma conclusion est que c’est efficace en phase de recherche pour penser les mots-clés à votre place, mais que c’est surtout pour la synthèse qu’il sera utilisé. Mais pour le faire de façon fiable à 100 %, ce n’est pas encore gagné ! ». D’abord bluffé, il s’est vite rendu compte que les résumés par IA ne dispensent pas de lire pour se faire sa propre idée.
Les fonctionnalités de résumé et de synthèse semblent en revanche les plus utiles.
Parmi les outils qui permettent de raccourcir le temps de lecture, les outils de résumés, attendus des professionnels de l’information, figurent en tête des fonctionnalités insérées à l’unanimité par la nouvelle génération de lecteurs de flux. Accessibles en un clic dans tous ces lecteurs d’actualité boostés à l’IA, ils restent pourtant absents des agrégateurs de flux traditionnels. Peut-être à cause de leur manque de fiabilité ? En attendant, cela ne justifie donc pas encore de changer son lecteur de flux !
Voir notre article « Lecteurs RSS : vers un nouveau souffle ? » - BASES n° 415 - juin 2023
Pour Stéphanie, « le jour où l’on aura des informations issues de sources fiables et non issues d’articles de désinformation ou inventées, je commencerai à m’intéresser à l’extraction et à l’analyse. Sinon on doit refaire le travail de recouper les infos et ça nous prend trop de temps. »
D’abord tenté, Franck Guigard s’interroge d’ailleurs aujourd’hui : « Je recommande cette fonctionnalité IA à mes étudiants pour les articles longs, mais je leur demande de bien vérifier ». Il y voit donc une fonctionnalité gratuite utile à condition de maîtriser son contenu.
Même réaction du côté d’Emmanuel Barthe : « Le chapeau des articles me suffit actuellement. De plus, la veille juridique est particulière : dans le cadre d’une information concernant les impôts, cela nous intéresse de connaître le plafond. Dans l’exemple d’une amende, ce qui nous intéresse, c’est le montant. Et cela, l’IA ne nous le donnera pas forcément dans un résumé !
Et de développer : si vous prenez un article d’analyse et que des points clés - comme parfois dans la presse économique - ne sont pas signalés comme tels, le résumé d’un LLM peut passer à côté des inflexions. »
Plus que le résumé des articles, ce qui intéresse Emmanuel Barthe, c’est la synthèse de l’ensemble des articles de la veille et la possibilité d’éditorialiser sa veille avec toutes les informations clés.
Mais là encore, l’IA n’est pas suffisamment fiable pour justifier de l’utilisation d’un nouvel outil :
« L’IA générative a une logique probabiliste, ce qui veut dire que le divergent, comme la presse indépendante (Le Canard Enchaîné, la lettre A, Mediapart, Street Press, etc.), minoritaire, ne va pas être pris en compte si on ne lui demande pas expressément de le lire ».
Pour Emmanuel Barthe, il y a deux types de médias :
« J’ai fait nombre de recherches et ma conclusion, c’est que le dispositif gratuit tel qu’il nous est servi aujourd’hui est inefficace. Il faut une IA entraînée par des spécialistes, sur un contenu restreint de qualité pour voir tomber les hallucinations à 0,01 %. Sinon c’est un robinet d’eau tiède ».
Il note ainsi que même avec l’API de GPT4, il reste nécessaire d’avoir recours à des développeurs experts, à même d’augmenter le pourcentage de probabilité d’un LLM tout en vérifiant la pertinence du contenu. « En France ils doivent être deux ou trois pour le juridique, c’est une réelle barrière au développement d’outils pertinents dans le temps, explique-t-il. Enfin, dans beaucoup de domaines, il n’est pas question d’intégrer un texte spécifique à un client dans un outil IA pour des raisons de confidentialité. »
Loin de l’excitation de la nouveauté, Franck Guigard reste également circonspect devant la « magie » vendue par les outils IA
« j’ai bien peur qu’il ne s’agisse surtout d’outils instables, car tout le monde en sort en ce moment. Mettre en place une méthodologie, tester et choisir des outils qui dans trois mois n’existeront plus : non merci ! ». Et d’observer : « on a déjà connu cela avec la fin de Google Reader, qui avait donné naissance à de nombreux lecteurs de flux. Puis le marché s’est stabilisé ».
Il faut dire qu’avec des dizaines de milliers « d’outils IA » sortis du bois en quelques mois, c’est difficile à suivre. Pour surveiller les sorties de nouveaux outils, Franck Guigard utilise le portail There’s an AI for that (« Il y a une IA pour ça »), qui lui permet d’un côté d’évaluer l’apport actuel ou à venir en termes de productivité pour les entrepreneurs, et de l’autre de faire réfléchir ses étudiants. Ce qui, indirectement, infuse également sa veille métier.
Une autre réserve, citée par Franck Guigard, est la consommation de ressources. À l’heure de la sobriété numérique, l’heure n’est plus à la course. On se souvient de la publication en 2019 d’un article choc par des chercheurs de l’université du Massachusetts, estimant un coût en CO₂ de l’entraînement d’une IA pendant quelques jours équivalent au cycle de vie complet de 5 voitures. Aujourd’hui, une autre étude de Berkeley et Google divise ce chiffre par 88, soit l’équivalent d’un vol aller-retour entre San Francisco et New York (https://ieeexplore.ieee.org/document/9810097). Difficile d’y voir clair en réalité, mais la bonne nouvelle serait que la communauté s’est emparée du sujet.
Reste enfin la question du coût « car ce que les éditeurs juridiques font comprendre, c’est que toutes ces fonctionnalités supplémentaires se paient », précise Emmanuel Barthe.
Même si l’heure est encore à l’observation officiellement, cela n’empêche pas les professionnels d’entrer en phase de tests, officiellement ou non, pour mieux évaluer leur future intégration.
Pour Emmanuel Barthe, l’IA aurait plutôt un avenir dans l’automatisation des requêtes à l’origine des veilles et la rédaction de synthèses, et le changement viendra des agrégateurs de presse « quand ils nous proposeront d’aller dans notre sélection pour déterminer les mots-clés qui correspondent à nos centres d’intérêt, et peut-être même formuleront la requête correspondante. Même si pour l’heure, je n’ai pas entendu que l’un d’eux allait le proposer. En revanche, aux États-Unis, il existe déjà un outil, par exemple au sein de la branche juridique de Lexis Nexis. Les bases de presse, elles, n’ont pour le moment pas les moyens. »
En revanche, il est catégorique : ce type d’IA ne pourra pas être utilisé dans la détection de tendances ni dans la configuration d’un outil de veille (à qui s’adresse ma veille, selon quelle périodicité, etc.).
Déjà abonné ? Connectez-vous...