Lors de sa veille, il n’est pas rare d’identifier ou de collecter des contenus dans des langues que l’on ne maîtrise pas ou pas parfaitement. Mais ce n’est pas parce qu’on est en mesure de trouver les bons mots-clés dans une langue qui n’est pas la sienne que l'on est capable de comprendre et d' analyser des textes. Et c’est là que la traduction automatique vient jouer un rôle crucial.
La traduction automatique avait fait un bond en avant il y a quelques années avec l’introduction de l’IA et du NLP (natural language processing en anglais, ou traitement du langage naturel en français) dans les outils de traduction tels que Google Translate ou DeepL. La qualité des traductions s’en était alors retrouvée clairement améliorée. Aujourd’hui, c’est l’arrivée de ChatGPT et plus largement des IA conversationnelles qui vient changer la donne et le paysage de la traduction automatique.
Pour cet article, nous avons testé les capacités de ChatGPT et de ses acolytes, à l'instar de Perplexity, par rapport aux outils de traduction plus traditionnels comme Google Translate ou DeepL dans un contexte de veille afin de déterminer quelle était la meilleure méthode pour traduire les informations issues de la veille.
Lire aussi :
Les plateformes de veille internationales peuvent-elles intéresser les veilleurs francophones ?
Les outils professionnels suffisent-ils pour s’aventurer en territoire inconnu ?
La question du multilinguisme intervient également dans la phase de diffusion de la veille quand il s’agit de produire des contenus dans différentes langues : soit en dupliquant les livrables dans différentes langues pour satisfaire les besoins des collaborateurs basés dans différents pays soit pour produire des livrables dans une langue unique que tous les collaborateurs comprennent, dans la majorité des cas l’anglais.
Mais rares sont les veilleurs et professionnels de l’information maîtrisant à la perfection de multiples langues. Et quant à l’anglais, même si nombreux sont ceux qui en ont une maîtrise professionnelle ou avancée, il n’en reste pas moins que produire des contenus dans une langue qui n’est pas sa langue natale prend nécessairement plus de temps et de réflexion.
Comment produire des livrables multilingues et gagner du temps tout en produisant des contenus en « bon anglais » ? C’est ce que nous avons exploré dans cet article.
Cette nouvelle rubrique « FICHE DE SYNTHSE» se propose d’aider à comprendre en un clin d’œil les informations clés de chaque numéro de NETSOURCES. La datavisualisation faisant l’objet d’un numéro double, vous trouverez ici un rappel du précédent numéro. Cette rubrique sera également déclinée en version pédagogique « pas à pas » et commentée dans nos fiches pédagogiques « Les essentiels de la veille». Bonne lecture !
Avec l’internationalisation de la vie économique et institutionnelle, le professionnel de la veille doit gérer de plus en plus de langues, du sourcing jusqu'à la production du livrable.
Quelles particularités le multilinguisme ajoute-t-il aux méthodes classiques de veille et que proposent les plateformes de veille et les outils de traduction en ligne ?
LinkedIn, c’est un peu le miroir aux alouettes pour le professionnel de la veille. Une vitrine toujours tentante tant ses potentialités sont nombreuses, mais d’autant plus décevante, tant son système reste fermé.
Depuis les déboires de Twitter, l’actualité nous le rappelle aujourd’hui plus que jamais. Alors que d’après le dernier rapport du Reuters Institute, les leaders de l’information songent à LinkedIn comme alternative à Twitter. La newsletter Mediarama nous en rappelle les atouts, notamment en termes de sourcing : une base d’utilisateurs actifs presque aussi importante que celle de Twitter, et de meilleure qualité.
Un optimisme cependant modéré par Siècle Digital qui rappelle les limites du genre avec un média social où chacun est surtout là pour diffuser son #autopromo.
Lire aussi nos articles :
Comment enrichir son sourcing grâce à Google Sheets, Airtable & les autres ?
Le veilleur peut-il tirer parti des veilles gratuites qui fleurissent sur LinkedIn ?
Réussir à utiliser LinkedIn pour la veille et la recherche d’information
Veille commerciale sur LinkedIn, tirer parti des filtres pour trouver des prospects
Nous avons déjà, à de multiples reprises, parlé des documents scientifiques d’origine chinoise référencés dans les banques de données et les serveurs d’origine chinoise ou occidentale.
Dès 2006, nous avions évoqué cette question notamment dans un article consacré au marché chinois de l’information à partir d’une conférence donnée au Salon Online de Londres (demander le BASES n°233 - décembre 2006 à Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.).
Depuis, les initiatives chinoises se sont multipliées et l’offre et l’accessibilité se sont élargies de plusieurs façons :
Lire aussi :
Retour de l’indexation de la littérature chinoise dans Chemical Abstracts
DBpia une base de données académique coréenne
Brevets et littérature scientifique: l'irrésistible développement de la Chine
Dans le cadre d’une recherche d’informations, le premier réflexe pour identifier des sources est généralement de cibler des médias, des experts, voire des annuaires. Mais il existe une autre ressource utile pour fournir de l’information et à laquelle on pense moins : les listes de sources disponibles sur des tableurs en ligne comme Google Sheets ou Airtable et qui se multiplient.
La volonté de partager des listes de sources sur le Web a toujours existé, surtout avec l’avènement du Web 2.0. Mais le format ainsi que les outils de partage et d’hébergement de ces listes ont évolué. Il y a eu le temps des annuaires (qui sont finalement des sortes de listes), le temps des blogrolls sur les blogs, des outils de bookmarking, des FollowFriday et des listes sur Twitter, etc.
Aujourd’hui, outre Google Sheets, de nouveaux outils de création de bases de données ‘no-code’ et de tableurs en ligne ont vu le jour, dont le plus connu est Airtable (https://airtable.com/). Ces tableurs sont souvent partagés publiquement par des experts, consultants ou autres acteurs d’un secteur particulier, qui disposent en échange de la gratuité du service.
Ces listes plus ou moins exhaustives peuvent se révéler précieuses, car elles constituent un pré-tri de l’information opéré par une personne suffisamment intéressée et experte pour entreprendre ce travail de recherche et de structuration. Elles permettent donc d’aller au-delà pour dénicher des sources utiles, voire des pépites, ou même des idées de structuration de l’information.
Recherche législative française et européenne facilitée, augmentation de la visibilité des questions citoyennes…
Le début d’année 2023 a été riche pour l’information institutionnelle. Or, le suivi et l’analyse de l’activité des institutions publiques et de leurs représentants permettent d’anticiper l’évolution d’un cadre réglementaire et d’y déceler des opportunités. Mais, doté d’un jargon et d’un circuit de l’information propres, ce type de sources reste parfois difficile d’accès. Zoom sur les nouveautés à retenir et les nouveaux outils à découvrir !
Après les agrégateurs de sources ouvertes Pappers Entreprise, puis Pappers Justice, Pappers Politique met en avant l’information institutionnelle française et européenne, de l’élaboration à la promulgation d’une loi.
Voir notre article Une nouvelle fonctionnalité pour Pappers, BASES n° 409, décembre 2022
Lire aussi :
Bercy crée son propre annuaire des entreprises
Une nouvelle fonctionnalité pour Pappers
Sélection des sources d’information institutionnelles (françaises et internationales)
L’actualité politique est un jeu de ping-pong. Elle est faite de prises de position, et en retrouver l’origine permet de couvrir ses rebonds avec précision et fiabilité. Mais qu’il s’agisse de débats, d’interviews ou de discours, la surveillance et la vérification des interventions publiques constituent une vraie difficulté technique pour les professionnels de l’information.
Premièrement, car ce type de contenu est en grande partie diffusé dans un format audiovisuel, alors que les méthodes et les outils des professionnels de la veille reposent surtout sur du texte. Et même quand ces discours, interviews et citations existent au format textuel (dans des articles de presse par exemple), ils restent très difficiles à identifier et il est nécessaire d’avoir recours à des requêtes longues et complexes pour explorer tout le champ lexical de la prise de parole. Pour savoir comment rechercher des déclarations au format textuel, on pourra se référer à l’article « Retrouver les déclarations d’une personnalité : sources et méthodes » BASES n° 341 - Octobre 2016 qui reste encore d’actualité pour ce qui est des méthodes proposées.
Deuxièmement, parce que ces sources audiovisuelles restent difficiles à intégrer dans un livrable de veille. Cette étape peut alors nécessiter une écoute longue et minutieuse, une transcription parfois coûteuse, quand il ne s’agit pas de faire soi-même un montage pour en supprimer des extraits… Et tout cela, pour en tirer une ou deux lignes de citations pertinentes, généralement, donc… au format écrit.
Retrouver des discours et déclarations de personnalités publiques issues de sources audiovisuelles représente donc un double défi !
Lire aussi :
Retrouver les déclarations d’une personnalité : sources et méthodes
La Rédaction Bases et Netsources sera présente au salon Iexpo, Porte de Versailles, du 21 au 23 mars prochain. À cette occasion, Anne-Marie Libmann, directrice opérationnelle de notre société sœur FLA Consultants, animera la conférence intitulée : "OSINT, IA, ChatGPT … : une révolution pour la recherche d'information ?", qui se tiendra le 23 mars de 09h45 à 10h30 dans la salle ROUSSEAU.
Pour cette conférence, nous aurons le plaisir d'accueillir des intervenants de renom, tels que Guillaume SYLVESTRE, Directeur innovation numérique, ADIT - AGENCE POUR LA DIFFUSION DE L INFORMATION TECHNOLOGIQUE, David FAYON, Responsable Ecosystème Innovation | La Transformation digitale pour tous ! & Pro en réseaux sociaux, LA POSTE, Christophe CRUZ, Professeur des Universités, UNIVERSITE DE BOURGOGNE, Christophe DESCHAMPS, Consultant, Formateur, Chargé de cours, et Philippe BRUN, Président du Groupe, FIRST ECO.
Au cours de cette conférence, nous aborderons les différentes avancées technologiques qui révolutionnent la recherche d'information, telles que l'OSINT, l'IA ou encore le ChatGPT. Nous explorerons également l'impact de ces innovations sur la veille stratégique et la gestion de l'information.
Ne manquez pas cet événement et inscrivez-vous pour cette conférence passionnante le 23 mars à 9h45, c'est gratuit.
Après quelques semaines d’incertitude, la décision est désormais actée : L’API de base de Twitter ne sera plus gratuite.
Si cette décision n’impacte pas directement la majorité des professionnels de la veille – peu de professionnels avaient besoin d’un accès direct à l’API dans l’exercice de leur métier, les conséquences sont en réalité beaucoup plus nombreuses qu’on ne l’imagine.
En effet, de nombreux outils gratuits, freemiums ou même payants utiles à la pratique de la veille utilisaient cette API gratuite pour récupérer les données de Twitter.
La fin de l’API gratuite présente donc un risque pour la survie de certains outils, fait planer le doute sur la disparition de certaines fonctionnalités sans compter les probables augmentations de tarifs pour pallier l’explosion des frais lié au passage à une API payante.
Pour mieux comprendre ce qui pourra nous attendre, petit tour d’horizon des annonces et silences des éditeurs d’outils utiles à la veille !