La société allemande DEEPL, un des acteurs majeurs de la traduction automatique, annonce qu’il va surpasser ses concurrents que sont Google Translate et ChatGPT.
Cela devrait se faire grâce à son dernier modèle de langage LLM.
En effet, ce nouvel LLM ne s’appuie pas, pour s’entrainer, sur des données d’Internet en général, mais sur son propre jeu de données propriétaires sélectionnées et adaptées à la création de contenu et à la traduction linguistique.
Il prétend donc qu’il sera meilleur que Google Translate qui rencontre des problèmes de traduction littérale ou incorrecte.
Quant à ChatGPT, son offre de traduction automatique serait secondaire par rapport à l’ensemble de son offre alors que "DeepL est très spécialisé, ce qui est particulièrement utile dans des domaines exigeant une haute précision ». Bref, il sera meilleur là aussi.
Ces améliorations devraient faire gagner en temps et en efficacité, car il y aura moins de temps consacré à la vérification et à la correction.
Loin de vouloir concurrencer les traducteurs professionnels il se positionne comme leur « allié indispensable », une affirmation qui peut laisser songeur...
Google intensifie sa politique de diversité linguistique en annonçant l'ajout de huit nouvelles langues aux options de traduction de ses résultats de recherche, portant le total à 21. Parmi les langues ajoutées figurent l'arabe, le gujarati (une langue indienne), le coréen, le persan, le thaï, l'ourdou (parlé en Inde et au Pakistan), et le vietnamien.
Par ailleurs, Google Translate s'enrichit considérablement avec l'introduction de 110 nouvelles langues, y compris des langues régionales de France telles que le breton et l'occitan.
Les langues africaines sont également mises à l'honneur, un quart des nouvelles langues étant parlées sur le continent africain, comme le wolof, le fon, le kikongo.
Par ailleurs, on notera le tibétain et le cantonais, principal dialecte chinois depuis longtemps réclamé. Ces ajouts permettent à Google Translate de toucher plus de 614 millions de personnes supplémentaires.
Cette initiative s'inscrit dans le cadre du projet ambitieux lancé en 2022 visant à traduire les 1 000 langues les plus parlées à travers le monde.
En outre, Google améliore la reconnaissance vocale en apprenant à comprendre une multitude d'accents issus de diverses langues, renforçant ainsi son accessibilité et sa pertinence à l'échelle mondiale.
Nous signalons ici un post très intéressant sur le site de CLARIVATE : “'Sleeping beauties’: Yesterday’s findings fuel today’s research breakthroughs”
Valentin Bogorov, l’auteur, explique en se basant sur de nombreux exemples que l’art antérieur récent ou les connaissances les plus récentes ne sont pas nécessairement les plus intéressantes à prendre en compte dans la recherche.
Les exemples qu’il cite proviennent de domaines très différents. Il illustre son propos avec l’évolution des citations d’un article publié en 1948 intitulé “An Approach Toward a Rational Classification of Climate” écrit par Charles W. Thornthwaite, un éminent géographe et climatologue américain qui a peu retenu l’attention jusqu’à l’année 2 000. À aujourd’hui, il a été cité plus de 5 900 fois par des chercheurs de 143 pays, sachant que plus de 90 % des citations sont postérieures à l’an 2000.
CLARIVATE est l’éditeur du Journal Citation Reports. Il produit le facteur d’impact (Impact Factor) qui est calculé par une formule qui prend en compte le nombre de citations des articles d’une publication.
Bien qu’il soit controversé, le facteur d’impact est l’indicateur de la notoriété d’une publication le plus utilisé actuellement. Il contribue, en particulier, à évaluer la qualité du travail des chercheurs.
Pour l’édition 2024, 17 publications ont perdu leur facteur d’impact à cause d’une suspicion de manipulation des citations. Il leur est reproché, en particulier, d’avoir abusé des autocitations.
Grâce à La licence Creative Commons CCBY 4.0, l’OCDE adopte un modèle libre d’accès. Le site offre un catalogue de près de 30 000 éléments consultables, téléchargeables et partageables.
Notre article sur SCOPUS AI paru dans le numéro 425 (Mai 2024) de BASES a été publié en anglais parmi les « featured articles » sur la plateforme de l’éditeur américain Information TODAY.
Cette solution d’IA générative permet d’interagir avec la base de données juridique de LexisNexis et ses contenus exclusifs. Elle fournit des liens directs vers les sources citées dans les réponses, permettant ainsi de réduire le risque de sources inventées.
Cela ne concerne cependant pas tous les articles, sans que l’on sache quel est le critère.
Rand Fishkin est cofondateur et CEO de SparkTORO qui propose des logiciels dans le domaine de l’analyse des audiences.
Il vient de publier un article faisant apparaître qu’environ 37% des recherches menées sur Google ne sont suivies d’aucun clic, ce résultat étant valable aussi bien aux Etats-Unis qu'en Europe.
Nouvelle étape pour la longue vie de la banque de données Delphes qui était commercialisée ces dernières années par IndexPresse.
Businesscoot, spécialiste français des études sectorielles rachète Indexpresse. Cela conduira à l’offre SectorGPT qui grâce aux informations des études ajoutées à celles de la banque de données Delphes proposera des recherches sectorielles en utilisant l’IA.
Les réponses sont annoncées comme fiables et traçables.
L'IA générative est un facteur potentiel de redéfinition du paysage médiatique, transformant en profondeur la manière dont les contenus sont créés et distribués. Elle menace ainsi les modèles économiques traditionnels qui reposent fortement sur les droits d'auteur pour générer des revenus.
Lire aussi : Le droit d’auteur face à l’IA générative : Interview de Philippe Masseron (gf2i) sur les enjeux juridiques et économiques des métiers de l’information et de la donnée.
Comme nous l’avons décrit dans notre récent article de BASES : « ResearchGate développe ses liens avec les éditeurs », ce réseau social continue à développer son activité d’agrégateur.
Il a ainsi chargé récemment :
Nous en parlerons plus en détail dans notre prochain numéro de BASES de juillet août 2024.
Le gf2i a élu un nouveau bureau dirigé par Thomas Parisot, avec un conseil d'administration élargi, afin de relever les défis liés à l'accélération technologique et faire de la transition numérique un levier de valeur pour l'économie et la société.
À partir du 30 juin 2024, l'ancienne version de la plateforme Tagaday ne sera plus accessible. L'ensemble des comptes sera opérationnel sur la nouvelle plateforme, plus moderne et intuitive, offrant des fonctionnalités innovantes pour faciliter le suivi des retombées médias.
Dans ce numéro, nous continuons à explorer les défis que représentent pour les professionnels de l’information l’entrée dans l’ère de l’intelligence artificielle, tout en examinant les nouvelles méthodologies, les retours d’expérience et les tendances actuelles qui façonnent nos métiers.
L’émergence des IA génératives, illustrée par le succès fulgurant de ChatGPT, marque un tournant dans nos pratiques. Véronique Mesguich, dans la nouvelle édition de son ouvrage «Rechercher l’information stratégique sur le web», introduit l’impact des IA génératives sur la veille stratégique et la recherche d’information. Si ces outils offrent de nouvelles perspectives d’analyse et de traitement des données, ils nécessitent une approche critique pour éviter les écueils d’informations inexactes ou biaisées.
Le passage d’une «culture de stock» à une «culture de flux» reste un défi majeur, comme le souligne notre article « Adopter une logique de flux... plus facile à dire qu’à faire ». Cette transition n’est pas simplement une tendance, mais une nécessité pour rester pertinents et efficaces. Il s’agit de transformer notre rapport à l’information, en favorisant la capture et l’exploitation en temps réel des données plutôt que leur simple accumulation.
Dans «Bonnes pratiques pour systématiser la surveillance de vos concurrents», nous découvrons des méthodes structurées pour maintenir une veille efficace sans être submergés par l’information. La clé réside dans la sélection rigoureuse des sources et l’automatisation des processus, permettant de se concentrer sur l’analyse et la prise de décision.
L’article «Le jour où j’ai voulu mettre en place une veille collaborative» offre un retour d’expérience précieux sur les défis et les succès de la veille mutualisée. Cette aventure, menée au sein d’une PME, démontre que la mutualisation des efforts peut transformer les pratiques individuelles en intelligence collective, malgré des obstacles organisationnels et humains à ne pas sous-estimer.
Rester agile et professionnel, ce sont deux des nombreux mots clefs qui résument les défis actuels de nos métiers. Face aux transformations, nous sommes invités à nous adapter constamment, à nous former sans relâche et à réinventer sans cesse nos rôles et pratiques au sein des organisations.
La Fondation Bill et Melinda Gates créée en janvier 2 000 s’est donné pour mission d’améliorer les conditions de vie des populations défavorisées à travers le monde, en se concentrant initialement sur la santé mondiale, les bibliothèques et l’éducation dans le nord-ouest du Pacifique.
En 2006, la Fondation a été restructurée pour inclure des divisions dédiées au développement mondial et à la santé mondiale, en plus de ses activités aux États-Unis.
Au fil des années, elle a élargi ses domaines d’intervention, notamment dans la lutte contre les maladies, l’éducation, le développement agricole et l’adaptation au changement climatique en Afrique et en Asie.
La Fondation finance des projets de recherche qui lui sont soumis en privilégiant, outre l’excellence scientifique, les projets collaboratifs ayant un fort potentiel d’impact positif sur les populations les plus vulnérables, en accord avec sa mission philanthropique.
À l’aube d’une nouvelle ère de l’information bouleversée par l’intelligence artificielle, Véronique Mesguich nous offre une troisième édition actualisée et enrichie de son ouvrage « Rechercher l’information stratégique sur le web - Sourcing, veille et analyse à l’heure de l’IA », publié chez De Boeck Supérieur.
Cette troisième édition à jour explore l’univers des IA génératives et leur impact sur la recherche d’informations et la veille. On y découvre (après une préface d’Anne Marie Libmann), comment les IA transforment les pratiques de la recherche web, ainsi que des exemples concrets d’utilisation de l’IA pour l’extraction et l’analyse d’informations stratégiques.
L’ouvrage aborde également d’autres méthodes de recherche et de veille, basées sur la maitrise des sources et l’OSINT.
La possibilité de combiner les étapes de recherche est un outil très puissant, très utile pour des recherches complexes.
Cette fonctionnalité, longtemps et toujours présente sur les serveurs traditionnels, est aujourd’hui peu courante, voire inexistante, chez les agrégateurs de presse.
On peut certes toujours y utiliser parenthèses et opérateurs pour combiner différents concepts, mais cela s’avère rapidement compliqué.
Il est beaucoup plus simple, élégant et performant d’utiliser la combinaison d’étapes.