La société allemande DEEPL, un des acteurs majeurs de la traduction automatique, annonce qu’il va surpasser ses concurrents que sont Google Translate et ChatGPT.
Cela devrait se faire grâce à son dernier modèle de langage LLM.
En effet, ce nouvel LLM ne s’appuie pas, pour s’entrainer, sur des données d’Internet en général, mais sur son propre jeu de données propriétaires sélectionnées et adaptées à la création de contenu et à la traduction linguistique.
Il prétend donc qu’il sera meilleur que Google Translate qui rencontre des problèmes de traduction littérale ou incorrecte.
Quant à ChatGPT, son offre de traduction automatique serait secondaire par rapport à l’ensemble de son offre alors que "DeepL est très spécialisé, ce qui est particulièrement utile dans des domaines exigeant une haute précision ». Bref, il sera meilleur là aussi.
Ces améliorations devraient faire gagner en temps et en efficacité, car il y aura moins de temps consacré à la vérification et à la correction.
Loin de vouloir concurrencer les traducteurs professionnels il se positionne comme leur « allié indispensable », une affirmation qui peut laisser songeur...
Depuis quelques années, le mouvement no-code / low-code s’inscrit dans l’actualité des outils de veille. Ces outils permettent incontestablement d’imaginer et de réaliser des tâches qu’il était impossible de réaliser soi-même auparavant sans savoir coder (ou juste un peu, pour le low-code). Or, comme la datavisualisation , le no-code constitue un véritable moteur de transformation non seulement des usages, mais du métier dans son ensemble, tant il est vrai que le professionnel de l’information agit de concert avec les avancées informatiques comme nous l’avions déjà illustré avec l’utilisation de Github.
Les outils no-code, 100 % en ligne (hébergés dans le cloud, donc sans élément à installer), permettent de réaliser des sites web et des applications, mais aussi de créer des automatisations, notamment avec des bases de données. Les veilleurs étant habitués à s’adapter à l’environnement numérique de leur client, c’est surtout l’automatisation et la manipulation des bases de données qui les concernent.
Et ces outils interviennent aussi bien au niveau de l’interface client, que des automatisations et connexions aux APIs ou même de la structuration de la donnée.
Ils envahissent le quotidien des professionnels de la veille depuis quelques années, dans les entreprises de toute taille. Pour le veilleur, les outils no-code sont devenus essentiels à chaque étape de la veille.
Lire aussi :
« Le veilleur face au défi de la représentation des données », NETSOURCES n°161 - novembre/décembre 2022
« Github : le self-service du veilleur fauché, mais très motivé », BASES n°396 - octobre 2021
Quoiqu’on en dise, Google Translate est d’une aide précieuse pour les veilles et recherches d’informations à l’international sur des langues que l’on ne maîtrise que très peu ou même pas du tout.
Pour traduire un mot ou une expression, l’utilisation d’un véritable dictionnaire en ligne ou même papier sera généralement plus judicieux.
Pour des longs passages de texte, des articles de presse ou même des pages et sites Web dans leur intégralité, l’outil aura le mérite de faire ressortir le sens général, de pointer vers quelques détails et surtout permettra de déterminer si de plus amples investigations sont nécessaires.
1. Lutter contre l’infobésité en privilégiant une sélectivité des sources;
2. Trouver des solutions pour intégrer les contenus multimédias à sa veille au même titre que les contenus textuels;
3. Tirer parti des évolutions de la traduction automatique pour renforcer sa veille sur des langues autres que l’anglais;
4. Accorder plus d’importance à la fiabilité des sources et informations et être vigilant sur la porosité de la frontière information/publicité;
5. Adapter ses livrables aux attentes et pratiques de son public et non l’inverse;
Google et Bing se transforment toujours un peu plus en moteurs de réponses.
En ce début d’année, l’actualité est très riche du côté des moteurs de recherche.
Google a récemment lancé un test où, pour certaines questions simples (comme l’heure qu’il est, convertir des unités ou des monnaies ou encore effectuer des calculs), il affichait directement la réponse sans proposer de liste de résultats naturels (voir figure 1.).
Et si l’on souhaitait accéder aux résultats naturels, il fallait alors cliquer sur un bouton « afficher tous les résultats ».
Comme nous avons eu l’occasion de le mentionner à maintes reprises, la veille et la recherche d’information ne peuvent bien souvent pas être appréhendées à l’échelle d’une seule langue ou tout du moins uniquement en français.
Cela s’applique aussi bien à la veille concurrentielle, stratégique, marketing, réglementaire, scientifique, technique ou encore brevet.
Prenez par exemple une veille concurrentielle dans le secteur de l’industrie : il y a tout de même de bonnes chances que certains concurrents soient basés ou disposent d’une présence à l’étranger, notamment pour leurs sites de production.
Dans le secteur de la recherche, il est en ce moment beaucoup question des « revues prédatrices », en l’occurrence des revues pseudo-scientifiques dont le but principal est l’enrichissement plutôt que l’avancement de la recherche.
Les chercheurs sont généralement sollicités par email par ces revues et invités à soumettre des articles. Elles fonctionnent sur le modèle du libre accès où les auteurs payent pour que leurs articles soient publiés. Mais dans le cas des revues prédatrices, n’importe quel article est accepté et publié, les comités éditoriaux étant souvent composés de membres fictifs ou de chercheurs dont les noms ont été inscrits sans leur accord.
Jeffrey Beall, un bibliothécaire de l’Université du Colorado à Denver avait mis en ligne une liste des revues prédatrices pour aider les chercheurs à ne pas se faire piéger, liste qui a malheureusement été retirée en janvier dernier suite aux nombreuses pressions qu’il a reçues.
La conférence s’est conclue par un passionnant tutoriel d’une durée d’ … 1h30 donné par le Dr Gabriele Kirck-Verfuß du cabinet allemand WissensWert. L’objectif était de comparer une recherche par mots-clés effectuée de façon professionnelle avec les résultats d’une approche sémantique.
Dans la première partie de ce tutoriel nous avons trouvé particulièrement intéressante la présentation de nombreuses sources permettant d’enrichir le vocabulaire et le contexte décrivant, essentiellement en anglais, mais pas uniquement, chacun des concepts utilisés dans la recherche.