Un article très intéressant vient de paraître sur le site de preprint arXiv.
Il présente et analyse un ensemble de 14 000 articles publiés dans arXiv et rétractésdepuis l’origine d’arXiv en 1991 jusqu’à septembre 2024.
Ces articles rétractés sont accompagnés des commentaires liés à la rétractation. De plus, les auteurs ont classé les raisons des rétractations en 10 catégories :
Autre remarque intéressante : les rétractations sont relativement fréquentes dans le domaine médical, par contre, elles sont rares, voire absentes dans le domaine informatique.
Ce nouveau guide propose une liste de « repositories de confiance dans différents domaines de recherche avec une évaluation de leur conformité avec les règles du Programme cadre Horizon Europe qui couvre, rappelons-le, la période 2021 à 2027.
Naviguer parmi les exigences concernant la science ouverte de l’ "Horizon Europe Model Grant Agreement" (MAGA) peut être difficile pour les chercheurs.
Le guide leur donne des recommandations pour sélectionner le(s) « repository/ies où déposer leurs résultats de recherche, en précisant que cela n’est pas un « liste blanche » ni une validation.
Cette démarche s’inscrit dans la promotion de la science ouverte et doit favoriser la collaboration entre chercheurs en Europe et plus largement.
La nouvelle édition du guide recense 241 « repositories » dont 186 ont été jugés dignes de confiance. La liste sous forme de tableau Excel avec de nombreux critères est accessible ici.
Parmi les mieux cotés, on signalera notre HAL national et l'Européen Zenodo.
CFNEWS IMMO publie en continu des informations très détaillées sur les deals immobiliers, essentiellement en France. Ces informations forment la matière première d’une base de deals qui regroupe plus de 6 500 opérations. La description de ces opérations est extrêmement détaillée, constituant autant de critères utilisables pour rechercher dans la base de deals.
Les deals immobiliers dont il est question ici sont exclusivement des deals professionnels. Une offre d’essai de huit jours est proposée pour se familiariser avec le site et le tester.
Google Scholar a été créé en 2004 par deux chercheurs. Son objectif a été et est toujours de référencer de grandes quantités d’articles, de rapports, de comptes-rendus de conférences, de livres ou de thèses pour peu qu’ils relèvent du secteur académique.
Sa devise « Standing on the shoulders of giants » signifie que Google Scholar existe parce que des chercheurs ont écrit et accumulé d’immenses quantités de connaissances. Cela a justifié la création de Google Scholar pour aider à naviguer dans cet océan d’information et y trouver des réponses à ses questions.
Les raisons de cette large utilisation sont très simples.
D’une part, l’accès est gratuit alors que de nombreuses sources d’information scientifique sont payantes. C’était particulièrement vrai il y a vingt ans, mais moins aujourd’hui.
D’autre part, l’étendue de sa couverture a pour conséquence qu’il est rare de ne pas trouver au moins quelques réponses intéressantes et bien souvent un nombre non négligeable à une question scientifique.
Enfin, son utilisation est simple, voire très simple, même si quelques possibilités avancées sont disponibles bien que pas toujours très mises en avant.
En revanche, la troncature n’existe pas alors que c’est un « must » pratiquement partout. On ne peut pas non plus entrer une chaîne de recherche experte sans même parler de combinaisons d’étapes totalement impossibles.
En ce qui concerne le traitement des réponses, leur nombre est limité à 1 000 ce qui est largement suffisant pour une simple lecture, mais ne l’est plus pour faire du data mining.
Même si ses utilisateurs semblent être toujours aussi nombreux, on voit poindre une série de critiques plus ou moins fondamentales.
Maître Thibault du Manoir de Juaye, avocat à la Cour de Paris, est un spécialiste reconnu en intelligence économique et en droit de la sécurité privée. Il a fondé son cabinet en 1995, intervenant régulièrement sur des dossiers liés à l’intelligence économique, notamment en matière de propriété intellectuelle.
Auteur de plusieurs ouvrages sur le sujet, il a également été rédacteur en chef du magazine « Regards sur l’IE ».
L’intelligence artificielle amplifie les problématiques juridiques déjà connues pour la veille et l’IE, notamment en raison de sa faculté à faciliter les recherches et à générer automatiquement des contenus de tout type.
Même si elle n’en est sans doute qu’à ses débuts, il existe déjà des tentatives pour encadrer juridiquement l’intelligence artificielle (IA).
Des juristes imaginatifs (et pour moi loufoques) vont même jusqu’à soutenir qu’il faudrait donner la personnalité juridique aux systèmes d’IA, un peu comme les sociétés ont la personnalité morale. Mais il ne s’agit pour le moment que de spéculations ludiques et récréatives, sans grand intérêt, sauf pour quêter une exposition médiatique à moindres frais.
Il faut donc s’en tenir au droit positif.
L’intelligence artificielle est désormais encadrée par un règlement européen en date du 12 juillet 2024, texte qui sera complété par des milliers de pages d’application.
Devant l’avalanche d’annonces sur les innovations et nouveautés en IA, cette rubrique met en avant celles que nous considérons comme utiles pour les professionnels de l’information.
N’hésitez pas à nous partager vos questions ou sujets d’intérêt liés à l’IA en nous écrivant à l’adresse Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser..
En préliminaire, il nous paraît important de clarifier notre position sur la difficulté à recommander de s’abonner à tel ou tel modèle d’IA pour accéder à certaines fonctionnalités (même si nous pensons que l’abonnement à ChatGPT est un must).
La dynamique entre les fonctionnalités gratuites et payantes dans les modèles d’IA évolue constamment, en fonction des stratégies commerciales, des retours utilisateurs et des innovations technologiques. Une fonctionnalité peut être d’abord réservée aux abonnés puis devenir gratuite, ou inversement, être monétisée après avoir gagné en popularité.
Anthropic sort une nouvelle version de son modèle Claude 3.5 Sonnet avec une innovation majeure dans le traitement documentaire, qui enrichit l’analyse les documents complexes en extrayant et analysant les éléments visuels contenus quand il existent.
Open AI vient d’annoncer le lancement de son outil de recherche en ligne baptisé ChatGPT Search.
Nul doute que, si l’outil est vraiment fiable, - et il n’y a pas de raison qu’il ne le soit pas – cela ne sera pas sans conséquence sur l’énorme part de marché que Google détient dans la recherche sur le Web.
La Cour de Cassation au sein de laquelle est développée Judilibre, annonce que les décisions des tribunaux de commerce seront chargées avant la fin de cette année.
Rappelons que Judilibre a vocation à proposer en open access l’ensemble des décisions de justice rendues en France.
La prestigieuse institution vient de lancer l’application « Library Mobile » pour smartphone qui donne accès à une série d’informations et de services tels que l’accès à Omnia, le catalogue des douze bibliothèques et du service des archives. Il permet aussi, en particulier, de suivre les cours du Collège de France sur ses chaînes YouTube et de lire les derniers billets du blog Colligere.
PLOS est un éditeur de publications en open access essentiellement dans le domaine biomédical.
Les articles qu’il publie sont classés en différents types tels que « research article », « short report », « consensus view » ou « perspective », une ventilation dont le niveau de détail est peu fréquent.
Cet éditeur vient d’innover avec la création d’un nouveau type d’article baptisé « essay » proposé dans ses publications PLOS Climate, PLOS Global Public Health, PLOS Mental Health et PLOS Water.
Ces « essays » sont des articles de prise de position, en particulier sur des sujets politiques d’intérêt régional ou sectoriel.
Ces articles de 3 à 4 000 mots sont supposés pouvoir être lus par des non-spécialistes.
À titre d’exemple, un des essais récemment chargés traite des lacunes politiques dans le traitement des maladies pulmonaires post-tuberculose.
Notre première démarche en préparant cet article a été d’interviewer Denis BERTHAULT, vice-président du GFII, et surtout, fin connaisseur des nombreuses évolutions et péripéties de l’information juridique en ligne en France. Qu’il soit ici remercié pour ses précieuses informations accompagnées de commentaires fort pertinents.
Judilibre, qui a vocation à diffuser en open access les décisions de justice, monte en puissance comme prévu. La Cour de cassation qui opère ce service s’était vu confier cette mission de mise à disposition des décisions de justice par un décret du 29 juin 2020.
À l’heure où OpenAI lance SearchGPT, son propre moteur de recherche intégré directement dans son chatbot, une question brûle sur toutes les lèvres : SearchGPT va-t-il détrôner Google ?
Au-delà de la « simple » question du modèle économique de Google et toutes réserves faites par ailleurs sur la robustesse des modèles d’IA face à leurs ambitions de déploiement planétaire, une autre question tout aussi cruciale nous semble se profiler : comment notre « expérience d’utilisateurs professionnels » est-elle transformée par les nombreux acteurs émergents de la recherche et de la veille ?
Depuis plusieurs mois, ces nouveaux acteurs consolident leur place et élargissent considérablement le champ d’utilisation opérationnelle des outils de veille et de recherche tels que nous les pratiquions jusqu’ici.
Dans ce nouveau numéro de Netsources, nous explorons ces transformations avec l’article de Véronique Mesguich qui analyse la concurrence entre You.com, «moteur de productivité polyvalent», et Perplexity, ainsi que l’article d’Ulysse Rajim sur NotebookLM, dont il analyse le rôle d' «un assistant pour la veille augmentée». Notons tout de même au passage que NotebookLM est produit par... Google.
Nous découvrirons sous leur plume comment ces moteurs ne se contentent plus d’afficher des résultats bruts. Ils permettent aux professionnels de l’information de réaliser des synthèses claires et structurées, enrichies par le traitement de très grandes quantités d’informations de multiples sources. L'information est désormais beaucoup plus facilement manipulable, permettant une structuration et un enrichissement en temps réel grâce à une grande puissance de traitement d'énormes volumes de données. Cela offre une nouvelle façon de gérer la connaissance, ce qui est essentiel pour la gestion de masses d'informations et de connaissances. L'utilisateur peut ainsi naviguer entre différents modes-recherche, génération de contenu et même création d'images-en fonction de ses besoins.
Nous serons également très attentifs à la méthode innovante et personnalisée que nous propose Ulysse Rajim avec un véritable guide de l’automatisation de la veille grâce à l’IA.
Le lecteur pourra mesurer en filigrane comment ils modifient en profondeur la collecte, le filtrage et l’analyse de l’information ainsi que la gestion des connaissances au sein des entreprises, en les rendant accessibles et exploitables par différents services et équipes à une échelle beaucoup plus large.
Automatiser sa collecte d'informations, synthétiser des documents très volumineux, personnaliser ses agents de recherche, toutes ces possibilités sont désormais à votre portée. L’idée est d’exploiter l’IA non pas comme une curiosité technologique, mais comme un véritable levier de productivité et de performance.
« Avec 1542 demandes de brevets, Stellantis est le premier déposant en 2023 ». La presse économique est friande de ce type de chiffrage.
Que peut-on en déduire ? L’avantage de ces données brutes, c’est leur simplicité de lecture ; le dépôt de demandes de brevet étant souvent considéré comme un indicateur de la capacité d’innovation d’une entreprise, on peut en conclure qu’« en 2023, Stellantis est plus innovant que Safran qui l’est plus que Valeo… ».
Est-ce aussi simple ? Probablement pas, car attribuer le même poids à tous les brevets, c’est oublier que tous ne se valent pas. Comment donc introduire du qualitatif dans ce type de comptage, afin d’arriver à une vision plus juste ?