Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

La recherche de citations et de références boostée par l’IA et les « open citations »

Carole Tisserand-Barthole
Bases no
369
publié en
2019.04
2705
La recherche de citations et de références boostée par l’IA ... Image 1
La recherche de citations et de références boostée par l’IA ... Image 1

La recherche de citations et de références représente une autre façon de rechercher de l’information, complémentaire aux traditionnelles recherches booléennes.

Cette recherche recouvre deux aspects :

Elle permet tout d’abord de rechercher et visualiser ce qu’un document a référencé et cité dans son contenu. Il peut s’agir aussi bien des références bibliographiques d’un article scientifique que de simples mentions d’un article ou document au sein d’un article de presse ou de blog. On est ici dans une forme de sérendipité où l’on navigue de liens hypertextes en liens hypertextes. Et lorsqu’un document cite ses sources, celles-ci ont toutes les chances d’être reliées au sujet qui nous intéresse. 

Mais il s’agit aussi de repérer qui a, depuis cette publication, utilisé et cité cet article initial. On pensera ici surtout à certains outils de recherche académiques et scientifiques qui listent sous chaque article le nombre de fois où il a été cité et un lien vers ces documents. Il pourra s’agir également de repérer les documents et pages pointant vers un article de presse, un billet de blog ou mentionnant une étude, etc.


La recherche de citations et de références débute donc, non pas par une requête booléenne ou une requête en langage naturel, mais prend sa source à partir d’un document, une page web, un article précis et déjà identifié.

Elle permet de s’extraire des mots-clés et des langues et fait souvent émerger des résultats pertinents et notamment dans des disciplines inattendues ou supports méconnus que l’on n’aurait pu identifier par d’autres méthodes.

Et dans un contexte de surinformation où les moteurs de recherche Web fournissent de moins en moins de résultats, elle vient en complément des autres modes de recherche et permet de tendre vers plus d’exhaustivité afin ne pas rater de « pépite ».

Elle permet finalement de tirer parti de l’intelligence humaine et collective, celle des chercheurs, journalistes, internautes, souvent experts dans leur domaine, qui ont déjà identifié des ressources pertinentes et ciblées et les mentionnent dans leurs contenus.

Si ce mode de recherche dispose d’un nom bien défini en anglais en l’occurrence citations searching, on constate qu’il n’existe pas d’appellation officielle et uniforme en français bien qu’elle se pratique depuis des décennies.

Nous choisirons donc ici le terme « recherche de références » pour désigner la recherche sur ce qu’un document a référencé et cité dans son contenu et « recherche de citations » lorsqu’il s’agit de voir qui a repris et cité cet article initial.

Cette forme de recherche est aujourd’hui surtout développée et formalisée dans un contexte de recherche scientifique et académique, principalement parce que la structure des contenus s’y prête. Un article scientifique dispose toujours d’une liste de références bien structurée et clairement identifiable et le nombre de fois où un article est cité est un facteur important en terme de visibilité. Néanmoins, on aurait tort de ne pas l’exploiter dans d’autres contextes (recherche presse par exemple) même si cela va s’avérer plus complexe car les citations sont ici directement mêlés au texte et il n’existe aucune règle ou norme.

Si cette forme de recherche est ancestrale - on pouvait déjà tirer parti des références bibliographiques avant même l’arrivée des banques de données et d’Internet -, elle a été rendue plus simple et intuitive avec le développement des liens hypertextes dès les années 90.

Mais elle bénéficie aujourd’hui d’un nouveau souffle grâce au développement du mouvement de l’Open (open access, open science, open data, etc.) et les progrès de l’intelligence artificielle. C’est ainsi que l’on voit se développer de nouvelles fonctionnalités et outils dédiés, principalement dans le domaine scientifique et académique.

Quels sont ces nouveaux outils et fonctionnalités pour tirer parti des citations et références ? Comment rechercher efficacement à partir des citations et références d’un article scientifique, d’une thèse mais aussi d’un article de presse, de blog, etc. ?
 C'est ce que nous analyserons dans cet article, avec un cas pratique sur la recherche de citations et références appliquée à la littérature. 

tags

Déjà abonné ? Connectez-vous...

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...