La littérature scientifique chinoise en constante augmentation
Pour mesurer l’accroissement du nombre de documents disponibles, nous sommes repartis des chiffres de notre article paru dans le N° 328 de BASES (juillet 2015) : « Brevets et littérature scientifique : l’irrésistible développement de la Chine ».
Nous avons regardé dans Scopus. Si les références y sont en anglais, les articles eux-mêmes peuvent y être dans une multitude de langues y compris, bien sûr, le chinois.
En 2015, dans cet agrégateur, 3,9 millions d’articles avaient au moins un auteur ayant une affiliation chinoise, les articles étant publiés en anglais dans 72 % des cas.
En 2023, 9,6 millions d’articles dont au moins un auteur a une affiliation chinoise sont recensés dans l’ensemble de la base, la proportion d’articles publiés en anglais passant à 79 %.
Dans la banque de données INSPEC, disponible entre autres sur les serveurs Dialog Solutions et STN, on trouvait, en 2015, 742 000 articles d’origine chinoise dont 627 000 en chinois, soit 84 %. En 2023, on en trouve 4 118 000 dont 770 200 en chinois, soit 18,7 %.
On voit clairement que la tendance des Chinois est de publier de plus en plus en anglais, même s’il reste un nombre important d’articles publiés en chinois.
Et compte tenu du développement de la Chine, il devient de plus en plus nécessaire de prendre en compte les articles en chinois et non plus seulement ceux en anglais.
Tour d’horizon des principaux serveurs chinois
Plusieurs serveurs chinois sont aujourd’hui disponibles et proposent un accès plus ou moins facile à des articles et à leurs références en chinois, tandis qu’ils offrent aussi des documents en partie ou entièrement en anglais.
Quelques banques de données sont recherchables gratuitement via une interface en anglais, avec des termes de recherche en anglais. Certains documents primaires sont en libre accès, d’autres accessibles en pay-as-you-go ou encore réservés aux abonnés de la base de données.
Bien sûr, certains articles chinois référencés dans ces banques de données sont également référencés dans les banques de données/serveurs occidentaux, mais il en reste une partie très difficile à évaluer, qui n'est distribuée que sur des serveurs chinois et qui peuvent, sait-on jamais, être particulièrement intéressants.
Parmi les différents acteurs, certains ont des tailles importantes et visent clairement une clientèle internationale en complément de leur clientèle chinoise, d’autres sont plus confidentiels, ce qui ne veut pas dire qu'ils soient dénués d'intérêt. Un article relativement récent (2021) dont le titre est « Chinese Sci-Tech Journal Databases » en anglais et en open access, écrit par des universitaires de la Penn State University aux États-Unis, propose une sélection pertinente des banques de données chinoises pouvant intéresser les Occidentaux (1).
Les trois producteurs mis en avant dans cet article sont CNKI (China National Knowledge Infrastructure), VIP Information Consulting Company (VIP) et Wanfang Data Company.
Nous sommes allés explorer ce que ces trois acteurs ainsi que quelques autres plus confidentiels avaient à nous offrir.
CNKI, China National Knowledge Infrastructure
Un peu de contexte
CNKI, la plus grande de ces banques de données est dans l’actualité récente. Elle a été condamnée le 26 décembre dernier, après sept mois d’enquête, par l'organisme de régulation chinois, le SAMR (State Administration for Market Regulation) à une amende de 87,6 millions de yuans (12,58 millions de dollars), ce qui représente 5 % de son chiffre d’affaires 2021.
Le SAMR reproche à CNKI son comportement monopolistique, abusant de sa position dominante sur le marché chinois. Il lui reproche aussi ses prix élevés ayant entraîné la perte de six universités chinoises comme clientes, tandis que la Chinese Academy of Science (CAS) menaçait de rompre son contrat.
CNKI avait été créée par Tsinghua Tongfang, le bras commercial de la Tsinghua University, à la fin des années 90 au moment du décollage d’Internet. Elle a construit sa position dominante, d’après SAMR, en rassemblant plus de 95 % des publications académiques chinoises, dont 1 690 en exclusivité.
Aujourd’hui, l’Université de Tsinghua n’est plus du tout actionnaire de CNKI. Elle a été remplacée par des SOE (State-owned Enterprises).
D’après ce serveur/agrégateur, en 2020 il avait 33 000 utilisateurs institutionnels et plus de 20 millions d’utilisateurs finaux inscrits à ses services. Ils déchargent en un an environ 23,3 milliards d’articles en texte intégral.
Le chiffre d’affaires 2020 de CNKI a été de 1289 millions de yuans (soit 102 millions de dollars) avec une rentabilité annoncée de… 53 %.
Il y a deux catégories d’utilisateurs pour CNKI :
- Les membres (étudiants et professeurs d’une université ou d’un centre de recherche) ; l’université ou le centre de recherche paie une redevance annuelle à CNKI, et les utilisateurs se connectent et recherchent librement, tout en payant une petite somme pour chaque téléchargement de document.
- Des individuels qui cherchent librement et paient peu cher pour télécharger les documents.
À la suite de la plainte de la SAMR, CNKI, après avoir payé l’amende, a assuré qu’il allait significativement baisser ses prix et renoncer aux clauses d’exclusivité.
A la découverte du serveur
Nous nous sommes enregistrés gratuitement et sans problème.
Nous avons fait des recherches en anglais et acheté un document chinois pour un faible montant en dollars (10 à 20 fois moins qu’en Occident) après avoir fait un dépôt de 50 $ qui, semble-t-il, n’était pas obligatoire.
On trouve beaucoup d’informations en anglais sur ce site qui est assez tentaculaire et complexe, mais très riche (Cf. figure 1. Interface de CNKI). Il est conseillé d’utiliser Google Chrome, car les possibilités de traductions à la volée sont de loin supérieures à ce dont on dispose sur Firefox.

Figure 1. Interface de CNKI
Nous avons aussi découvert que le contenu en tout ou partie de CNKI se trouvait disponible sur le serveur américain East View. On rappellera que ce site a été créé en 1989 par un militaire russe et un étudiant diplômé américain pour mettre à disposition des documents militaires soviétiques récemment déclassifiés. East View s’est ensuite développé en mettant à disposition des informations d’une multitude de pays, dans leur langue originale, ce qui est intéressant, mais hors du scope de cet article. En 2022, East View a chargé les éléments de CNKI en en faisant un produit à part baptisé China Research Gateway (CRG), réservé au marché américain.
Wanfang Data
Wanfang Data se présente, de même que CNKI, comme le plus important serveur chinois. Créé en 1993, il dépend du Ministère chinois de la Science et de la Technologie.
Il offre également un large panel d’informations : articles scientifiques, thèses, informations générales, etc. Nous en avons déjà parlé il y a plusieurs années dans un article intitulé « WanfangData.com : des informations chinoises en ligne »
Demandez le BASES, N° 273, juillet 2010 via l'adresse Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.
Aujourd’hui, en nous connectant à l’adresse wanfangdata.com, nous accédons à une présentation en anglais assez détaillée du contenu avec des volumes de documents disponibles relativement impressionnants (44,8 millions d’articles, 3,8 millions de thèses, 2,98 millions de conférences, etc.), mais ce comptage date de… 2019. En haut de cette page de présentation, on se voit proposer d’effectuer une recherche simple ou avancée. Le petit problème est que, quelle que soit la recherche, on reçoit invariablement le message « internal server error ».
Nous avons envoyé un mail au serveur pour lui faire part de ce bug. La réponse, quand même en anglais, mais plutôt succincte et standard se contentait de rappeler deux URLs et ne répondait pas du tout à la question.
Nous avons eu plus de chance avec l’adresse : www.s.wanfangdata.com.cn/advanced-search/paper à condition d’utiliser le navigateur Google Chrome et ses traductions automatiques à la volée via l’intégration de Google Translate, qui nous permet ainsi d’avoir un formulaire de recherche avancée en français.
Si l’on choisit une référence dans les résultats et que l’on veut aller plus loin, on tombe sur une demande d’identification en chinois qui, une fois traduite par ailleurs, demande mot de passe et… numéro de téléphone. Plutôt que de demander un essai gratuit nous avons demandé un « standard licensing agreement ». La réponse a été quelque peu inattendue nous précisant qu’un «accord préalable» devait avoir été établi avec Wanfang Data, puis qu’il fallait indiquer à quelles banques de données nous souhaitions accéder, quel était le nombre d’utilisateurs et aussi à quel moment de la journée nous souhaitions interroger ces banques de données.
Nous avons donc arrêté là nos investigations sur ce serveur.
Il y a quand même une solution pour accéder à une partie au moins du contenu de Wanfang Data si l’on n’y est pas abonné directement. Cette solution est proposée par EBSCO dans son offre EBSCO Discovery Service (EDS) qui propose quatre banques de données produites par Wanfang Data : China Local Gazetteers, China Online Journals, Dissertation of China et Academic Conferences in China. Mais il n’existe pas de formule pay as you go, uniquement l’abonnement annuel.
VIP Information Consulting Company
Le troisième serveur évoqué dans l’article cité plus haut est VIP que l’on trouve à l’adresse
Chongqing VIP Information Co., Ltd a été créée en 1995. On trouve sur le site une page présentant l’histoire de l’évolution de ce service, mais curieusement elle s’arrête en 2016, alors que le site existe toujours et qu’on y trouve des documents datés de 2023.
Il n’existe pas d’interface en anglais. En revanche sur l’interface chinoise il est tout à fait possible d’entrer un terme en anglais et d’obtenir des réponses.
On peut aussi l'interroger en utilisant Google Chrome et sa traduction automatique en français. Malheureusement toutes les pages ne sont pas traduites, ce qui rend la recherche assez complexe.
Superstar Journals Database
Parmi les sources citées par l’article de la Penn State University, il y avait également « Superstar Journals Database » accessible à l’adresse.
S’il y a des interfaces de recherche simple et avancée en chinois et en anglais, elles conduisent à une demande d’identifiants signifiant qu’il faut être abonné.
Oriprobe Information Services
Enfin, une autre ressource importante, mais un peu inattendue est la société canadienne Oriprobe Information Services (Oriprobe.com) qui est située dans la province de l’Ontario et qui offre un très large éventail de services de recherche, de récupération d’articles et de traduction.
Comme on le voit, la Chine s’ouvre, même s’il faut être capable d’y entrer…
(1) Chinese Sci-Tech Journal Databases. Musser, Linda R., Atwill, Yurong Y. In: Issues in Science and Technology Librarianship, Vol. 2021, No. 99, 01.09.2021.
