IA générative : les sources sous tensions

ANNE-MARIE LIBMANN
Bases no
441
publié en
2025.11
94
Acheter ce no
Tags
IA | droit d'auteur
IA générative : les sources sous tensions Image 1
IA générative : les sources sous tensions Image 1

Un écosystème en transition : entre pillage massif, rééquilibrages juridiques et premiers modèles sous droits


L'IA générative ne se contente pas de « produire du texte ». Elle recompose le cadre même dans lequel l'information circule, est transformée et prend de la valeur.

Après quelques décennies d'un écosystème hybride, mêlant presse sous droits, bases professionnelles, web ouvert et intermédiation dominante de Google - un nouveau paysage se dessine, où des agents IA, encore largement alimentés par du scraping massif des contenus, souvent dénoncé comme une forme de captation non autorisée par les éditeurs, pourraient à terme fonctionner sur des corpus contractuels négociés.

Mais cette transition est loin d'être accomplie. Nous sommes dans un « entre-deux » instable où se côtoient pillage, litiges, opacité technique et premières tentatives de régulation. Les enjeux sont cruciaux pour les éditeurs, les professionnels de l'info-doc, les journalistes et, plus largement, l'ensemble des usagers.

 D'un écosystème hybride à un accès algorithmique aux contenus

Contrairement à l'idée parfois avancée d'un « avant » dominé par un web ouvert, l'écosystème informationnel qui a précédé l'IA générative était déjà profondément hybride. Une large part des contenus reposait sur des dispositifs sous droits : presse payante, agences, agrégateurs, bases professionnelles.

Cet univers, structuré par des licences et des usages encadrés, était gouverné par des éditeurs, des institutions réglementaires et des professionnels de l'information qui en assuraient la cohérence juridique et documentaire.

À côté de cet espace contractuel existait le web ouvert, un territoire libre d'accès et riche en signaux documentaires, où la traçabilité des pages, l'identification des auteurs, la présence des liens et la possibilité de suivre la circulation des contenus constituaient autant de repères essentiels.

Entre ces deux pôles se tenait Google, une interface quasi incontournable. Son modèle économique basé sur la publicité créait de tensions fortes avec les éditeurs, imposait de nouvelles dépendances économiques et influençait parfois très négativement les stratégies éditoriales. Pourtant, malgré ses effets ambivalents, Google garantissait au moins une certaine forme d'échange : il permettait la visibilité des contenus, générait du trafic vers les sites et participait, même de façon imparfaite, à leur découvrabilité.

Cet ensemble composite, déjà traversé de conflits et d'interdépendances, forme aujourd'hui le socle sur lequel viennent se greffer les recompositions provoquées par l'IA générative.

Un changement de paradigme juridique : l'IA ne copie pas les contenus, elle les ingère

Et c'est là que se situe la rupture. Le débat public se concentre encore sur la notion de « reproduction » des contenus par les modèles d'IA. Or ce cadre ne correspond plus à la réalité technologique. Les systèmes génératifs ne stockent pas des copies d'articles ; ils ingèrent des textes sous forme de représentations vectorielles.

tags

Déjà abonné ? Connectez-vous...

Connexion

Connexion

Votre identifiant

ENTER YOUR PASSWORD

Forgot Password or Username
Créer un compte