Philippe Masseron du gf2i (Groupement français de l’industrie de l’information) nous éclaire sur les enjeux cruciaux du droit d’auteur à l’ère de l’IA générative. Entre risques de prédation massive des contenus et opportunités d’accès et d’innovation portées par l’IA, les acteurs de la création et de l’information doivent se mobiliser pour défendre leurs intérêts et repenser leurs modèles de valorisation.
Le rôle d’instances comme le gf2i sera clé pour peser dans les débats législatifs en cours et créer les nouveaux équilibres dans l’économie de la donnée.
Expert en droit de la propriété littéraire et artistique et en gestion de droits
Après des études juridiques (DEA en Finances publiques et Fiscalité – Paris 2) et en Information Communication (Institut Français de Presse – Paris 2), Philippe MASSERON a successivement occupé les postes de directeur juridique et directeur général au CFC (Centre Français d'exploitation du droit de Copie).
Il est administrateur du gf2i (Groupement Français de Industries de l'Information) délégué à la prospective. Il participe régulièrement aux missions du CSPLA.
Anne-Marie Libmann (AML) : Comment définissez-vous le problème de fond sur la question du droit d’auteur par rapport aux systèmes d’intelligence artificielle générative (SIAG) ?
Philippe Masseron (PM) : Nous assistons à une réaccélération et une amplification massive du phénomène de scraping, fouille et crawling des données. Cela n’est pas nouveau, nous avons déjà été confrontés à des situations similaires par le passé qui ont suscité de vives inquiétudes, comme lors du lancement de Google Books ou des grands programmes de numérisation des bibliothèques. Mais l’échelle et la vitesse ont changé. Aujourd’hui, il existe d’immenses bases de contenus protégés accessibles, notamment dans le domaine scientifique, par exemple SciHub qui rassemble des millions de documents en infraction avec le droit d’auteur.
Dans la plupart des entreprises, la veille brevet est souvent négligée. La veille brevet peut pourtant être une source d’informations précieuse pour l’intelligence concurrentielle. Elle permet de suivre l’évolution des technologies, d’identifier les concurrents, et d’exploiter toutes les opportunités de marché en développant une vraie stratégie. Entretien avec Philippe Borne, Délégué Régional de l’INPI pour la Région Grand Est (1), et également rédacteur occasionnel pour notre lettre BASES à titre d’expert.
François Libmann : La veille brevet a un potentiel qui nous semble sous-évalué dans le domaine de l’intelligence concurrentielle. Comment l’interprétez vous ?
Philippe Borne : Beaucoup d’entreprises ont une vision très juridique du brevet, considéré uniquement comme un outil de protection, et donc avec des stratégies brevet très traditionnelles. Et du fait de cette vision, on retrouve la même attitude en ce qui concerne la veille brevet. Cette vision très juridique du brevet en France a pour conséquence qu’il n’est pas tenu compte de son potentiel en tant que source d’informations pour l’intelligence concurrentielle. Cela ne vient, en effet, pas à l’esprit qu’on puisse faire de la veille technologique sur ce type d’information.
(1) Philippe Borne s’exprime ici à titre personnel et les opinions qu’il expose n’engagent que lui-même.
Une veille peut s’effectuer sur un très grand nombre de sources telles que les publications dans différents types de presse (généraliste, scientifique…), le web et, en particulier Google ou des sites spécialisés, les réseaux sociaux, les visites de foires et salons, les conférences…
Dans un très grand nombre de cas, particulièrement pour la veille technologique et concurrentielle, il ne faut surtout pas négliger les différentes dimensions de la propriété industrielle : brevets, marques ainsi que dessins et modèles.
Tout d’abord, précisons le vocabulaire, car il y a un fort risque de confusion.
On rappellera en premier lieu qu’un brevet est une sorte de contrat entre l’État en général et un inventeur. En échange de l’exclusivité de l’usage d’une technologie sur une durée pouvant, en général, aller jusqu’à 20 ans, la description de cette technologie est rendue publiquement accessible, après une période de 18 mois, et constitue une information scientifique/technique.
Le titulaire du brevet peut exploiter lui-même sa technologie ou décider s’il autorise un/des tiers à l’exploiter et, dans ce cas, sous quelles conditions (vente du brevet, concession d’une licence).
Nous avions parlé récemment du nouveau moteur lancé par Creative Commons appelé CC Search et des manières de trouver des contenus sous licence Creative Commons.
Bien souvent, les auteurs de ces contenus exigent au minimum que l’on indique la source ou le nom de l’auteur, ce qui n'est pas nécessairement très esthétique pour les images utilisées dans un rapport, une présentation, une carte de voeux ou encore une une page Web.
Heureusement, il existe des sites qui regroupent des contenus sous licence CC0 (Creative Commons 0), c'est-à-dire que l'on peut utiliser sans la moindre contrainte et obligation.
Depuis que l’essentiel, sinon la totalité des titres de propriété intellectuelle sont disponibles sous forme électronique, les acteurs, qu’ils soient publics ou privés, ont poursuivi le développement de leurs services dans différentes directions.
On peut considérer, dans beaucoup de cas, que ces services ont atteint un bon niveau de maturité même si les développements continuent.
Ces services concernent, en particulier les possibilités de recherche proposant une part de recherche sémantique ; les traductions automatiques qui ressemblent de moins en moins à un galimatias difficile à comprendre ; l’analyse de plus en plus sophistiquée des résultats de recherche avec moult propriétés graphiques associées ; le suivi de toutes les étapes de la vie d’un titre de propriété intellectuelle ; le recueil et l’analyse des jugements concernant des litiges dans le domaine.
Si les logiciels de détection du plagiat sont connus et utilisés depuis plusieurs années dans le monde universitaire, on peut se demander s’ils peuvent également servir à alimenter une démarche de veille et d’intelligence économique en entreprise.
- D’une part, en détectant des contenus plagiés par d’éventuels concurrents.
- D’autre part, en les détournant légèrement de leur utilisation première pour trouver des contenus similaires qui pourront venir enrichir son sourcing ou faire émerger des informations sur des thématiques proches.
Le plagiat se définit comme l’acte de faire passer pour sien une publication d’autrui. Tous les domaines sont concernés, car à la racine du plagiat se trouve l’intention d’utiliser l’idée de quelqu’un d’autre sans les lui attribuer.
darts-ip est un produit à la fois original et intéressant qui indexe de façon très fine et la plus exhaustive possible la jurisprudence en matière de propriété intellectuelle.
Aujourd’hui plus de cinq millions de documents sont disponibles, concernant des litiges et même de simples poursuites dans les domaines des brevets (1,6 million d’affaires), marques (3,2 millions d’affaires), dessins et modèles (108 000 affaires), noms de domaines (136 000 affaires), copyright (156 000 affaires) et concurrence déloyale couvrant aujourd’hui le monde entier.
Lire aussi :
darts-ip : croissance et changement de politique
BASES n°294, juin 2012 : à commander en direct en nous écrivant à Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.
La recherche dans les brevets en texte intégral, comme d’ailleurs dans le texte intégral de n’importe quel document, n’est pas toujours évidente.
En effet, se limiter aux champs titre ou abstract ou revendications (ces dernières dans le cas des brevets) peut être un petit peu restrictif, mais inclure l’ensemble de la description générera, en général, du bruit.
STN propose maintenant pour ces banques de données un nouveau champ baptisé Key Terms (KT).
Dans le numéro 294 de BASES daté de juin 2012, nous avions eu l’occasion de consacrer un article à un produit très original baptisé darts-ip qui réunissait les décisions concernant les litiges en matière de propriété intellectuelle.
Cette banque de données offrait de la jurisprudence en matière de brevets, marques, dessins et modèles ainsi que noms de domaine. Un logiciel spécifique adapté à la matière avait également été développé permettant d’effectuer un grand nombre de recherches spécifiques.
Lire aussi : Clarivate Analytics rachète darts-ip
Depuis plus d’un an maintenant, l’intelligence artificielle (IA) est au cœur de l’actualité et des discussions professionnelles. Mais s’il est beaucoup question d’IA et de machine learning, appliqués aux moteurs de recherche grand public, aux outils de traduction ou encore aux outils de veille, elle se fait plus discrète pour tout ce qui a trait à l’information scientifique et technique et les brevets. Et pourtant, elle y est bien présente et mérite qu’on s’y intéresse.
Lors de la dernière réunion annuelle du CFIB, le Club Francophone de l’Information Brevet, elle a d’ailleurs été au centre des discussions. L’une des présentations consacrée à l’intelligence artificielle et la propriété intellectuelle a ensuite fait l’objet d’un article très intéressant dans la lettre du CFIB.
Le livrable de veille constitue la partie visible du savoir-faire des professionnels de l’information. Le fond comme la forme y ont toute leur importance.
Il doit d’une part fournir des « informations de choix », à condition que les phases de sourcing, de recherche, de collecte et de sélection aient été bien menées. Il doit d’autre part être conçu et présenté dans le format le plus adéquat par rapport aux besoins de son destinataire, aussi bien au niveau de l’analyse des informations que de la mise en forme du contenu, rapidement lisible, pour susciter l’intérêt et la curiosité.
Depuis fort longtemps, un article scientifique publié était considéré comme une sorte de vérité révélée qu’il était indécent et malvenu de critiquer.
Le médecin chercheur Philippe Froguel rappelle dans un excellent article1 que, dans les années 1990, ayant remarqué au cours de l’expertise d’un article qu’il effectuait pour « Nature Genetics », et dont il a contesté l’un des résultats, le jugeant « impossible », ce fut lui et non pas le tricheur auteur de l’article qui fut sommé de s’expliquer.
Depuis les choses ont - heureusement - évolué et ce médecin chercheur signale qu’en 2006, et tout récemment encore, le gouvernement américain a mis en prison des fraudeurs qui avaient obtenu de manière indue des financements d’agences fédérales.
Comme chaque année, la journée utilisateurs a réuni un nombre important de clients de STN qui ont pu assister à des présentations denses et très intéressantes.
L’un des exposés concernait les publications défensives, un sujet dont on parle peu souvent et pour lequel STN est un des rares à disposer d’une offre conséquente.
Ces publications défensives font partie de l’univers des brevets dans la mesure où elles concernent des inventions qui pourraient a priori être brevetées et ce, quel que soit le domaine technique.