You are currently viewing Kneschke contre LAION – Décision historique sur les exceptions TDM pour les données de formation de l’IA – Partie 2
Kneschke contre LAION Decision historique sur les exceptions TDM

Kneschke contre LAION – Décision historique sur les exceptions TDM pour les données de formation de l’IA – Partie 2

  • Auteur/autrice de la publication :
  • Post category:Avocat:
Image de MH de Pixabay

Dans la première partie de cet article sur la décision Kneschke contre LAION du tribunal régional allemand de Hambourg (« Tribunal »), nous avons exploré les principales conclusions de la Cour concernant l’étape opérationnelle dans un modèle d’IA générative, et la décision sur les exceptions pour les raisons scientifiques. recherche de textes et d’exploration de données (« TDM ») et reproductions temporaires. Maintenant, dans cette deuxième partie, nous nous concentrons sur l’opinion incidente complète de la Cour concernant l’exception commerciale TDM.

L’action contre LAION a été rejetée sur la base de l’exception TDM pour la recherche scientifique. Cependant, étant donné la portée limitée de la disposition, le débat récent s’est concentré sur l’exception plus large du TDM à d’autres fins (commerciales) prévue à l’art. 4 Directive DSM (article 44b UrhG). Il n’est pas surprenant que la Cour ait également examiné l’exception commerciale TDM, mais l’ampleur est frappante : remarque incidente occupe près de la moitié de l’ensemble du jugement.

Exception TDM commerciale généralement applicable aux ensembles de données de formation en IA

L’applicabilité de l’exception commerciale TDM à la collecte de données pour la formation (générative) à l’IA a été largement débattue. Cet art. L’article 53(1)(c) de la loi sur l’IA fait explicitement référence à l’exception TDM commerciale dans le contexte de la GPAI et l’IA générative est donc largement considérée comme une indication claire de l’intention du législateur européen selon laquelle l’exception couvre la collecte de données d’IA. Néanmoins, une étude récente menée pour le compte de l’Initiative des auteurs allemands s’oppose toujours à une demande. La Cour a rejeté les principaux arguments de l’étude :

  • TDM pour la formation en IA non distinct des autres TDM: L’étude affirme que l’IA « utilise » le contenu même d’une création intellectuelle sur laquelle elle a été formée, plutôt que de simplement analyser des données à des fins d’information. La Cour a rejeté cette idée, soulignant la distinction floue entre information et création « cachée » dans les données de formation.
  • Le potentiel de sortie « créative » de l’IA n’est pas pertinent: La Cour a rejeté l’argument selon lequel l’exception TDM ne devrait pas s’appliquer aux reproductions réalisées à des fins de formation à l’IA, car le « web scraping » conduit finalement à des produits créatifs concurrents. Comme la Cour l’a souligné, au moment de l’activité pertinente pour le TDM (reproduction lors de la création d’un ensemble de données), la formation n’a pas encore eu lieu, encore moins la génération de résultats (spécifiques) d’IA ; Par conséquent, l’intention générale d’obtenir ultérieurement des résultats générés par l’IA ne peut pas être pertinente pour l’évaluation juridique de la création d’un ensemble de données.
  • Aucune intention législative contraire (présumée): La Cour souligne que les évolutions pertinentes dans le domaine de l’IA depuis l’introduction de l’exception TDM de l’UE de 2019 concernent moins la nature et la portée de l’exploration de données, mais plutôt les performances de l’IA entraînée par les données. La Cour a également estimé qu’en faisant explicitement référence à l’exception TDM dans la loi sur l’IA de 2024, le législateur européen a « sans aucun doute exprimé » qu’elle couvre également la création d’ensembles de données destinés à la formation à l’IA.
  • Conformité aux tests en trois étapes: En vertu de la norme d’interprétation globale en trois étapes (prévue dans la législation internationale et européenne sur le droit d’auteur, voir l’article 5(5) de la directive InfoSoc, l’article 7(2) de la directive DSM), les exceptions au droit d’auteur ne devraient être appliquées que dans certains cas particuliers qui n’entrent pas en conflit avec l’exploitation normale du matériel protégé par le droit d’auteur et ne portent pas préjudice de manière déraisonnable aux intérêts légitimes du titulaire du droit. La Cour s’est concentrée sur les conflits potentiels entre les résultats de l’IA et les créations humaines, mais n’a pas examiné si l’application de l’exception TDM à la création d’ensembles de données pour la formation à l’IA générative répond également au test en trois étapes au niveau des entrées, c’est-à-dire en cas de conflit avec la possibilité pour les titulaires de droits d’exploiter leurs créations grâce à des licences comme matériel de formation.

La reproduction par LAION s’est avérée avoir été réalisée dans le but d’obtenir des informations sur les « corrélations » au sens du TDM de la Sect. 44b, paragraphe 1, de l’UrhG, car le téléchargement facilite la comparaison du contenu de l’image et de la description. Le manque de « conservation » (c’est-à-dire de filtrage) de l’ensemble de données par LAION n’est pas pertinent. Le matériel reproduit était également légalement accessible à LAION, puisque la photographie était accessible au public sur le site Web de l’agence de stockage de photos.

Conditions requises pour une désinscription efficace

Les reproductions ne sont autorisées au titre de l’exception commerciale TDM que si le titulaire des droits ne s’est pas réservé le droit. Pour le matériel disponible en ligne, une désinscription effective doit être exprimée sous une forme lisible par machine, Sect. 44b, paragraphe 3, UrhG, art. 4(3) de la directive DSM. Les conditions d’utilisation du site Web exploré stipulaient :

  • La désinscription peut être émise par le titulaire de la licence et revendiquée par l’auteur.: La Cour a déclaré qu’une option de non-participation peut également être effectivement déclarée par un titulaire de droits ultérieur, tel qu’un successeur légal ou un preneur de licence (ici : l’agence de photos). Kneschke pouvait également s’appuyer sur la désinscription de sa licence (non exclusive) pour faire valoir ses droits contre LAION, car seule l’agence était en mesure de mettre en œuvre une désinscription pour l’endroit où la photographie était disponible pour le web scraping (sur le site Web). site Internet de l’agence).
  • Il n’est pas nécessaire que la désinscription soit liée à une loi spécifique: LAION a fait valoir que, puisque les conditions avaient déjà été mises en œuvre en janvier 2021, la clause de réserve n’aurait pas pu être rédigée compte tenu de l’exception commerciale TDM actuelle de la Sect. 44b UrhG, qui n’est entré en vigueur qu’en juin 2021. La Cour a précisé qu’il n’est pas nécessaire de déclarer un opt-out pour une version spécifique de la loi.
  • Une formulation suffisamment claire: Comme la Cour l’a souligné, le modèle juridique de l’UE pour l’exception commerciale TDM de l’art. 4(3) de la directive DSM exige que l’utilisation soit « expressément » réservée. Bien que le libellé de la Sect. 44b UrhG n’inclut pas ce critère, l’« exigence d’expressivité » doit néanmoins être prise en compte pour garantir la conformité avec le droit de l’UE. La Cour a précisé que l’opt-out doit () être explicitement déclaré (les réserves implicites sont insuffisantes) et (ii.) être suffisamment précis pour couvrir sans ambiguïté un contenu spécifique (également satisfait par une réserve pour tous fonctionne sur un site Internet) et usage spécifique (la Cour a estimé que la clause répondait « facilement » à cette exigence). Une mention explicite de « fouille de textes et de données » ou de « reproductions » n’est donc pas requise.
  • La désinscription en langage naturel peut être lisible par machine: La Cour a indiqué que l’opt-out dans les conditions d’utilisation satisfaisait à l’exigence d’être « lisible par machine ». La question de savoir si une option de non-participation efficace, c’est-à-dire lisible par machine, est en place est d’une importance capitale lors de la collecte de données pour la formation à l’IA ; la désobéissance entraîne une violation du droit d’auteur et, en raison de l’obligation de l’art. 53(1)(c) de la Loi sur l’IA, et expose tout fournisseur exerçant des activités dans l’Union européenne à des amendes (jusqu’à 3 % du chiffre d’affaires mondial annuel total du fournisseur ou 15 millions d’euros, le montant le plus élevé étant retenu, art. 101(1)(c). a) AI Act) et d’autres mesures coercitives, telles que le retrait du modèle du marché européen. Ces conséquences juridiques en vertu de la loi sur l’IA ne sont pas pertinentes pour LAION en ce qui concerne son ensemble de données (car elle n’est pas le fournisseur au sens de l’article 3, paragraphe 3, de la loi sur l’IA des modèles GPAI formés sur l’ensemble de données par des tiers). parties), mais doit être observé par tout acteur commercial menant son propre TDM pour la formation des modèles d’IA.

Le fait qu’un droit de non-participation efficace puisse être prévu dans les conditions générales d’un site Web est déjà reconnu dans le considérant 18 de la directive DSM. Mais ce qui constitue la lisibilité automatique reste une question ouverte. Alors que l’opinion dominante considère que les langues naturelles (humaines) des réserves sont pas lisible par machine au sens de l’exception TDM, privilégiant des solutions comme robots.txt et métadonnées, la Cour adopte un point de vue opposé.

La Cour justifie la non-participation au langage naturel comme étant « compréhensible par une machine » avec la loi sur l’IA. Le raisonnement de la Cour est le suivant : Art. L’article 53(1)(c) de la loi sur l’IA exige que les fournisseurs de modèles GPAI mettent en place une politique pour se conformer aux clauses de non-participation au TDM « y compris par le biais de technologies de pointe ». Bien qu’il n’y ait pas de telles précisions dans la loi, la Cour a fait valoir que ces technologies « affirment que l’exception commerciale TDM ne devrait pas permettre aux fournisseurs de modèles d’IA de développer des modèles de compréhension de texte « de plus en plus puissants » sans les obliger à utiliser l’IA existante pour détecter les phénomènes naturels. désinscriptions linguistiques. La causalité supposée de ce nouvel argument entre le développement de l’IA et un seuil abaissé de lisibilité automatique est peut-être trop simpliste. Toutes les entités qui forment l’IA dans le cadre de l’exception TDM ne le font pas pour développer des modèles d’IA maîtrisant le texte. Il ne ressort pas non plus du terme machine-la lisibilité signifie qu’il suffit aux applications d’IA (hautement spécifiées) de comprendre le texte, plutôt que que la déclaration soit techniquement codée et exécutable par une machine, c’est-à-dire un logiciel d’exploration. Pour éviter tout conflit avec la compréhension plus étroite d’un format lisible par machine dans la directive (UE) 2019/1024 (Considérant 35 : facilement identifiable, reconnaissable et extractible pour les applications logicielles), la Cour a soutenu qu’une définition uniforme dans toutes les directives n’était pas nécessaire.

Bien que le plaignant ne l’ait pas prouvé, le tribunal a vu des indications selon lesquelles LAION disposait en 2021 d’une technologie appropriée et était capable de reconnaître automatiquement les opt-out en langage naturel.

Perspectives

La décision peut faire l’objet d’un recours devant le tribunal régional supérieur de Hambourg, puis devant la Cour fédérale de justice (BGH). Compte tenu des questions juridiques fondamentales en jeu et de l’ambiguïté de la loi, cette affaire pourrait en effet parvenir jusqu’au BGH, qui pourrait saisir la CJCE pour une décision préjudicielle, notamment sur une interprétation uniforme de la lisibilité automatique des opt-outs.

Pour les entités qui pourraient être classées comme fournisseurs de modèles GPAI en vertu de la loi sur l’IA (ce qui n’est pas le cas de LAION ou d’autres référentiels d’ensembles de données, car ils ne sont pas les fournisseurs de modèles formés avec ces données par des tiers), un tel droit d’auteur Une clarification spécifique arriverait trop tard en termes de respect de la loi sur l’IA, car leur obligation liée aux produits d’IA de respecter les opt-outs TDM s’applique généralement à partir d’août 2025 (conformément au considérant 106 non contraignant de la loi sur l’IA, même pour la formation). activités menées en dehors de l’UE). Par conséquent, les fournisseurs de modèles GPAI chercheront à obtenir des éclaircissements spécifiques à la loi sur l’IA au cours du processus en cours d’élaboration de codes de bonnes pratiques sous la direction du Bureau européen de l’IA.

Les auteurs souhaitent remercier João Pedro Quintais pour ses commentaires les plus précieux sur cet article.