En février 2025, le tribunal fédéral du district du Delaware a rendu une décision historique concernant l’intersection entre l’intelligence artificielle et le droit d’auteur. L’affaire, Thomson Reuters Enterprise Centre GmbH contre Ross Intelligence Inc., impliquait deux acteurs majeurs du monde juridique et technologique et a créé un précédent qui donne le ton aux futurs litiges relatifs à l’entraînement de l’IA avec des contenus protégés par le droit d’auteur.
Contexte et antécédents de l’affaire
En mai 2020, Thomson Reuters a intenté une action en justice contre Ross Intelligence pour avoir utilisé sans autorisation du contenu éditorial de Westlaw, en particulier ses headnotes — des résumés juridiques rédigés par des éditeurs humains et organisés selon le système de classification « Key Number » — afin d’entraîner un moteur de recherche juridique basé sur l’intelligence artificielle.
Ross avait tenté initialement d’obtenir une licence, mais face au refus de Thomson Reuters, l’entreprise a acquis environ 25 000 Bulk Memos par l’intermédiaire du cabinet LegalEase. Ces mémos, rédigés par des avocats, reproduisaient fidèlement le contenu des headnotes de Westlaw et ont été utilisés pour l’entraînement de leur IA.
En septembre 2023, le juge Bibas (nommé par la Cour d’appel du Troisième Circuit) a partiellement rejeté les demandes de jugement sommaire, laissant la décision finale au jury. Cependant, il a révisé sa propre décision dans les mois précédant le procès et a permis le renouvellement des motions de jugement sommaire.
Le jugement du 11 février 2025
Le 11 février 2025, le juge Bibas a rendu une décision qui :
Accorde un jugement sommaire partiel à Thomson Reuters, déclarant que les headnotes étaient des œuvres originales protégées par le droit d’auteur, et que Ross en avait copié directement au moins 2 243.
Rejette tous les arguments de Ross, y compris celui de l’usage équitable (fair use), les considérant comme juridiquement infondés.
Ce jugement est considéré comme le premier cas aux États-Unis où un tribunal conclut explicitement que l’utilisation de contenu protégé par le droit d’auteur pour l’entraînement d’une IA ne relève pas de l’usage équitable.
Analyse des critères du fair use
Le tribunal a examiné les quatre facteurs légaux et a conclu ce qui suit :
But et nature de l’usage :
Usage commercial, Ross développant un produit concurrent à Westlaw.
Non transformatif, car il reproduisait la même fonction — la recherche juridique.
Nature de l’œuvre protégée :
Bien que les headnotes aient un faible degré de créativité, ils sont néanmoins originaux et protégés. Ce facteur a partiellement joué en faveur de Ross, sans être déterminant.
Quantité et substance de l’usage :
Ross a copié de manière massive, même si les résultats finaux ne contenaient pas directement les headnotes.
Cependant, l’usage était important et essentiel à la fonctionnalité, ce qui milite contre le fair use.
Impact sur le marché :
Ross a créé un substitut direct à Westlaw.
Cela a nui à la monétisation potentielle de licences pour l’entraînement d’IA. Ce facteur a été le plus critique et décisif.
Implications pour le secteur de l’IA
Ce jugement ouvre un nouveau chapitre juridique :
Un précédent pour d’autres litiges : des affaires similaires intentées par des auteurs, éditeurs ou entreprises technologiques contre OpenAI, Meta, Microsoft, etc., pourraient se référer à cette décision récente.
Distinction entre IA générative et non générative : bien que ce cas concerne une IA non générative, sa logique pourrait s’appliquer aux grands modèles de langage (LLMs).
Nécessité de licences explicites : même les contenus « intermédiaires » ou auxiliaires utilisés pour l’entraînement peuvent nécessiter un consentement préalable.
Inquiétudes à Wall Street : la décision a déjà suscité des alertes quant aux risques juridiques pour les investisseurs dans les entreprises du secteur de l’IA.
Ce que les entreprises innovantes et les développeurs d’IA peuvent en tirer
Examiner les licences et autorisations de toutes les données utilisées pour l’entraînement des modèles.
Évaluer les risques juridiques avant d’intégrer du contenu protégé ou concurrentiel.
Envisager des accords de licence avec les détenteurs de bases de données précieuses.
Mettre en œuvre des politiques d’audit sur la provenance des données d’entraînement.
