La controverse a éclaté en Hongrie, où la maison d’édition Like Company, spécialisée dans le contenu SEO et l’actualité régionale sur le lac Balaton, a poursuivi Google pour violation présumée du droit d’auteur.
Le litige est né d’un article publié sur son site web balatonkornyeke.hu, qui détaillait le chanteur hongrois Kozso et sa proposition inhabituelle d’introduire des dauphins dans le lac. Ce contenu a ensuite été résumé par le chatbot Gemini, à la demande d’un utilisateur souhaitant un résumé en hongrois de l’article.
L’éditeur a considéré la réponse du chatbot comme un acte de reproduction non autorisé, ainsi qu’une divulgation publique de son contenu protégé. De plus, il a affirmé que son travail avait été utilisé pour entraîner le modèle d’IA, ce qui constituerait une nouvelle violation.
Les clés du conflit juridique
Ce procès soulève de multiples questions juridiques qui doivent désormais être tranchées par la CJUE par voie de décision préjudicielle, afin d’harmoniser l’interprétation du droit d’auteur européen. Parmi les questions soulevées figurent :
1. La production d’un chatbot constitue-t-elle une communication publique ?
La génération d’un résumé similaire au texte original peut-elle être considérée comme un acte de communication publique, même si le contenu est créé par un modèle prédictif ?
2. La formation modèle LLM porte-t-elle atteinte au droit d’auteur ?
L’analyse et l’apprentissage à partir de textes protégés pour former un modèle d’IA sont-ils équivalents à une reproduction non autorisée ?
3. L’exception d’exploration de texte peut-elle être appliquée ?
Si une reproduction est considérée comme ayant eu lieu, pourrait-elle être couverte par l’exception prévue pour l’exploration de textes et de données (TDM) si les sources étaient légalement accessibles ?
4. La sortie du chatbot est-elle une nouvelle reproduction ?
Lorsqu’un modèle génère un texte qui reproduit une partie d’une œuvre protégée, est-ce considéré comme une nouvelle reproduction au sens juridique du terme ?
Le rôle de l’exploration de données et du modèle RAG
Ce cas met également en lumière le débat sur l’utilisation de technologies telles que la génération augmentée de contenu (RAG), qui combine la recherche active d’informations en temps réel (par exemple, sur Google Search) et la génération de contenu à partir de celle-ci.
Contrairement à l’apprentissage traditionnel, qui se déroule en amont et de manière isolée, la RAG permet au modèle d’utiliser des sources externes pour générer une réponse. Dans le cas de l’article hongrois, le résumé du chatbot pourrait ne pas provenir du processus d’apprentissage, mais d’une requête en temps réel sur la page d’origine.
Cette nuance complique l’attribution des responsabilités : le chatbot est-il un simple intermédiaire ou agit-il comme un agent actif reproduisant du contenu ?
Les enjeux de la propriété intellectuelle
Au-delà de la résolution de cette affaire spécifique, la CJUE est confrontée à des questions fondamentales qui façonneront l’avenir de la propriété intellectuelle à l’ère de l’IA :
L’IA doit-elle être considérée comme un outil de reproduction ?
Un modèle de langage peut-il être assimilé à une base de données ?
Quel est le niveau d’originalité requis pour les contenus générés par l’IA ?
Quelles limites faut-il imposer à l’exploration de données ?
Les réponses à ces questions auront un impact direct sur les éditeurs, les plateformes technologiques, les professionnels du droit et, bien sûr, sur la création de contenus numériques.
Conclusion
L’affaire Hongrie contre Google n’est pas seulement un affrontement entre une maison d’édition et un géant technologique. Elle illustre clairement le fossé réglementaire et interprétatif qui persiste en Europe concernant l’intelligence artificielle et la propriété intellectuelle.
