Auteurs(trice)
Associé, Propriété intellectuelle, Ottawa
Associé, Technologie, Toronto
Sociétaire, Propriété intellectuelle, Toronto
Key Takeaways
- Les enjeux juridiques fondamentaux concernant l’utilisation de matériel protégé par le droit d’auteur pour entraîner les modèles d’IA font actuellement l’objet de poursuites au Canada et aux États-Unis.
- Les causes en instance et les consultations menées par le gouvernement permettront aux tribunaux et aux élus de clarifier l’application des lois en matière de droit d’auteur au Canada à l’entraînement des systèmes d’IA et de moderniser la Loi sur le droit d’auteur.
- Les organisations spécialisées dans le développement de plateformes d’IA ou qui s’appuient sur ces modèles devraient vérifier les corpus de données et les sources utilisés pour l’entraînement de ces systèmes et suivre les avancées juridiques attendues en 2026 à cet égard.
Le récent essor fulgurant des technologies d’intelligence artificielle (IA) soulève des enjeux juridiques fondamentaux quant à la légalité de l’utilisation de contenus protégés par le droit d’auteur pour entraîner ces technologies. L’entraînement désigne le processus par lequel les systèmes d’IA s’instruisent en puisant dans de vastes corpus de données, qui contiennent souvent des textes ou des images protégés par le droit d’auteur, pour développer leurs capacités et générer de nouveaux résultats.
Au Canada, la dernière réforme majeure de la Loi sur le droit d’auteur remonte à 2012, bien avant l’essor des modèles d’IA multimodaux spécialisés en traitement du langage et des plateformes d’IA agentive qui s’imposent aujourd’hui. Nous abordons d’ailleurs ce sujet dans notre article publié dans Perspectives juridiques Osler. Plusieurs poursuites intentées aux États-Unis et au Canada – où les règles de droit en matière de droit d’auteur offrent des protections et des exceptions comparables en cas d’atteinte à ces droits – servent de banc d’essai pour déterminer dans quelle mesure les cadres législatifs actuels s’appliquent à l’IA. Les récentes consultations menées au Canada par le gouvernement fédéral concernant les effets de l’IA sur le matériel protégé par le droit d’auteur laissent également présager de possibles réformes.
À l’approche de 2026, il est raisonnable de s’attendre à ce que les tribunaux aux États-Unis et au Canada commencent à déterminer avec davantage de précision dans quelle mesure l’utilisation équitable peut s’appliquer à l’entraînement des modèles d’IA. Par ailleurs, les récentes consultations menées par le gouvernement fédéral pourraient influer sur des modifications législatives visant à moderniser la Loi sur le droit d’auteur du Canada dans un monde de plus en plus façonné par l’IA. Ces orientations pourraient influencer notablement l’évolution de l’IA au Canada, notamment les sites et méthodes d’entraînement des modèles, ainsi que les paramètres d’utilisation responsable de ces technologies dans les divers secteurs du pays.
Point de convergence entre l’entraînement des modèles d’IA et les contenus protégés par le droit d’auteur
Aujourd’hui, le progrès de l’intelligence artificielle dépend de l’exploitation de vastes corpus de données, souvent constitués de matériel protégé par le droit d’auteur. Au cours des dernières années, l’accent a été mis sur le développement rapide de grands modèles de langage (GML). Toutefois, le paysage de l’IA s’étend au-delà des modèles reposant sur le texte. La tendance dominante depuis les 18 derniers mois est le développement de systèmes multimodaux, capables de traiter et d’intégrer plusieurs types de données (texte, images, fichiers audio et vidéo) afin de produire des résultats plus complets et précis.
Le passage à l’IA multimodale accentue les défis de droit d’auteur liés à l’utilisation de données pour l’entraînement des modèles. Outre les œuvres littéraires et artistiques, d’autres créations protégées par la Loi sur le droit d’auteur, comme les enregistrements sonores, les œuvres cinématographiques et les droits des artistes-interprètes sont également concernés, avec leurs droits et exemptions propres. Alors que les développeurs se font concurrence pour créer des modèles d’IA de plus en plus performants, les questions juridiques relatives à la provenance des données, à leur propriété et à leur utilisation en toute légalité deviennent plus pressantes.
La doctrine de l’utilisation équitable au Canada et de l’usage loyal aux États-Unis
La doctrine américaine de l’usage loyal (fair use) et la doctrine canadienne de l’utilisation équitable sont comparables. Toutes deux constituent des moyens de défense ou des exceptions souvent invoqués en cas d’allégation de violation du droit d’auteur. Par conséquent, les récentes décisions des tribunaux aux États-Unis pourraient avoir une incidence sur l’interprétation des principes juridiques qui façonneront la jurisprudence au Canada.
Les œuvres originales bénéficient de la protection du droit d’auteur dès qu’elles sont exprimées sous une forme tangible. Le titulaire de ce droit peut notamment, de façon exclusive, produire, reproduire, publier ou exécuter l’œuvre, en totalité ou en partie, ou autoriser d’autres personnes à le faire. Le titulaire peut également mettre des exemplaires de son œuvre à la disposition du public. Toute utilisation non autorisée de l’œuvre constitue une infraction au droit d’auteur.
Les doctrines de l’usage loyal et de l’utilisation équitable constituent des exceptions juridiques à la violation du droit d’auteur conçues pour établir un équilibre entre les droits des propriétaires d’œuvres protégés par le droit d’auteur et l’intérêt public à accéder à l’information et à exprimer sa créativité. Ces doctrines imposent aux tribunaux d’évaluer le caractère équitable d’une utilisation ou d’un usage en tenant compte de certains critères, notamment l’objectif de l’utilisation, la nature de l’œuvre, la quantité utilisée et les répercussions de l’œuvre originale sur le marché. Si l’utilisation ou l’usage est jugé équitable, il n’y a pas violation du droit d’auteur.
Aux États-Unis, la doctrine de l’usage loyal se distingue par sa portée ouverte et flexible; elle permet à tout objectif d’être admissible s’il est jugé loyal au regard des critères prévus par la loi. Cette souplesse permet de s’adapter aux nouvelles technologies et utilisations. Au Canada, la doctrine de l’utilisation équitable est limitée à des fins spécifiques prévues dans la Loi sur le droit d’auteur, notamment la recherche, l’étude privée, l’éducation, la parodie ou la satire, la critique ou la revue et le reportage d’actualité. Bien que les tribunaux canadiens interprètent ces fins de manière large et libérale, toute utilisation de matériel protégé par le droit d’auteur à d’autres fins demeure exclue de l’exception prévue par la doctrine de l’utilisation équitable.
La jurisprudence américaine initiale apporte un éclairage instructif
Aux États-Unis, plusieurs poursuites ont été intentées au sujet de l’utilisation de contenus protégés par le droit d’auteur dans l’entraînement de modèles et de solutions d’IA. Les décisions à venir dans deux causes en particulier pourraient influencer la manière dont les tribunaux et les parties au Canada aborderont ces enjeux émergents.
Dans le premier jugement [PDF; en anglais seulement] sur l’usage loyal de l’IA, Thomson Reuters reprochait à Ross Intelligence d’avoir utilisé des contenus protégés par le droit d’auteur lors de l’entraînement de son moteur de recherche juridique. Le tribunal fédéral du district a rejeté l’argument de défense de Ross s’appuyant sur la notion d’usage loyal, estimant que, même si deux des quatre critères d’usage loyal jouaient en faveur de Ross, les deux plus importants – soit l’objectif poursuivi par l’utilisation et la nature de l’utilisation, ainsi que son effet sur le marché –, examinés dans leur ensemble, pesaient en faveur de Thomson Reuters. L’usage de Ross était à des fins commerciales et les deux entreprises avaient employé le matériel en question à des fins très semblables. De plus, Ross cherchait à offrir un système concurrent susceptible de remplacer celui de Thomson Reuters.
À l’inverse, une action collective déposée par un groupe d’auteurs publiés alléguant qu’Anthropic avait violé le droit d’auteur des parties demanderesses, notamment en copiant leurs œuvres pour entraîner son système GML principal appelé Claude, a conduit le tribunal fédéral du district à prononcer un jugement [PDF; en anglais seulement] en faveur d’Anthropic. En effet, le tribunal a conclu que l’utilisation par Anthropic, à des fins d’entraînement du système Claude, de livres protégés par le droit d’auteur, quelle qu’en soit la provenance, et la numérisation des livres imprimés achetés à des fins de stockage interne, constituaient un usage loyal. En revanche, l’acquisition et la conservation d’exemplaires piratés ne répondaient pas au critère d’usage loyal.
La décision du tribunal reposait principalement sur trois constats. Premièrement, les parties demanderesses n’avaient ni allégué ni démontré que les résultats produits par le système Claude comprenaient des exemplaires portant atteinte au droit d’auteur ou une reproduction de passages substantiels de leurs œuvres. Deuxièmement, Anthropic avait déployé des dispositifs technologiques supplémentaires pour veiller à ce que les utilisateurs n’aient accès à aucun résultat portant atteinte au droit d’auteur. En dernier lieu, l’entraînement du système GML à partir des œuvres en question n’avait pas et ne pourrait avoir pour effet de remplacer la demande pour des copies des œuvres originales des parties demanderesses.
À la suite du prononcé de la décision, les parties sont parvenues à un règlement de 1,5 milliard de dollars américains, qui, sous réserve d’approbation, serait le plus important règlement public à ce jour dans une cause portant sur le droit d’auteur.
Causes canadiennes à surveiller
Plusieurs poursuites judiciaires reposant sur des allégations de même nature ont récemment été intentées au Canada.
Parmi ces procédures [PDF; en anglais seulement] figure une action collective déposée récemment en Colombie-Britannique concernant l’entraînement des systèmes GML de MosaicML Inc. Cette dernière ainsi que sa société mère, DataBricks Inc., y sont accusées d’avoir enfreint la Loi sur le droit d’auteur en procédant au téléchargement d’un corpus de données comprenant des livres piratés pour entraîner leurs systèmes GML et en ayant recours à un logiciel pour effacer les informations de gestion du droit d’auteur figurant sur ces livres téléchargés. Mosaic aurait également pris des mesures pour dissimuler son utilisation de matériel protégé par le droit d’auteur.
En Ontario, une autre action en justice [PDF; en anglais seulement] oppose plusieurs grands groupes médiatiques et éditeurs de presse canadiens à OpenAI, Inc. et ses sociétés affiliées, accusées d’avoir porté atteinte à leurs droits d’auteur. OpenAI est accusée d’avoir exploité illégalement du contenu protégé provenant des sites web et des applications web des parties plaignantes, de l’avoir intégré à des corpus de données et d’avoir utilisé ces données pour entraîner ChatGPT. OpenAI aurait également contourné les mesures technologiques de protection et violé les conditions d’utilisation des sites web des parties plaignantes.
Bien que ces causes soient encore embryonnaires et qu’aucune décision n’ait encore été rendue, elles sont une occasion de clarifier la manière dont la législation actuelle en matière de protection du droit d’auteur, notamment l’utilisation équitable, s’applique dans le contexte de l’entraînement de l’IA.
Consultations menées par le gouvernement du Canada
Depuis 2021, le gouvernement du Canada a procédé à deux consultations concernant les lois sur le droit d’auteur et leur application à l’IA. La consultation la plus récente était axée principalement sur l’utilisation de matériel protégé par le droit d’auteur dans l’entraînement des systèmes d’IA.
La période de consultation a pris fin en novembre 2024 et les résultats ont été synthétisés dans le rapport intitulé Consultation sur le droit d’auteur à l’ère de l’intelligence artificielle générative : Rapport sur ce que nous avons entendu, qui met en lumière les tensions manifestes entre les parties prenantes. D’un côté, les titulaires de droits réclamaient un cadre législatif pour que leur contenu créatif ne soit utilisé qu’avec leur consentement, avec la mention de leur nom et moyennant le versement d’une rémunération équitable. De l’autre côté, les utilisateurs, entre autres les concepteurs et entreprises dans le secteur de l’IA, s’inquiétaient du fait que des règles trop restrictives en matière de droit d’auteur risquent de freiner l’innovation et de nuire à la compétitivité du Canada dans l’économie mondiale de l’IA.
L’avenir du cadre canadien en matière de droit d’auteur dépendra probablement de la capacité du gouvernement à concilier ces intérêts concurrents. Les consultations ont permis de jeter les bases de modifications ciblées de la Loi sur le droit d’auteur, portant notamment sur les exceptions liées à l’exploration de textes et de données, les dispositions concernant l’utilisation équitable et la délimitation des droits et obligations dans le cadre de l’entraînement des modèles d’IA.
Répercussions immédiates pour les concepteurs de systèmes d’IA
Les orientations jurisprudentielles et politiques émergentes entraînent des répercussions immédiates pour les organisations spécialisées dans l’entraînement des systèmes d’IA. Ces organisations ont intérêt à examiner les corpus de données et les sources employées pour entraîner ou peaufiner les systèmes d’IA qu’elles développent ou concèdent sous licence, à effectuer une analyse des risques et à s’assurer que des mécanismes contractuels et de contrôle sont en place pour assurer la légalité de leur utilisation. Il est également recommandé de formuler des directives sur les risques découlant de l’utilisation des résultats provenant d’outils d’IA ayant été entraînés à partir de matériel protégé par le droit d’auteur, susceptibles de reproduire d’importantes portions de ce matériel.
Les clients et utilisateurs de systèmes d’IA s’intéressent de plus en plus à l’origine des corpus de données et aux droits associés aux informations utilisées pour entraîner les outils d’IA. Il est donc attendu des organisations qu’elles adoptent une communication plus prudente concernant l’entraînement de leurs systèmes d’IA, que ce soit dans leurs déclarations publiques ou leurs discussions avec les clients et autres parties prenantes, en veillant à concilier transparence et protection contre les risques auxquels l’organisation pourrait s’exposer sur le plan juridique.
Les organisations sont également amenées à revoir la manière dont elles répartissent les risques liés au respect du droit d’auteur et des données dans leurs contrats commerciaux. Par exemple, les fournisseurs de systèmes GML proposent un montant d’indemnisation limitée en cas de violation du droit d’auteur dans les résultats provenant des modèles, pour couvrir le risque de reproduction de contenu protégé par le droit d’auteur utilisé dans l’entraînement des systèmes. De leur côté, les clients cherchent à obtenir l’assurance que leurs données exclusives ne seront pas utilisées de nouveau à des fins d’entraînement. Les deux parties intensifient les négociations à l’égard des déclarations, des garanties et des indemnités concernant les droits relatifs aux corpus de données et aux réclamations de tiers. Tant que les lois en matière de protection du droit d’auteur ne sont pas clairement établies, les dispositions contractuelles demeurent un outil essentiel de gestion des risques.
En savoir plus sur notre équipe Propriété intellectuelle.
En savoir plusPerspectives
L’année à venir devrait permettre d’obtenir des éclaircissements, des orientations judiciaires et des réformes législatives qui entraîneront des répercussions importantes sur l’évolution des systèmes l’IA et des pratiques d’entraînement de ces modèles.
Les décisions rendues aux États-Unis pourraient influencer la manière dont les tribunaux du Canada traiteront ces nouveaux enjeux. À leur tour, les décisions rendues au Canada pourraient préciser la manière dont les principes actuels en matière de droit d’auteur s’appliquent à l’utilisation de matériel protégé par le droit d’auteur dans les corpus de données servant à entraîner les modèles, constituant ainsi les fondements juridiques pour d’éventuelles réformes législatives. Pendant que le gouvernement du Canada réfléchit aux prochaines étapes, les parties prenantes observeront attentivement si le Canada parviendra à élaborer un cadre prospectif en matière de droit d’auteur conciliant à la fois l’innovation et l’équité à l’ère de l’intelligence artificielle.


