Meta: Klage wegen KI-Training in Frankreich

Vorwürfe der Urheberrechtsverletzung

Meta Platforms Inc., der Technologiegigant, sieht sich in Frankreich mit einer Klage von Verlegern und Autoren konfrontiert. Der Kern des Streits liegt in den Vorwürfen der Urheberrechtsverletzung. Die Kläger behaupten, dass Meta ihre literarischen Werke unerlaubt genutzt habe, um sein generatives Modell der künstlichen Intelligenz (KI) zu trainieren, ohne die erforderliche Genehmigung einzuholen.

Die Kläger und ihre Beschwerden

Die Klage wurde bei einem Pariser Gericht eingereicht, das speziell für Fragen des geistigen Eigentums zuständig ist. Diese Klage wurde von einer Koalition initiiert, die sich aus dem SNE, dem Fachverband, der prominente französische Verlage wie Hachette und Editis vertritt, sowie der Autorengesellschaft SGDL und der Autorengewerkschaft SNAC zusammensetzt. Diese Organisationen repräsentieren gemeinsam einen wesentlichen Teil der französischen Literaturlandschaft.

Während einer Pressekonferenz gab die Gruppe bekannt, dass sie überzeugende Beweise für ‘massive’ Urheberrechtsverletzungen gesammelt habe. Vincent Montagne, Präsident des SNE, erklärte, dass sie zuvor versucht hätten, mit Meta in dieser Angelegenheit in Kontakt zu treten, ihre Bemühungen jedoch erfolglos blieben. Darüber hinaus wurde die Europäische Kommission benachrichtigt, wobei die Kläger behaupten, dass Metas Handlungen in direktem Widerspruch zu den EU-Vorschriften für KI stehen.

Der Kern des Streits: KI-Training und Urheberrecht

Im Mittelpunkt dieser rechtlichen Auseinandersetzung steht die Praxis des Trainings generativer KI-Sprachmodelle. Modelle wie Metas Llama und OpenAIs ChatGPT werden mit riesigen Mengen an Textdaten trainiert, die eine Vielzahl von Quellen umfassen, darunter Bücher und Artikel. Diese Praxis hat eine weltweite Welle von Klagen ausgelöst, da Content-Publisher geltend machen, dass die Verwendung ihres geistigen Eigentums zum Trainieren von KI-Modellen einem Diebstahl gleichkommt.

Die Unternehmen, die diese KI-Modelle entwickeln, haben sich im Allgemeinen zurückhaltend gezeigt, die genauen Quellen ihrer Trainingsdaten offenzulegen. Sie haben sich jedoch oft auf die ‘Fair Use’-Doktrin nach US-amerikanischem Urheberrecht als Verteidigung berufen.

Ein globaler Trend von Rechtsstreitigkeiten

Die Klage gegen Meta ist kein Einzelfall. Sie ist Teil eines breiteren Trends von Rechtsstreitigkeiten gegen KI-Unternehmen wegen der Verwendung von urheberrechtlich geschütztem Material für Trainingszwecke.
Hier sind einige andere bemerkenswerte Fälle:

  • Im Dezember 2023 leitete die New York Times rechtliche Schritte gegen OpenAI und Microsoft Corp. ein und warf ihnen die unbefugte Nutzung ihrer Artikel zum Trainieren von Large-Language-Models vor.
  • Im April 2024 reichte eine Gruppe von Autoren eine Sammelklage gegen Anthropic ein, ein von Amazon.com Inc. unterstütztes Unternehmen. Die Autoren behaupteten, dass ihre Bücher ohne ihre Zustimmung zum Trainieren des KI-Modells von Anthropicverwendet wurden.
  • Indische Buchverleger reichten im Januar eine ähnliche Klage gegen OpenAI ein, was den globalen Charakter dieses Rechtsproblems unterstreicht.

Vertiefung der rechtlichen Argumente

Die rechtlichen Argumente in diesen Fällen hängen oft von der Auslegung des Urheberrechts und der Anwendbarkeit der ‘Fair Use’-Doktrin ab. Das Urheberrecht gewährt Urhebern von Originalwerken ausschließliche Rechte, einschließlich des Rechts auf Vervielfältigung, Verbreitung und Erstellung abgeleiteter Werke. Die ‘Fair Use’-Doktrin sieht jedoch bestimmte Ausnahmen von diesen ausschließlichen Rechten vor und erlaubt die eingeschränkte Nutzung von urheberrechtlich geschütztem Material für Zwecke wie Kritik, Kommentar, Berichterstattung, Lehre, Wissenschaft oder Forschung.

Die zentrale Frage ist, ob die Verwendung von urheberrechtlich geschütztem Material zum Trainieren von KI-Modellen unter den Begriff ‘Fair Use’ fällt. KI-Unternehmen argumentieren, dass ihre Nutzung transformativ ist, d.h. dass sie dem Originalwerk etwas Neues und Anderes hinzufügt, und dass sie den Markt für das Originalwerk nicht schädigt. Content-Publisher hingegen argumentieren, dass die Nutzung nicht transformativ ist, dass sie kommerzieller Natur ist und dass sie den Markt für ihre Werke potenziell schädigen könnte.

Die möglichen Auswirkungen

Der Ausgang dieser Rechtsstreitigkeiten könnte erhebliche Auswirkungen auf die Zukunft der KI-Entwicklung und der Kreativwirtschaft haben. Wenn Gerichte zugunsten der Content-Publisher entscheiden, könnte dies KI-Unternehmen dazu zwingen, Lizenzen für die Nutzung von urheberrechtlich geschütztem Material einzuholen, was möglicherweise die Kosten für die Entwicklung von KI-Modellen erhöhen würde. Es könnte auch zu mehr Transparenz hinsichtlich der Quellen von Trainingsdaten führen.

Wenn Gerichte hingegen zugunsten der KI-Unternehmen entscheiden, könnte dies sie ermutigen, weiterhin urheberrechtlich geschütztes Material ohne ausdrückliche Genehmigung zu verwenden, was möglicherweise zu weiteren rechtlichen Schritten und ethischen Debatten führen könnte.

Der breitere Kontext: KI, Ethik und geistiges Eigentum

Dieser Rechtsstreit betrifft nicht nur das Urheberrecht, sondern berührt auch umfassendere ethische Fragen im Zusammenhang mit der KI-Entwicklung. Es werden Fragen zur Fairness der Verwendung von urheberrechtlich geschütztem Material ohne Entschädigung aufgeworfen, um KI-Modelle zu trainieren, die potenziell erhebliche Gewinne für die Unternehmen generieren könnten, die sie entwickeln.

Es gibt auch Bedenken hinsichtlich des Potenzials von KI-generierten Inhalten, menschliche Schöpfer zu verdrängen, was zu Arbeitsplatzverlusten und einem Rückgang der Qualität und Vielfalt kreativer Werke führen könnte.

Erweiterung der ‘Fair Use’-Verteidigung

Die ‘Fair Use’-Verteidigung, auf die sich KI-Unternehmen häufig berufen, ist eine komplexe Rechtsdoktrin mit einem Vier-Faktoren-Test, der von US-Gerichten verwendet wird, um ihre Anwendbarkeit zu bestimmen:

  1. Zweck und Charakter der Nutzung: Dieser Faktor berücksichtigt, ob die Nutzung kommerziell oder nichtkommerziell, transformativ oder derivativ ist. Transformative Nutzungen, die dem Originalwerk etwas Neues und Anderes hinzufügen, werden eher als ‘Fair Use’ betrachtet.

  2. Die Art des urheberrechtlich geschützten Werks: Dieser Faktor berücksichtigt, ob das urheberrechtlich geschützte Werk faktisch oder kreativ ist. Faktische Werke, wie z. B. Nachrichtenartikel, genießen im Allgemeinen weniger Schutz als kreative Werke, wie z. B. Romane.

  3. Umfang und Wesentlichkeit des verwendeten Teils: Dieser Faktor berücksichtigt, wie viel des urheberrechtlich geschützten Werks verwendet wurde und ob der verwendete Teil das ‘Herz’ des Werks war. Die Verwendung eines kleinen Teils eines Werks wird eher als ‘Fair Use’ betrachtet als die Verwendung eines großen Teils oder des wichtigsten Teils des Werks.

  4. Die Auswirkung der Nutzung auf den potenziellen Markt für oder den Wert des urheberrechtlich geschützten Werks: Dieser Faktor berücksichtigt, ob die Nutzung des urheberrechtlich geschützten Werks den Markt für das Originalwerk schädigt oder seinen Wert mindert. Nutzungen, die den Markt für das Originalwerk nicht schädigen, werden eher als ‘Fair Use’ betrachtet.

Die Anwendung dieser Faktoren auf das KI-Training ist eine neuartige Rechtsfrage, und die Gerichte ringen noch immer damit, wie sie in diesem Zusammenhang zu interpretieren sind.

Die europäische Perspektive

Die Klage in Frankreich unterstreicht auch die Unterschiede im Urheberrecht und in der KI-Regulierung zwischen den Vereinigten Staaten und der Europäischen Union. Die EU verfolgt einen proaktiveren Ansatz zur Regulierung von KI, mit dem Ziel sicherzustellen, dass KI-Systeme so entwickelt und genutzt werden, dass die Grundrechte, einschließlich des Urheberrechts, gewahrt bleiben.

Der EU-AI Act, der derzeit fertiggestellt wird, enthält Bestimmungen, die sich auf die Verwendung von urheberrechtlich geschütztem Material für das KI-Training auswirken könnten. Diese Bestimmungen könnten KI-Unternehmen verpflichten, die Zustimmung der Rechteinhaber einzuholen, bevor sie ihre Werke für Trainingszwecke verwenden, oder sie könnten ein System der Vergütung für die Nutzung von urheberrechtlich geschütztem Material einführen.

Unterschiedliche Perspektiven der Stakeholder

Dieses Thema betrifft eine Vielzahl von Stakeholdern, die jeweils ihre eigenen Perspektiven und Interessen haben:

  • Content-Ersteller: Autoren, Verleger und andere Content-Ersteller sind daran interessiert, ihre Rechte an geistigem Eigentum zu schützen und sicherzustellen, dass sie für die Nutzung ihrer Werke angemessen entschädigt werden.
  • KI-Unternehmen: KI-Unternehmen streben die Entwicklung innovativer KI-Modelle an und argumentieren, dass der Zugang zu großen Datenmengen, einschließlich urheberrechtlich geschütztem Material, für diesen Zweck unerlässlich ist.
  • Die Öffentlichkeit: Die Öffentlichkeit hat sowohl ein Interesse an der Entwicklung nützlicher KI-Technologien als auch am Schutz kreativer Werke.
  • Juristen: Anwälte und Rechtswissenschaftler setzen sich mit den komplexen Rechtsfragen auseinander, die durch KI und Urheberrecht aufgeworfen werden.
  • Regulierungsbehörden: Regierungen und Regulierungsbehörden versuchen, ein Gleichgewicht zwischen der Förderung von Innovation und dem Schutz der Rechte von Urhebern herzustellen.

Mögliche zukünftige Entwicklungen

Die Rechtslandschaft rund um KI und Urheberrecht entwickelt sich rasant. Es ist wahrscheinlich, dass wir in den kommenden Jahren weitere Rechtsstreitigkeiten und regulatorische Entwicklungen sehen werden. Einige mögliche zukünftige Entwicklungen sind:

  • Neue Gesetzgebung: Regierungen könnten neue Gesetze erlassen, die sich speziell mit der Verwendung von urheberrechtlich geschütztem Material für das KI-Training befassen.
  • Gerichtsentscheidungen: Gerichte werden weiterhin Urteile in Fällen fällen, die KI und Urheberrecht betreffen, und so weitere Hinweise zur Auslegung bestehender Gesetze geben.
  • Industriestandards: KI-Unternehmen und Content-Ersteller könnten Industriestandards oder bewährte Verfahren für die Verwendung von urheberrechtlich geschütztem Material beim KI-Training entwickeln.
  • Technische Lösungen: Es könnten technische Lösungen wie Wasserzeichen oder digitale Rechteverwaltung entwickelt werden, um die Verwendung von urheberrechtlich geschütztem Material beim KI-Training zu verfolgen und zu verwalten.
  • Lizenzvereinbarungen: KI-Unternehmen könnten beginnen, Lizenzvereinbarungen mit Inhaltserstellern abzuschließen, bevor sie die Inhalte zum Trainieren ihrer Modelle verwenden.

Der Rechtsstreit zwischen Meta und französischen Verlegern ist eine bedeutende Entwicklung in der laufenden Debatte über KI und Urheberrecht. Der Ausgang dieses Falls und anderer ähnlicher Fälle wird die Zukunft der KI-Entwicklung und der Kreativwirtschaft auf Jahre hinaus prägen. Die Komplexität von ‘Fair Use’, internationale Rechtsunterschiede und die umfassenderen ethischen Implikationen werden weiterhin diskutiert und verfeinert, während die KI-Technologie fortschreitet.