KI trainieren oder nicht? Die Frage

Die Zunahme von Urheberrechtsausnahmen für KI-Training

In den letzten Jahren haben immer mehr Länder Ausnahmen in ihren Urheberrechtsgesetzen geschaffen, die speziell das Text- und Data-Mining durch KI-Unternehmen erleichtern sollen. Diese Ausnahmen zielen darauf ab, Innovationen im Bereich der künstlichen Intelligenz zu fördern, indem sie es LLMs ermöglichen, auf riesigen Datenmengen trainiert zu werden, ohne dass eine explizite Genehmigung jedes Urheberrechtsinhabers erforderlich ist.

Singapur beispielsweise änderte sein Urheberrechtsgesetz im Jahr 2021, um eine solche Ausnahme zu schaffen. Dieser Schritt ebnete den Weg für KI-Entwickler im Land, auf urheberrechtlich geschützte Werke zuzugreifen und sie zum Zwecke des Trainings ihrer Modelle zu verarbeiten. Nun erwägen andere Gerichtsbarkeiten in Asien, darunter Hongkong und Indonesien, ähnliche Gesetzesänderungen.

Die chinesische Perspektive: Ein wegweisender Verletzungsfall

China, ein wichtiger Akteur in der globalen KI-Landschaft, setzt sich ebenfalls mit den Komplexitäten des Urheberrechts im Zeitalter der LLMs auseinander. Ein wegweisender Fall, iQiyi vs. MiniMax, hat dieses Thema in den Fokus gerückt.

In diesem Fall verklagte iQiyi, eine bekannte Video-Streaming-Plattform, MiniMax, ein KI-Unternehmen, weil es angeblich urheberrechtlich geschütztes Videomaterial von iQiyi verwendet habe, um KI-Modelle ohne Genehmigung zu trainieren. Diese Klage stellt eine bedeutende Entwicklung dar, da es sich um Chinas ersten Fall einer Urheberrechtsverletzung durch ein Video-LLM handelt, der die wachsenden Bedenken hinsichtlich der unbefugten Nutzung urheberrechtlich geschützter Inhalte bei der Entwicklung von KI-Technologien unterstreicht.

Indiens Verlagsbranche stellt LLM-Trainingspraktiken in Frage

Die Debatte geht über Asien hinaus. In Indien haben mehrere Verlagshäuser rechtliche Schritte gegen LLM-Entwickler eingeleitet und behauptet, dass diese Modelle mit gescrapten Daten trainiert werden, die ihre urheberrechtlich geschützten Werke enthalten. Diese Fälle unterstreichen die Spannung zwischen dem Wunsch, die KI-Fähigkeiten voranzutreiben, und der Notwendigkeit, die Rechte des geistigen Eigentums von Urhebern zu schützen.

Über die einfache Aufnahme hinaus: Die Nuancen des LLM-Trainings

Die Herausforderungen, die das LLM-Training mit sich bringt, sind weitaus komplexer als nur der Akt der Aufnahme und Verarbeitung von Daten. Die indischen Fälle und die eng definierten Bestimmungen des singapurischen Gesetzes unterstreichen die Vielschichtigkeit dieses Problems.

Viele Inhaber von geistigem Eigentum schränken den Zugriff und die Nutzung ihrer urheberrechtlich geschützten Werke ausdrücklich ein, während andere einem solchen Zugriff und einer solchen Vervielfältigung nicht zustimmen. Eine beträchtliche Anzahl von Urhebern verlässt sich auf Lizenzmodelle als Kernbestandteil ihres Geschäfts, und die unbefugte Nutzung ihrer Werke für das KI-Training untergräbt diese Modelle direkt.

Darüber hinaus wirft die Tatsache, dass ein Großteil des Trainings in der Cloud stattfinden kann, komplexe Fragen der Gerichtsbarkeit auf. Die Bestimmung, welche Gesetze gelten, wenn Daten über internationale Grenzen hinweg verarbeitet werden, fügt einer ohnehin schon komplizierten Rechtslandschaft eine weitere Ebene der Komplexität hinzu.

Letztendlich dreht sich die Kernfrage darum, wie LLMs ihre Trainingsdaten sichern und ob und wie sie Urheberrechtsinhaber für deren Nutzung entschädigen sollten.

US-Urheberrechtsorganisationen lehnen gesetzliche Ausnahmen ab

Die Debatte ist nicht auf einzelne Länder beschränkt; sie hat auch auf die internationale Arena übergegriffen. Eine Koalition von fast 50 Handelsverbänden und Industriegruppen in den Vereinigten Staaten, bekannt als Digital Creators Coalition, hat starke Einwände gegen die Schaffung gesetzlicher Ausnahmen für das LLM-Training in Urheberrechtsgesetzen ohne Bestimmungen für Genehmigung oder Entschädigung erhoben.

Diese Organisationen haben Kommentare beim United States Trade Representative (USTR) eingereicht und die Behörde aufgefordert, dieses Problem in ihrem jährlichen Special 301-Bericht zu behandeln, der den Schutz des geistigen Eigentums und die Durchsetzungspraktiken weltweit untersucht. Die Koalition hat eine Liste von Ländern vorgelegt, die solche Ausnahmen eingeführt haben oder vorschlagen, und unterstreicht damit das globale Ausmaß dieser Besorgnis.

Die US-Debatte: OpenAIs Haltung und interne Widersprüche

Selbst innerhalb der Vereinigten Staaten ist die Debatte noch lange nicht abgeschlossen. OpenAI, das Unternehmen hinter dem beliebten ChatGPT, hat sich mit einem offenen Brief an das White House Office of Science and Technology zu Wort gemeldet.

In diesem Brief plädiert OpenAI für das Recht, Daten aus dem Internet unter dem Grundsatz der ‘Fair Use’ zu scrapen, und argumentiert damit effektiv für einen breiten Zugang zu urheberrechtlich geschütztem Material für Trainingszwecke. Paradoxerweise schlägt OpenAI jedoch auch vor, dass ausländische LLM-Entwickler daran gehindert werden sollten, dasselbe zu tun, möglicherweise durch die Anwendung von US-Exportrichtlinien. Diese Haltung offenbart einen internen Widerspruch, indem sie für sich selbst einen offenen Zugang fordert, während sie gleichzeitig versucht, den Zugang anderer einzuschränken.

Der Weg nach vorn: Eine anhaltende Debatte

Mit Blick auf das Jahr 2025 wird sich die Debatte über Urheberrecht und KI-Training mit Sicherheit verschärfen. Mit dem kontinuierlichen Aufkommen neuer LLMs auf der ganzen Welt wird der Bedarf an einem klaren und ausgewogenen Rechtsrahmen immer dringlicher.

Die aktuelle Rechtslandschaft ist ein Flickenteppich nationaler Gesetze, von denen einige explizite Ausnahmen für das KI-Training vorsehen, während andere solche Bestimmungen nicht enthalten. Diese Inkonsistenz schafft Unsicherheit sowohl für KI-Entwickler als auch für Urheberrechtsinhaber, behindert Innovationen und untergräbt potenziell die Rechte der Urheber.

Wichtige Überlegungen für einen ausgewogenen Rahmen:

  • Transparenz und Rechenschaftspflicht: LLM-Entwickler sollten transparent über die Datenquellen sein, die für das Training ihrer Modelle verwendet werden, und für jede unbefugte Nutzung urheberrechtlich geschützten Materials verantwortlich sein.
  • Faire Vergütung: Es sollten Mechanismen zur Vergütung von Urheberrechtsinhabern für die Nutzung ihrer Werke beim KI-Training untersucht werden. Dies könnte Lizenzvereinbarungen, kollektive Rechtewahrnehmung oder andere innovative Lösungen umfassen.
  • Internationale Harmonisierung: Bemühungen zur Harmonisierung der Urheberrechtsgesetze in Bezug auf das KI-Training in verschiedenen Gerichtsbarkeiten würden die Rechtsunsicherheit verringern und die grenzüberschreitende Zusammenarbeit erleichtern.
  • Ausgleich zwischen Innovation und Urheberrechten: Der Rechtsrahmen sollte ein Gleichgewicht zwischen der Förderung von Innovationen im Bereich der KI und dem Schutz der Rechte der Urheber herstellen. Dies erfordert eine sorgfältige Abwägung der verschiedenen Interessen, die auf dem Spiel stehen.
  • Die Rolle der ‘Fair Use’: Die Anwendbarkeit der Grundsätze der ‘Fair Use’ auf das KI-Training muss geklärt werden. Dies kann die Definition spezifischer Kriterien beinhalten, um festzustellen, ob die Nutzung urheberrechtlich geschützten Materials für Trainingszwecke als ‘Fair Use’ gilt.

Die anhaltende Diskussion über Urheberrecht und KI-Training unterstreicht die Herausforderungen bei der Anpassung bestehender Rechtsrahmen an sich schnell entwickelnde Technologien. Eine Lösung zu finden, die die Interessen aller Beteiligten in Einklang bringt, erfordert einen kontinuierlichen Dialog, Zusammenarbeit und die Bereitschaft, sich an die sich verändernde Landschaft des digitalen Zeitalters anzupassen. Die Zukunft der KI-Entwicklung und der Schutz kreativer Werke hängen möglicherweise vom Ausgang dieser entscheidenden Debatte ab. Die Frage des Trainings wird uns noch lange beschäftigen.