Meta: Klage wegen KI-Trainingsdaten

Eine aktuelle Gerichtsentscheidung verpflichtet Meta, die Muttergesellschaft von Facebook und Instagram, sich mit Vorwürfen auseinanderzusetzen, dass das Unternehmen Copyright Management Information (CMI) aus Materialien entfernt hat, die zum Trainieren seiner Artificial Intelligence (AI)-Modelle verwendet wurden. Diese Entscheidung resultiert aus einer Sammelklage der Autoren Richard Kadrey, Sarah Silverman und Christopher Golden, die behaupten, dass Metas Verwendung ihrer urheberrechtlich geschützten Werke für das KI-Training rechtswidrig war.

Der Kern der Anschuldigung: Entfernung von CMI

Die Klage, Kadrey et al. vs Meta Platforms, nahm im Januar 2025 eine entscheidende Wendung, als die Kläger geltend machten, dass Meta nicht nur von der Verwendung urheberrechtlich geschützten Materials wusste, sondern auch, dass seine KI-Modelle folglich Ausgaben mit CMI erzeugen würden. CMI umfasst wichtige Details zu urheberrechtlich geschützten Werken, wie die Identität des Urhebers, Lizenzbedingungen, Erstellungsdatum und andere relevante Informationen.

Das Hauptargument der Kläger ist, dass Meta diese CMI absichtlich aus den Trainingsmaterialien entfernt hat. Der Zweck, so behaupten sie, bestand darin, die Tatsache zu verschleiern, dass die KI-generierten Ausgaben aus urheberrechtlich geschützten Quellen stammten. Dieser angebliche Akt der Entfernung bildet die Grundlage für die Behauptung, dass Meta gegen den Digital Millennium Copyright Act (DMCA) verstoßen hat.

Entscheidung des Richters: DMCA-Klage wird fortgesetzt

Richter Vince Chhabria, der den Fall vor einem Bundesgericht in San Francisco verhandelt, entschied, dass die Klage der Kläger bezüglich des DMCA-Verstoßes fortgesetzt werden kann. Diese Entscheidung erhöht die Wahrscheinlichkeit, dass der Fall entweder in einem Vergleich endet oder vor Gericht verhandelt wird.

In seiner Anordnung erklärte Richter Chhabria, dass die Anschuldigungen der Kläger eine “vernünftige, wenn auch nicht besonders starke Schlussfolgerung” zuließen, dass Meta CMI entfernt habe, um zu verhindern, dass seine Llama-KI-Modelle CMI ausgeben und somit die Verwendung von urheberrechtlich geschütztem Material beim Training offenbaren. Er betonte ferner, dass diese Verwendung von urheberrechtlich geschütztem Material eine klar identifizierbare (angebliche) Rechtsverletzung darstelle.

Metas Eingeständnis und der Books3-Datensatz

Meta hat eingeräumt, einen Datensatz namens Books3 für das Training seines Large Language Model Llama 1 verwendet zu haben. Dieser Datensatz wurde als urheberrechtlich geschützte Werke enthaltend identifiziert, was die Behauptungen der Kläger untermauert.

Teilweise Abweisung von Klagepunkten

Während die DMCA-Klage fortgesetzt wird, wies Richter Chhabria einen der Klagepunkte der Kläger ab. Dieser abgewiesene Klagepunkt behauptete, dass Metas Verwendung von nicht lizenzierten Büchern, die über Peer-to-Peer-Torrents für das Llama-Training bezogen wurden, gegen den kalifornischen Comprehensive Computer Data Access & Fraud Act (CDAFA) verstoße.

Expertenmeinung: DMCA-Klage und Fair Use

Edward Lee, Professor für Recht an der Santa Clara University, warnte davor, allein aufgrund der DMCA-Klage im Zusammenhang mit den entfernten CMI Rückschlüsse auf Fair Use zu ziehen. Er wies auf die von Richter Chhabria geäußerte Skepsis hinsichtlich der Fähigkeit der Kläger hin, die DMCA-Klage zu beweisen, und schlug die Möglichkeit vor, sie im Rahmen eines summarischen Urteils erneut zu prüfen. Lee hob hervor, dass die Anwälte der Kläger erfolgreich eine spezifischere Tatsachengrundlage für ihre DMCA-Klage identifiziert hätten, die zuvor abgewiesen worden war.

Auswirkungen auf andere KI-bezogene Rechtsstreitigkeiten

Der Fortgang der CMI-Klage gegen Meta, zusammen mit einer früheren Entscheidung zugunsten von Thomson Reuters gegen Ross Intelligence, deutet auf eine mögliche Verschiebung in der Art und Weise hin, wie Gerichte die Verwendung von urheberrechtlich geschütztem Material beim KI-Training betrachten. Diese Entscheidungen könnten die Position der Kläger in anderen laufenden KI-bezogenen Rechtsstreitigkeiten stärken.

Beispielsweise wurde der Fall Tremblay et al. vs OpenAI et al. kürzlich geändert, um eine zuvor abgewiesene DMCA-Klage wieder aufleben zu lassen. Die geänderte Klageschrift, die sich auf neue Beweise beruft, die während der Beweisaufnahme aufgedeckt wurden, argumentiert, dass OpenAI ebenfalls CMI während des Trainings seiner Large Language Models entfernt hat.

Der breitere Kontext: Urheberrecht und KI-Training

Die Rechtsstreitigkeiten um KI und Urheberrecht verdeutlichen die komplexen Herausforderungen, Innovation mit dem Schutz geistigen Eigentums in Einklang zu bringen. Die wahllose Aufnahme von urheberrechtlich geschütztem Material für das KI-Training hat Bedenken hinsichtlich potenzieller Rechtsverletzungen geweckt, insbesondere wenn KI-Modelle Ausgaben generieren, die urheberrechtlich geschützten Werken stark ähneln oder diese direkt reproduzieren.

Die Ergebnisse dieser Fälle könnten erhebliche Auswirkungen auf die Zukunft der KI-Entwicklung und die Verwendung von urheberrechtlich geschütztem Material in Trainingsdatensätzen haben. Die Entscheidungen können beeinflussen, wie KI-Unternehmen an die Datenbeschaffung und das Modelltraining herangehen, was möglicherweise zu einer stärkeren Betonung von Lizenzierung, Namensnennung und dem Schutz von Copyright Management Information führt.

Die Auseinandersetzung zwischen Meta und den Autoren unterstreicht die sich entwickelnde Rechtslandschaft rund um KI und geistiges Eigentum. Da die KI-Technologie weiter voranschreitet, werden Gerichte eine entscheidende Rolle bei der Definition der Grenzen der zulässigen Nutzung und der Schaffung von Rechtspräzedenzfällen spielen, die die einzigartigen Herausforderungen angehen, die durch KI-generierte Inhalte entstehen. Die laufenden Rechtsstreitigkeiten erinnern daran, wie wichtig es ist, Urheberrechtsgesetze zu respektieren und sicherzustellen, dass Urheber für die Nutzung ihrer Werke angemessen entschädigt werden, selbst im sich schnell entwickelnden Bereich der künstlichen Intelligenz.

Die in diesen Fällen vorgebrachten Rechtsargumente befassen sich mit den Feinheiten des Urheberrechts, des DMCA und der Anwendung von Fair-Use-Grundsätzen im Kontext von KI. Die Kläger behaupten, dass Metas Handlungen einen absichtlichen Versuch darstellen, Urheberrechtsschutz zu umgehen und Urhebern ihre rechtmäßige Anerkennung und Entschädigung vorzuenthalten. Meta hingegen könnte argumentieren, dass seine Verwendung von urheberrechtlich geschütztem Material unter Fair Use fällt oder dass die Entfernung von CMI aus technischen Gründen notwendig war. Die Gerichte müssen letztendlich diese Argumente abwägen und feststellen, ob Metas Handlungen die Grenze zur Urheberrechtsverletzung überschritten haben.

Die Fälle werfen auch Fragen nach der Verantwortung von KI-Entwicklern auf, sicherzustellen, dass ihre Modelle mit legal erworbenen Daten trainiert werden. Da KI immer allgegenwärtiger wird, ist die Notwendigkeit von Transparenz und Rechenschaftspflicht bei der Datenbeschaffung und dem Modelltraining von größter Bedeutung. Die rechtlichen Ergebnisse dieser Streitigkeiten könnten die Branchenpraktiken prägen und die Entwicklung ethischer Richtlinien für die KI-Entwicklung fördern.

Die Debatte über Urheberrecht und KI beschränkt sich nicht auf den juristischen Bereich. Sie erstreckt sich auch auf breitere gesellschaftliche Diskussionen über die Rolle von KI bei kreativen Unternehmungen und die potenziellen Auswirkungen auf menschliche Künstler und Autoren. Einige argumentieren, dass KI-generierte Inhalte eine Bedrohung für die menschliche Kreativität darstellen, während andere KI als ein Werkzeug betrachten, das menschliche Fähigkeiten verbessern und erweitern kann. Diese Diskussionen unterstreichen die Notwendigkeit eines differenzierten Verständnisses der Beziehung zwischen KI und menschlicher Kreativität und die Bedeutung der Förderung eines kollaborativen Umfelds, das sowohl Urhebern als auch Technologieentwicklern zugutekommt.

Die derzeit laufenden Rechtsstreitigkeiten stellen einen entscheidenden Schritt bei der Bewältigung der komplexen Schnittstelle zwischen Urheberrecht und künstlicher Intelligenz dar. Die in diesen Fällen getroffenen Entscheidungen werden wahrscheinlich weitreichende Folgen haben und die Zukunft der KI-Entwicklung, den Schutz des geistigen Eigentums und die Beziehung zwischen Technologie und Kreativität prägen. Der fortlaufende Dialog zwischen Rechtsexperten, Technologieentwicklern und Urhebern ist unerlässlich, um sicherzustellen, dass die KI-Innovation in einer Weise voranschreitet, die sowohl rechtliche Rahmenbedingungen als auch die Rechte der Urheber respektiert.