Landgericht (LG) München I verurteilt OpenAI wegen reproduzierbarer Liedtexte

Das Landgericht (LG) München I hat entschieden, dass die reproduzierbare Ausgabe geschützter Liedtexte durch ChatGPT eine Urheberrechtsverletzung darstellen kann. Im Zentrum des Verfahrens stand die Frage, ob generative KI-Modelle urheberrechtlich geschützte Werke lediglich analysieren oder diese im Modell so verankern, dass sie nahezu wortgleich wiedergegeben werden können.

Das Urteil betrifft zentrale Fragen des Text- und Data-Mining nach § 44b Urheberrechtsgesetz (UrhG) sowie die Haftung von KI-Anbietern für Trainingsdaten und Modellausgaben.

Sachverhalt: GEMA klagt wegen Ausgabe geschützter Liedtexte durch ChatGPT

Die GEMA machte geltend, dass ChatGPT auf einfache Nutzereingaben (Prompts) hin nahezu vollständige Liedtexte bekannter deutscher Songs ausgab, darunter „Atemlos“ sowie „Wie schön, dass du geboren bist“.

Nach Auffassung der GEMA wurden die geschützten Werke nicht nur zum Training des Modells genutzt, sondern in einer Weise verarbeitet, die eine reproduzierbare Ausgabe ermögliche. Dies stelle eine unzulässige Vervielfältigung dar.

OpenAI bestritt eine Speicherung konkreter Texte. Das Modell lerne statistische Zusammenhänge; konkrete Ausgaben seien Ergebnis der Nutzereingaben. Zudem berief sich das Unternehmen auf die Schrankenregelung des § 44b UrhG (Text- und Data-Mining).

„Memorisierung“ als Vervielfältigung im Sinne des Urheberrechts

Das LG München I folgte im Wesentlichen der Argumentation der GEMA.

Die Kammer stellte fest, dass sich geschützte Liedtexte in den mathematischen Parametern der Modelle GPT-4 und GPT-4o so verfestigt hätten, dass sie durch gezielte Prompts wieder abrufbar seien. Das Gericht bezeichnete dieses Phänomen als „Memorisierung“.

Bei komplexen und umfangreichen Texten sei eine nahezu wortgleiche Reproduktion nicht zufällig erklärbar. Die reproduzierbare Verankerung vollständiger Werke im Modell stelle eine Vervielfältigung im urheberrechtlichen Sinne dar.

Damit liege eine Urheberrechtsverletzung vor.

§ 44b Urheberrechtsgesetz (UrhG): Grenzen des Text- und Data-Mining

Zentral war die Frage, ob § 44b UrhG die Nutzung der Werke rechtfertigt.

Die Norm erlaubt es, urheberrechtlich geschützte Werke automatisiert auszuwerten, ohne eine Lizenz einzuholen, sofern die Nutzung allein der Analyse dient.

Das LG München I stellte klar:

Zulässig sind vorbereitende Analysehandlungen.
Nicht zulässig ist die dauerhafte Speicherung vollständiger Werke.
Die Schranke greift nicht, wenn wirtschaftliche Verwertungsinteressen der Rechteinhaber:innen* beeinträchtigt werden.

Die Kammer betonte, dass § 44b UrhG technische Zwischenschritte privilegiert, nicht jedoch die reproduzierbare Verankerung geschützter Inhalte im Modell.

Eine analoge Anwendung der Norm lehnte das Gericht ab. Selbst wenn der Gesetzgeber das Phänomen der Memorisierung nicht ausdrücklich geregelt habe, sei die Interessenlage nicht vergleichbar. Die Schranke setze gerade voraus, dass keine relevanten Verwertungsinteressen berührt werden.

Keine Anwendung von § 57 UrhG („unwesentliches Beiwerk“)

OpenAI berief sich hilfsweise auf § 57 UrhG, der die Nutzung geschützter Werke erlaubt, wenn diese lediglich als unwesentliches Beiwerk neben einem Hauptwerk erscheinen.

Das LG verneinte diese Voraussetzung. Ein Trainingsdatensatz sei kein eigenständiges urheberrechtlich geschütztes Hauptwerk. Die streitgegenständlichen Liedtexte seien weder nebensächlich noch verzichtbar.

Die Ausnahme greife daher nicht.

Haftung von KI-Anbietern für Trainingsdaten und Modellausgaben

Besonders praxisrelevant ist die Zurechnung der Rechtsverletzung.

Das LG München I stellte klar, dass OpenAI selbst für die Ausgabe der geschützten Texte verantwortlich sei. Die Auswahl der Trainingsdaten, die Modellarchitektur und die technische Ausgestaltung lägen in der Verantwortung des Unternehmens.

Die reproduzierbare Ausgabe sei nicht allein Folge der Nutzereingaben. KI-Anbieter tragen das Risiko, dass Trainingsdaten im Modell memorisiert und später wiedergegeben werden.

Zudem sei bereits die Wiedergabe der Texte durch den Chatbot eine eigenständige Urheberrechtsverletzung. Eine stillschweigende Zustimmung der Rechteinhaber:innen* liege nicht vor. Das Training generativer KI sei keine „übliche und erwartbare Nutzungsart“.

Bedeutung für KI-Unternehmen und Rechteinhaber:innen*

Die Entscheidung hat erhebliche praktische Tragweite.

Sollte das Urteil rechtskräftig werden, ergeben sich insbesondere folgende Konsequenzen:

Generative KI-Modelle dürfen geschützte Werke nicht reproduzierbar speichern.
§ 44b UrhG ist eng auszulegen.
Lizenzpflichten können entstehen, wenn Werke für das KI-Training genutzt werden.
KI-Anbieter tragen das Risiko technischer Memorisierungseffekte.

Für Rechteinhaber:innen* stärkt das Urteil die Möglichkeit, Lizenzansprüche durchzusetzen. Für Technologieunternehmen erhöht sich der Druck, Trainingsdaten und Modellausgaben rechtlich abzusichern.

Einordnung

Das Urteil des LG München I ist eine der bislang deutlichsten gerichtlichen Stellungnahmen zur urheberrechtlichen Bewertung generativer KI in Deutschland.

Die Entscheidung verschiebt den Fokus von der bloßen Analyse geschützter Inhalte hin zur Frage der reproduzierbaren Werkverankerung im Modell. Maßgeblich ist nicht allein, ob ein Werk verarbeitet wird, sondern ob es als solches wieder erkennbar hervortreten kann.

Das Urteil ist nicht rechtskräftig. Eine Berufung ist möglich.