KI-Modelle: Forscher extrahieren massenhaft urheberrechtlich geschützte Texte

18.01.2026 - 22:07:12

Forscher extrahierten urheberrechtlich geschützte Buchtexte aus führenden KI-Systemen. Die Schwachstellen verstärken rechtliche Risiken und werfen Fragen zur Sicherheit auf.

KI-Modelle: Forscher extrahieren massenhaft urheberrechtlich geschützte Texte - Foto: über boerse-global.de

Eine bahnbrechende Studie enthüllt massive Sicherheitslücken in führenden KI-Modellen. Forschern gelang es, ganze Buchkapitel aus Systemen wie Claude 3.7 und Grok 3 auszulesen – ein Alarmsignal für die gesamte Branche.

Veröffentlicht: Sonntag, 18. Januar 2026

Führende Künstliche-Intelligenz-Modelle speichern urheberrechtlich geschützte Werke in ihrem Gedächtnis – und geben sie auf Nachfrage preis. Das belegt eine aktuelle Studie der Stanford University, die tiefgreifende rechtliche und ethische Fragen für die Tech-Industrie aufwirft. Die Forscher demonstrierten, wie sich große Teile trainierter Texte aus vier prominenten Large Language Models (LLMs) extrahieren lassen, darunter Anthropics Claude 3.7 und xAIs Grok 3.

Die Untersuchung, die am 6. Januar 2026 veröffentlicht wurde, offenbart ein fundamentales Problem: Die Sicherheitsvorkehrungen, die eine Wiedergabe des Trainingsmaterials verhindern sollen, sind löchrig. In einem Experiment reproduzierte Claude 3.7 Sonnet fast 96 Prozent von „Harry Potter und der Stein der Weisen“ nahezu wortgetreu. Diese Enthüllungen kommen zu einem denkbar ungünstigen Zeitpunkt. Die KI-Branche sieht sich bereits mit einer Flut von Klagen konfrontiert, die die Nutzung urheberrechtlich geschützter Werke zum Training anprangern.

Das Forschungsteam testete neben Claude und Grok auch Googles Gemini 2.5 Pro und OpenAIs GPT-4.1. Dabei zeigten sich zwei unterschiedliche Angriffsmuster.

Die Enthüllungen verdeutlichen, wie schnell mangelnde KI‑Compliance zu rechtlichen und finanziellen Risiken führen kann. Die EU‑KI‑Verordnung (AI‑Act) verlangt nun Dokumentation, Risikoklassifizierung und Nachweise über technische Schutzmaßnahmen – Pflichten, die Betreiber und Entwickler kennen müssen, um Sanktionen zu vermeiden. Ein kostenloser Umsetzungsleitfaden erklärt praxisnah, welche Pflichten gelten, wie Sie Ihr System korrekt klassifizieren und welche Sofortmaßnahmen technische Teams jetzt umsetzen sollten – inklusive Checklisten und Praxisbeispielen. EU‑KI‑Verordnung: Umsetzungsleitfaden herunterladen

Bei Grok 3 und Gemini 2.5 Pro fehlten bereits grundlegende Schutzbarrieren. Die Modelle benötigten keine komplexen „Jailbreak“-Techniken, um trainierte Buchtexte auszugeben. Bei Grok 3 führte dies zur Extraktion von über 70 Prozent eines Testwerks – und das zu vergleichsweise geringen Kosten.

Anders bei Claude 3.7 Sonnet: Das Modell weigerte sich zunächst konsequent. Erst mit gezielten, adversarischen Prompting-Methoden konnten die Forscher seine Sicherheitsvorkehrungen umgehen. Doch dann erwies es sich als besonders anfällig und gab Texte nahezu vollständig wieder. Hunderte Versuche waren nötig, um diesen Schutz zu knacken. Als widerstandsfähigstes Modell erwies sich GPT-4.1.

Die Forscher informierten die betroffenen Unternehmen am 9. September 2025 über ihre Ergebnisse. In einem möglicherweise damit zusammenhängenden Schritt zog Anthropic das Modell Claude 3.7 Sonnet am 29. November 2025 als Kundenoption zurück.

Branche unter Druck: Juristische Konsequenzen und Sicherheitszweifel

Die Schwachstelle trifft eine Branche im Rechtsstreit. Zahlreiche Klagen von Urheberrechtinhabern liegen bereits vor. Die Studie liefert nun handfeste Beweise: Die Modelle speichern nicht nur generelles Wissen, sondern konkrete, geschützte Werke – und können sie reproduzieren. Ein zentraler Streitpunkt in den laufenden Verfahren.

Die Erkenntnisse werfen zudem ein schlechtes Licht auf die allgemeinen Sicherheitsversprechen der KI-Entwickler. xAIs Grok steht ohnehin unter Beobachtung. Erst in den letzten Wochen geriet das Modell wegen gravierender Sicherheitslücken in der Bildgenerierung in die Kritik, die die Erstellung unangemessener Inhalte ermöglichten. Nationale Aufsichtsbehörden leiteten Untersuchungen ein.

Die nun demonstrierte Leichtigkeit, mit der sich auch Text-Copyrights aus Grok 3 extrahieren lassen, verstärkt die Zweifel an den fundamentalen Sicherheitskontrollen des Systems. Analysten warnen vor systemischen Schwächen.

Das technische Kernproblem: Wenn KI auswendig lernt

Die Wurzel des Übels heißt Memorization. Dabei speichern LLMs nicht generalisiertes Wissen, sondern konkrete Datenpunkte aus ihren Trainingssets. Die Sicherheitsmaßnahmen der Hersteller sollen genau das verhindern. Die Stanford-Studie zeigt: Sie sind oft umgehbar.

Die Methode der Forscher war simpel: Sie fütterten die Modelle mit kurzen Textpassagen aus Büchern und baten sie, fortzufahren. Bei Grok 3 genügten bereits einfache Aufforderungen. Bei Claude 3.7 und GPT-4.1 kam eine „Best-of-N“-Jailbreak-Technik zum Einsatz, bei der leicht variierte Prompts so lange generiert werden, bis einer die Sicherheitsbarriere durchbricht.

Der Erfolg dieser Techniken unterstreicht die immense Herausforderung für Entwickler: Sie müssen Systeme schaffen, die sich nicht in Richtung Urheberrechtsverletzung manipulieren lassen.

Ausblick: Der Ruf nach härteren Schutzvorkehrungen wird lauter

Die Enthüllungen aus Stanford werden weitreichende Folgen haben. Rechtsexperten sehen die Position der Kläger in den Urheberrechtsprozessen gestärkt. Der Druck auf Unternehmen wie Anthropic und xAI wächst, die Schutzmechanismen ihrer Modelle grundlegend zu überdenken und zu verstärken.

Für Nutzer und Unternehmen, die auf diese KI-Tools setzen, ist die Studie eine ernüchternde Warnung. Das Risiko unbeabsichtigter Urheberrechtsverletzungen und die demonstrierten Sicherheitslücken machen kontinuierliches Monitoring, rigorose Sicherheitsaudits und widerstandsfähigere KI-Architekturen dringender denn je. Mit den Fähigkeiten der Modelle wächst auch die Debatte: Wie lassen sich Innovation und rechtlich-ethische Verantwortung in Einklang bringen?

PS: Wenn Sie KI-Modelle entwickeln oder einsetzen, ist jetzt schnelles Handeln gefragt. Der kostenlose Leitfaden zur EU‑KI‑Verordnung fasst Kennzeichnungspflichten, Risikoklassen und Übergangsfristen kompakt zusammen und liefert eine praxisorientierte Checkliste für technische Maßnahmen, Dokumentation und Governance. Ideal für Entwickler, Compliance-Teams und Entscheider, die ihre Systeme rechtssicher aufstellen wollen. Jetzt kostenlosen KI‑Verordnung‑Leitfaden sichern

KI-Modelle: Forscher extrahieren massenhaft urheberrechtlich geschützte Texte

Branche unter Druck: Juristische Konsequenzen und Sicherheitszweifel

Das technische Kernproblem: Wenn KI auswendig lernt

Ausblick: Der Ruf nach härteren Schutzvorkehrungen wird lauter

Aktienkurse

Nachrichten

broker

Service

Weitere Angebote

Kursinformationen