Zwischen Wissenschaftsfreiheit und Verwertungsinteressen

Das OLG Hamburg zur urheberrechtlichen Zulässigkeit von KI-Trainingsdatensätzen

Mit Urteil vom 10.12.2025 hat das Hanseatische Oberlandesgericht1OLG Hamburg v. 10.12.2025 – 5 U 104/24; Vorinstanz: LG Hamburg v. 27.9.2024 – 310 O 227/23. im Rahmen eines der ersten europäischen Verfahren zur rechtlichen Bewertung von künstlicher Intelligenz eine der derzeit meistdiskutierten urheberrechtlichen Streitfragen entschieden. Der 5. Zivilsenat bejahte die Zulässigkeit der Vervielfältigung urheberrechtlich geschützter Werke für KI-Trainingsdatensätze unter Verweis auf die Schrankenregelungen der §§ 44b, 60d UrhG. Die Berufung wurde zurückgewiesen. Die Revision wurde aufgrund der grundsätzlichen Bedeutung der Materie zugelassen. Vermutlich wird auch noch der EuGH involviert.

Joerg Heidrich | Partner der Kanzlei Heidrich Rechtsanwälte (recht-im-internet.de / ki-kanzlei.de)
welche den LAION e. V. in den Verfahren vertreten hat. Die Revision ist beim BGH anhängig.

„Der Gesetzgeber hat mit den Text- und Data-Mining-Schranken bewusst Freiräume geschaffen“

Für Forschungseinrichtungen, KI-Entwickler und die europäische Innovationslandschaft ist das Urteil aber erst einmal ein gutes Signal: Der Gesetzgeber hat mit den Text- und Data-Mining-Schranken bewusst Freiräume geschaffen, und die Gerichte setzen diesen Willen konsequent um.

I. WAS IST PASSIERT?

Der gemeinnützige Forschungsverein LAION e. V. erstellte 2021 einen Datensatz, der für das Training von KI-Modellen genutzt werden kann. Der Verein stellt seine Arbeitsergebnisse unentgeltlich unter einer offenen Lizenz für Jedermann zur Verfügung. Damit soll die KIForschung in Europa gefördert und die Abhängigkeit von amerikanischen Anbietern reduziert werden. Dafür hat sich eine internationale Gruppe von Forschenden zusammengefunden, die inzwischen für ihre Arbeit renommierte Forschungspreise erhalten hat.

Die von dem Verein zur Verfügung gestellte Datei zum Training von KI enthält nicht weniger als 5,85 Milliarden Bild-Text-Paare. Dabei werden öffentlich zugängliche Bilder mittels Software auf Übereinstimmung mit der vorhandenen Bildbeschreibung analysiert und anschließend sofort gelöscht. Nur die URL der Abbildungen samt Metadaten fand Eingang in den Datensatz, der der Allgemeinheit kostenfrei zur Verfügung gestellt wurde – ein Paradebeispiel für Open Science.

Der Kläger, ein Fotoproduzent, hatte Bildmaterial über eine Bildagentur zur Lizenzierung angeboten. Der Datensatz enthielt die dort angebotene Vorschauversion eines Bildes, an dem der Fotoproduzent das alleinige Nutzungsrecht geltend macht. Der Kläger rügte eine Verletzung seines Vervielfältigungsrechts aus § 16 UrhG und berief sich auf einen in den Nutzungsbedingungen der Stockfotoseite enthaltenen Nutzungsvorbehalt.

II. ENTSCHEIDUNGSGRÜNDE

1. Text- und Data-Mining nach § 44b UrhG

Wie schon das Landgericht bewertete auch das OLG Hamburg den zentralen rechtlichen Streitpunkt als anwendbar: Die streitgegenständliche Vervielfältigung des Bildes zum Auslesen für das KI-Training unterfällt dem Text- und Data-Mining (TDM) im Sinne des § 44b Abs. 1 UrhG. Der Abgleich zwischen Bildinhalt und Bildbeschreibung ist eine Analyse zur Gewinnung von Informationen über Korrelationen – und damit genau das, was der Gesetzgeber privilegieren wollte. Die in Teilen der Literatur propagierte teleologische Reduktion der TDM-Schranken für KI-Trainingszwecke lehnte das Gericht ab. Der Gesetzgeber hatte das KI-Training bei Schaffung der Normen ausdrücklich im Blick. In der Gesetzesbegründung heißt es unmissverständlich, dass die Schranken für das maschinelle Lernen als Basistechnologie für künstliche Intelligenz von besonderer Bedeutung seien. Auch die KI-Verordnung nimmt in Art. 53 Abs. 1 lit c und Erwägungsgrund 105 eindeutig Bezug auf diese Regelungen.

2. NUTZUNGSVORBEHALT UND MASCHINENLESBARKEIT

Ein Blick auf die Vorschriften zeigt, dass das Gesetz den Rechteinhabern durchaus Schutzmöglichkeiten bietet – wenn sie denn richtig genutzt werden. Der Kläger hatte sich auf einen in natürlicher Sprache verfassten Vorbehalt in den Nutzungsbedingungen der Website berufen, in deren Angebot sein Werk enthalten war. Dieser Passus könnte so interpretiert werden, dass auch ein Auslesen von Inhalten für KI-Training gemeint sein könnte. Das Problem: Der § 44b Abs. 3 UrhG ermöglicht Rechteinhabern ein Opt-Out vom KI-Training, verlangt aber, dass dieser Vorbehalt „maschinenlesbar“ erklärt wird.

Die Frage, was denn genau unter dieser Voraussetzung zu verstehen ist, bildet einen Kernpunkt des Verfahrens. Dabei ist es offenkundig, dass dies mehr sein muss als nur ein einfacher Text, der irgendwo auf der Website oder gar in einem Bild versteckt wird. Denn grundsätzlich jeder Bestandteil einer Website ist schon denklogisch maschinenlesbar. Diese Formulierung kann also nur dann Sinn ergeben, wenn damit eine besondere technische Lösung gemeint ist, die KI-Anbietern ein einfaches Auffinden des Vermerks ermöglicht.

Dies kann auch nur im Interesse desjenigen sein, der ein solches Opt-Out für KI-Training verwendet. Es muss für die Suchroboter von ChatGPT und Co. einfach möglich sein, den Vermerk zu erfassen und zu berücksichtigen. Die einheitliche Maschinenlesbarkeit ermöglicht es, Vorbehalte automatisiert zu erkennen und zu respektieren. Einfach umsetzbare technische Lösungen wie beispielsweise robots.txt oder das TDM Reservation Protocol stehen dafür zur Verfügung. Wer sie nicht nutzt oder den entsprechenden Vermerk sogar vorsätzlich versteckt, kann sich nicht beschweren, wenn sein Vorbehalt ins Leere läuft.

Der Senat stellte zutreffend fest, dass der Kläger nicht hinreichend dargelegt hatte, dass der Vorbehalt zum maßgeblichen Nutzungszeitpunkt 2021 maschinenlesbar war. Erst 2023 verfügbare Tools, die dies ermöglichen sollen, halfen ihm nicht.

3. Wissenschaftliche Forschung nach § 60d UrhG

Das OLG Hamburg bejahte darüber hinaus die Privilegierung des LAION e. V. nach § 60d UrhG als gemeinnützige Organisation, die wissenschaftliche Forschung betreibt und keine kommerziellen Zwecke verfolgt. Die Erstellung des Datensatzes stellt angewandte Forschung dar: Ein methodisches, dokumentiertes und durch wissenschaftliche Publikationen nachvollziehbares Vorgehen, das mit renommierten Preisen ausgezeichnet wurde.

Dass der Datensatz auch von kommerziellen Unternehmen genutzt werden kann, liegt in der Natur von Open Science. Wer das kritisiert, kritisiert nicht den Beklagten, sondern das Prinzip offener Wissenschaft selbst. Die Anwendung von § 60d UrhG führt zudem dazu, dass es auf das Vorhandensein einer Vorbehaltserklärung nicht ankommt, da eine solche für wissenschaftliche Forschung nicht berücksichtigt werden muss.

4. Drei-Stufen-Test

Die Anwendung des Drei-Stufen-Tests2Der Drei-Stufen-Test ist eine im Urheberrecht verankerte Schranken- Schranke, mit der geprüft wird, ob gesetzliche Ausnahmen und Beschränkungen der Urheberrechte zulässig sind. führte zu keiner anderen Bewertung. Die streitgegenständliche Vervielfältigung war ein rein interner, vorübergehender Vorgang. Die Bilder wurden analysiert und gelöscht. Im veröffentlichten Datensatz be nden sich nur URLs und Metadaten. Von einer Beeinträchtigung der normalen Verwertung des Werks kann keine Rede sein. Dass der Datensatz später für das Training generativer KI genutzt werden kann, ist für die rechtliche Beurteilung der konkreten Vervielfältigungshandlung unerheblich. Der Senat stellte zutreffend fest, dass abstrakte zukünftige Auswirkungen nicht der konkreten Nutzungshandlung entgegenzuhalten sind. Alles andere würde die gesetzliche Schranke faktisch leerlaufen lassen.

III. AUSBLICK UND BEWERTUNG

Der Gesetzgeber hat sich bewusst dafür entschieden, Text- und Data-Mining unter bestimmten Voraussetzungen zu privilegieren. Das OLG Hamburg setzt diese Wertung konsequent um und stärkt den Open-Science- Ansatz. Wer seine Werke vom Text- und Data-Mining ausnehmen will, muss einen maschinenlesbaren Vorbehalt erklären. Die technischen Möglichkeiten dafür existieren. Es bleibt zu hoffen, dass auch der BGH diesen Weg weiter beschreitet.

Die Kritik, die dem Urteil aus Teilen der Kreativindustrie entgegenschlägt, ist verständlich – aber fehlgeleitet. Die Behauptung, die Rechteinhaber würden „enteignet“, geht an der Rechtslage vorbei. Niemand nimmt ihnen ihre Werke weg. Die Werke bleiben geschützt, die Verwertungsrechte bestehen fort. Die Vervielfältigung zum Zweck der automatisierten Analyse ist ein eng begrenzter Eingriff, der die normale Verwertung des Werks nicht beeinträchtigt.

„Das Urheberrecht schützt nicht vor Konkurrenz. Es schützt vor der unerlaubten Nutzung konkreter Werke“

Die Sorge, KI-generierte Bilder könnten künftig mit den Werken menschlicher Urheber konkurrieren, ist nachvollziehbar – aber kein urheberrechtliches Problem. Das Urheberrecht schützt nicht vor Konkurrenz. Es schützt vor der unerlaubten Nutzung konkreter Werke. Was die Debatte vergiftet, ist die Vermischung verschiedener Ebenen. Die Frage, ob KI-Training urheberrechtlich zulässig ist, hat mit der Frage, ob KI-generierte Inhalte den Arbeitsmarkt für Kreative verändern, wenig zu tun. Letzteres ist eine sozialpolitische Frage, die nicht die Gerichte, sondern der Gesetzgeber und die Gesellschaft beantworten müssen und die natürlich nicht nur die Kreativindustrie, sondern auch zahllose andere Jobs betrifft, nicht zuletzt auch die von Juristen.

Heft 04 | 2026 | 75. Jahrgang

  • 1
    OLG Hamburg v. 10.12.2025 – 5 U 104/24; Vorinstanz: LG Hamburg v. 27.9.2024 – 310 O 227/23.
  • 2
    Der Drei-Stufen-Test ist eine im Urheberrecht verankerte Schranken- Schranke, mit der geprüft wird, ob gesetzliche Ausnahmen und Beschränkungen der Urheberrechte zulässig sind.