Das Urheberrecht im kognitiven Zeitalter
Schutzfähigkeit von KI-Systemen und deren Leistungsergebnissen.
Abiturprüfungen beantwortet der Computer, Papst Franziskus trägt modische Daunenjacken und Dr. Angela Merkel und Barack Obama essen Eis am Strand: Das Thema künstliche Intelligenz („KI“) steht spätestens seit der Veröffentlichung von ChatGPT des US-amerikanischen Unternehmens OpenAI im Mittelpunkt der Aufmerksamkeit. Jeder kann sich nun von der Leistungsfähigkeit dieser generativen KI-Systeme, technisch auch Large Language Models genannt, überzeugen.

Dr. Benedikt Flöter | Associated Partner | YPOG Rechtsanwälte | www.ypog.law
„Computer können scheinbar denken; das kognitive Zeitalter hat begonnen“
Gleichzeitig könnte das Immaterialgüterrecht durch den technischen Fortschritt, mal wieder, an seine Grenzen stoßen, denn erstmalig sehen wir uns mit der Situation konfrontiert, dass Computer in Sekundenschnelle Texte, Bilder, Videos und Musikstücke erstellen können, die von menschlichen Kreationen kaum zu unterscheiden sind. Computer können scheinbar denken; das kognitive Zeitalter hat begonnen.
FUNKTIONSWEISE VON KI-SYSTEMEN
Schematisch dargestellt basiert ein Computerprogramm, das Methoden der KI verwendet, auf einem programmierten neuronalen Netz. Dieses neuronale Netz besteht aus einer Vielzahl von übereinander gelagerten Ebenen, auf denen sich künstliche Neuronen befinden.
Die Neuronen der benachbarten Ebenen sind wie bei einem biologischen Gehirn mit künstlichen Synapsen verknüpft. In Abhängigkeit von der Relevanz einzelner Synapsenverbindungen für eine bestimmte Entscheidung des neuronalen Netzes sind die Verbindungen mit unterschiedlichen Gewichtungen versehen. Das neuronale Netz, das Grundlage von ChatGPT-4 ist, soll Gerüchten zufolge über die Anzahl von 100 Billionen Synapsenverbindungen verfügen.
Ein neuronales Netz als solches ist jedoch noch nicht arbeitsfähig. „Intelligent“ wird es erst durch gezieltes Training der Synapsenverbindungen, wodurch Entscheidungsprozesse des Netzwerks ermöglicht werden. Durch das Einspeisen von Trainingsdaten werden die Synapsenverbindungen mit unterschiedlichen Gewichtungen versehen, wodurch sich das neuronale Netz „merkt“, welche Synapsenverbindungen für die Erfüllung einer spezifischen Aufgabe zum Beispiel der korrekten Erkennung von Verkehrsschildern, Tierbildern oder Satzzusammenhängen relevant waren. Das Geheimnis der Funktionsfähigkeit neuronaler Netze liegt dementsprechend in deren zielgerichtetem Training, worauf der wesentliche zeitliche und finanzielle Aufwand der Softwareentwickler entfällt. Diese Gewichtungen verkörpern damit den wirtschaftlichen Wert eines neuronalen Netzes.
SCHUTZFÄHIGKEIT VON KI-SYSTEMEN
Patentrechtlicher Schutz
Patente werden gemäß § 1 Abs. 1 PatG für Erfindungen auf allen Gebieten der Technik erteilt, sofern diese neu sind, auf einer erfinderischen Tätigkeit beruhen und gewerblich anwendbar sind. Der patentrechtliche Schutz erfordert zudem, dass ein konkretes technisches Problem mit technischen Mitteln gelöst wird. Aus diesem Grund werden gemäß § 1 Abs. 3 PatG unter anderem Programme für Datenverarbeitungsanlagen vom Patentschutz ausgenommen. Methoden der KI sind aber zumeist mathematische Lösungen, die in Computerprogrammen eingebettet sind und damit als sogenannte computerimplementierte Verfahren vom Patentschutz ausgenommen sind. Anders wäre dies zum Beispiel bei einem KI-System zu bewerten, das mit Hilfe von Bilderkennung ein autonomes Fahrzeug durch den Straßenverkehr steuert.
Schutzfähigkeit als Computerprogramm
Das Urheberrecht schützt neben den klassischen Werkarten gemäß § 69a ff. UrhG auch Computerprogramme. Erforderlich ist hierfür, dass der Softwarecode die persönliche geistige Schöpfung eines (menschlichen) Urhebers darstellt. Während die Architektur des neuronalen Netzes bei ausreichender Komplexität als schutzfähiges Computerprogramm angesehen werden kann, versagt der urheberrechtliche Schutz hinsichtlich der in dem neuronalen Netz gespeicherten Gewichtungen der Synapsenverbindungen. Denn diese sind nicht von dem Urheber des neuronalen Netzes programmiert, sondern wurden durch das neuronale Netz selbst im Verlauf des Trainings autonom festgelegt. Da der wirtschaftliche Wert eines neuronalen Netzes aber in der Gewichtung der Synapsenverbindungen liegt, ist der Computerprogrammschutz aus Sicht des Herstellers unzureichend.
Schutzfähigkeit nach Datenbankherstellerrecht
Das Urheberrecht gewährt dem Hersteller von Datenbanken gemäß § 87a ff. UrhG Schutz für dessen Investitionen, die in die Sammlung, Sichtung und Aufbereitung von Daten geflossen sind. Als Datenbank werden hierbei jedoch nur Sammlungen von unabhängigen Elementen anerkannt, die systematisch oder methodisch angeordnet und einzeln mit Hilfe elektronischer Mittel oder auf andere Weise zugänglich sind, vgl. § 87a Abs. 1 UrhG. Der EuGH hat in der Entscheidung Fixtures-Fußballspielpläne II (C-444/02) zudem spezifiziert, dass eine Unabhängigkeit der Elemente nur dann vorliegt, wenn sich diese derart voneinander trennen lassen, dass auch nach ihrer Trennung ihr informativer oder sonstiger Wert nicht beeinträchtigt wird. So werden z.B. die Informationen aus einem Telefonbuch (Zuordnung von Name zu Telefonnummer) nicht dadurch wertlos, dass einzelne Einträge aus dem Telefonbuch entnommen werden. Denn die Information über die Telefonnummer des einzelnen Telefonteilnehmers ist auch für sich genommen nützlich. Anders verhält es sich jedoch mit den einzelnen Gewichtungen der Synapsenverbindungen in einem neuronalen Netz. Denn die einzelne Gewichtung einer einzelnen Synapsenverbindung ist ein bloßer Zahlenwert, der die Funktionalität des neuronalen Netzes nicht ermöglicht. Erst wenn die Gewichte von allen Synapsenverbindungen bekannt sind, ist das neuronale Netz arbeitsfähig.
Schutzfähigkeit als Geschäftsgeheimnis
In Ermangelung anderweitigen Sonderrechtsschutzes muss auf den Schutz des neuronalen Netzes als Geschäftsgeheimnis des Softwareherstellers zurückgegriffen werden. Der Geschäftsgeheimnisschutz zeigt hier seine besondere Leistungsfähigkeit als Auffangschutzrecht, vorausgesetzt, der Softwarehersteller ergreift ange messene Geheimhaltungsmaßnahmen gemäß § 2 Nr. 1 lit. b) GeschGehG. Denn unter dem Geschäftsgeheimnisschutz werden grundsätzlich sämtliche Informationen und Informationssammlungen geschützt, die geheim sind und denen aufgrund ihrer Geheimhaltung ein wirtschaftlicher Wert zukommt. So verkörpern die Gewichtungen gerade den besonderen wirtschaftlichen Aufwand des Trainings des neuronalen Netzes und gewähren nur solange einen Wettbewerbsvorteil, wie diese nicht von Wettbewerbern kopiert werden können.
COMPLIANCE-ASPEKTE BEI DER VERWENDUNG VON TRAININGSDATEN
Wie bereits dargestellt wurde, erfordert das Trainieren einer KI eine erhebliche Menge an Trainingsdaten. In Abhängigkeit von der Funktionalität der KI werden entweder Texte, Bilder, Musikstücke oder sonstige Datenquellen als Trainingsmaterial herangezogen. Bei Auswahl und Verwendung der Trainingsdaten ist daher auf bestehende Drittrechte zu achten, sodass nicht pauschal sämtliche frei verfügbaren Inhalte als Trainingsdaten herangezogen werden dürfen (z.B. Wikipedia, Common Crawls oder öffentliche Datenbanken). Neben datenschutzrechtlichen datenschutzrechtlichen Risiken ergeben sich insbesondere für das Training von generativen neuronalen Netzen wie ChatGPT und DALL-E Fragen bezüglich der Zulässigkeit der Verwendung von urheberrechtlich geschützten Materialien als Trainingsdaten. Besondere Aufmerksamkeit gebührt daher dem, soweit bekannt, ersten Rechtsstreit in Deutschland betreffend die Nutzung von urheberrechtlich geschützten Materialien als Trainingsdaten.
Der Fotograf Robert Kneschke wendet sich im Klageweg vor dem Landgericht Hamburg gegen die Nutzung bzw. Speicherung in einer Linksammlung von ihm erstellter und im Internet abrufbarer Fotografien als Trainingsdaten für KI-Systeme durch den Large-scale Artificial Intelligence Open Network e.V. („LAION“), wobei der Sachverhalt bisher nicht im Detail bekannt ist.
Im Mittelpunkt der Diskussion dürfte die Text-und- Data-Mining-Schranke des § 44b UrhG stehen. Text und Data Mining („TDM“) bezeichnet die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen. Nach der TDM-Schranke sind Vervielfältigungen von rechtmäßig zugänglichen Werken zulässig, wenn und so lange diese Vervielfältigungen zu Zwecken des TDM erforderlich sind. Hier werden sich diverse offene Frage ergeben:
(1.) Ist TDM ohne vorhergehende Vervielfältigung überhaupt eine urheberrechtliche Nutzungsart? Denn die TDM-Schranke stellt bei genauer Lesart solche Vervielfältigungshandlung frei, die Voraussetzung für das anschließende TDM sind. Ein TDM ohne vorhergehende Vervielfältigung greift dann gegebenenfalls gar nicht in die exklusiven Verwertungsrechte des Urhebers ein. Liegt keine Vervielfältigung vor, zum Beispiel, weil lediglich eine Sammlung von Hyperlinks zu Internetquellen erstellt wurde, scheidet eine urheberechtliche Nutzungshandlung bereits aus.
(2.) Ist die TDM-Schranke überhaupt auf Fotografien und Bilder anzuwenden? Der Wortlaut „Text und Data Mining“ erfasst möglicherweise nicht auch die Verwendung von Fotografien und Bildern. Die DSM-Richtlinie, aus der die TDM-Schranke stammt, geht jedoch von einem weiten Verständnis der verwendeten Werkkategorien aus.
Und zuletzt (3.): Erfasst die TDM-Schranke auch das Trainieren eines generativen neuronalen Netzes? Der Wortlaut Text und Data „Mining“ im Sinne der Erkennung von Mustern, Trends und Korrelationen gestattet möglicherweise nur analytische Verfahren, die eine Auswertung von großen Datensätzen im Sinne der Big-Data- Analyse eröffnen sollen. Generative KI dient aber nicht der Analyse von bestehenden Datensätzen, sondern ermöglicht die Kreation gänzlich neuer Inhalte, wobei bisher ungeklärt ist, in welchem Umfang Teilelemente der Trainingsmaterialien reproduziert werden können. Die Schranke erfasst damit möglicherweise nicht auch „kreative“ neuronale Netze, die auf Grundlage der eingespeisten Trainingsdaten neue Bilder erstellen können, wie zum Beispiel DALL-E.
SCHUTZ DER LEISTUNGSERGEBNISSE VON GENERATIVER KI
Spannende Diskussionen sind hinsichtlich der Frage zu erwarten, ob durch generative KI erzeugte „Werke“ in Form von Texten, Bildern oder Musikstücken urheberrechtlichen Schutz genießen können. Grundsätzlich können nach § 2 Abs. 2, 1 UrhG Werke geschützt werden, wenn sie eine wahrnehmbare, abgrenzbare und intersubjektiv konkretisierbare Formgestaltung innehaben und die Verkörperung einer persönlichen geistigen Schöpfung eines Urhebers darstellen. Die Problematik an der Voraussetzung einer eigenen geistigen Schöpfung wird am Beispiel zweier Fälle aus den USA schnell deutlich.
Die Künstlerin Kristina Kashtanova beantragte für mittels des KI-Systems Midjourney erstellte Comiczeichnungen Copyrightschutz vor dem U.S. Copyright Office. Das Schutzbegehren wurde u.a. mit dem Einwand zurückgewiesen, dass Frau Kashtanova nicht als Urheberin der Werke anzusehen sei, sondern diese mithilfe einer KI generiert worden waren. Der von Frau Kashtanova geleistete eigene kreative Beitrag hinsichtlich des Promptings, das heißt, der textlichen Anweisungen an das KISystem zum Zweck der Erstellung der Bildinhalte, wurde als nicht hinreichend angesehen, da dieser keinen ausreichenden eigenen schöpferischen Beitrag enthalten würde, der sich in dem resultierenden Leistungsergebnis niederschlagen würde.
„An der Frage der urheberrechtlichen Schutzfähigkeit von KIgenerierten ‚Werken‘ zeigt sich die Grenze des kontinentaleuropäischen und angelsächsischen Urheberrechts, die jeweils von der Werkschöpfung durch einen menschlichen Urheber ausgeht“
Anders könnte dies indes in dem Fall des Fotografen Jos Avery zu sehen sein. Dieser veröffentlichte täuschend echt aussehende Portraits von fiktionalen Personen, die mittels KI-generierter Elemente entstanden sind und von Jos Avery nachbearbeitet worden waren. Hier wäre im Einzelfall zu prüfen, ob die Nachbearbeitung der KIgenerierten Ausgangsmaterialien einen ausreichenden eigenschöpferischen Beitrag enthält, um die Schutzuntergrenze des Urheberrechts zu überwinden.
An der Frage der urheberrechtlichen Schutzfähigkeit von KI-generierten „Werken“ zeigt sich die Grenze des kontinentaleuropäischen und angelsächsischen Urheberrechts, die jeweils von der Werkschöpfung durch einen menschlichen Urheber ausgeht. Damit drängt sich die Frage auf, ob jenseits des urheberrechtlichen Schutzes de lege ferenda ein Investitionsschutz, ähnlich dem sui generis Datenbankherstellerrecht, in Betracht kommen könnte. Voraussetzung für einen solchen Investitionsschutz ist nach herrschender Ansicht das Vorliegen eines echten Marktversagens für die betroffenen Schutzgegenstände, sprich: Ist in Ermangelung eines Investitionsschutzes für KI-generierte Inhalte damit zu rechnen, dass derartige Inhalte nicht oder nicht in wohlfahrtoptimaler Weise erstellt werden? Gegenwärtig bestehen aber wohl keine Anzeichen für ein solches echtes Marktversagen, wie die wahre Schwemme KI-generierter Inhalte belegt.

