KI und Recht - ein grundlegender Überblick
Einleitung
................................................................................................................................................................................................
Für Startups ist Künstliche Intelligenz (KI) ein unverzichtbares Thema, sei es beim Training eigener Modelle oder der Nutzung bestehender Modelle. Es gibt jedoch eine hohe Unsicherheit und eine Vielzahl von Fragen: Sind durch KI generierte Erzeugnisse geschützt? Erhalte ich Rechte an den Erzeugnissen? Was darf in der sogenannten "Prompt" eingegeben werden? Inwiefern darf ich bestehende (fremde) Werke in die Nutzung von KI einbinden? Kann ich (für das Training) einfach alles nutzen, was ich im Internet finde?
Die rechtlichen Aspekte und Überlegungen im Zusammenhang mit KI sind äußerst komplex und unterliegen einem ständigen Wandel.
Aufgrund dieser ständigen Entwicklung können häufig noch keine rechtlich sicheren Aussagen gemacht werden. In der folgenden Darstellung sollen nicht alle rechtlichen Themen, die im Zusammenhang mit der Verwendung von KI stehen, behandelt werden. Stattdessen konzentriert sie sich auf einige alltägliche urheberrechtliche Herausforderungen im Kontext von KI und bezieht die relevanten Paragraphen, §§ 44b und 60d UrhG, des deutschen Urheberrechtsgesetzes in die Betrachtung ein. Ziel ist es, einen ersten Überblick über einige Aspekte zu bieten und einige Schlüsselfragen zu beleuchten, die sich aus dem Einsatz von KI-Technologien im Kontext des Urheberrechts ergeben.
Für Startups und andere Akteure im Bereich KI ist es unerlässlich, sich stets über die neuesten Entwicklungen im Recht informiert zu halten.
Die Bezeichnung als “Künstliche Intelligenz” für die heutigen (in diesem Beitrag behandelten) Textgeneratoren ist nicht unumstritten. Sie soll hier jedoch verwendet werden, da die Bezeichnung üblich und überwiegend gebräuchlich zu sein scheint.
Drei Phasen bei der Arbeit mit KI
................................................................................................................................................................................................
Es ist leicht, den Überblick zu verlieren. Deswegen bietet es sich an, strukturiert an die Fragestellungen heranzugehen. Eine mögliche Vorgehensweise ist es, die Betrachtung in drei Phasen zu unterteilen und jeweils an passender Stelle die relevanten Fragen zu erörtern: die Phase vor der Eingabe eines Befehls (hier bezieht sich das auf das KI-Training), die Phase während der Eingabe und die Phase nach der Eingabe. Jede dieser Phasen bringt spezifische rechtliche Überlegungen mit sich, die berücksichtigt werden müssen.
Drei relevante Phasen bei der Arbeit mit KI
Ein effektiver Ansatz, um die rechtlichen Herausforderungen bei der Arbeit mit Künstlicher Intelligenz, insbesondere Textgeneratoren, zu verstehen, ist die Unterteilung des Prozesses in drei Phasen: vor, während und nach der Eingabe eines Befehls.
Phase vor der Eingabe: Das Training der KI
Das Training von KI-Modellen basiert auf der Nutzung diverser Daten. Eine zentrale Frage, die sich hier stellt, ist: Was passiert, wenn sich unter diesen Daten urheberrechtlich geschütztes Material befindet (was sehr wahrscheinlich ist)? Für das Training müssen Daten in einen Trainingskorpus aufgenommen werden, was in der Regel das Anfertigen von Kopien beinhaltet. Hier könnte ein Verstoß gegen das Vervielfältigungsrecht der Urheber*innen vorliegen. Ein solcher Verstoß gegen das Vervielfältigungsrecht kann jedoch durch gesetzliche Schranken des Urheberrechts gerechtfertigt sein.
Betrachtung durch KI: Äquivalent zur menschlichen Wahrnehmung
Vorneweg soll eine wichtige Erkenntnis festgestellt werden, nämlich, dass das Urheberrecht die bloße Betrachtung oder Analyse eines Werkes durch eine KI nicht verbietet. Diese Handlung fällt nicht unter urheberrechtliche Einschränkungen, solange keine Vervielfältigung oder Verbreitung stattfindet, d.h. solange mit der “Betrachtung” keine technische Speicherung (Vervielfältigung) der Werke einhergeht. Dadurch wendet man entsprechend den Rechtsgedanken an, dass die ledigliche Betrachtung oder Analyse durch einen Menschen nicht in die Verwertungsrechte des Urhebers/ der Urheberin eingreift.
Phase während und nach der Eingabe: Nutzung der generierten Inhalte
Die rechtlichen Überlegungen während und nach der Eingabe eines Befehls konzentrieren sich auf die Nutzung der von der KI generierten Inhalte. Hier stellen sich Fragen wie: Inwieweit sind die von der KI erstellten Inhalte urheberrechtlich geschützt? Wer erhält ggf. Rechte an diesen Werken? Diese Fragen sind besonders relevant, wenn es um die kommerzielle Verwertung der generierten Inhalte geht.
In allen Phasen ist es wichtig, dass sich Nutzer und Entwickler von KI-Technologien über die aktuellen rechtlichen Rahmenbedingungen informieren und sich der Implikationen ihres Handelns bewusst sind. Während das Urheberrecht in einigen Bereichen klare Richtlinien bietet, gibt es in anderen Bereichen noch Grauzonen, die einer weiteren Klärung bedürfen.
Phase 1: Training von KI
................................................................................................................................................................................................
Beleuchten wir das KI-Training unter Berücksichtigung der §§ 44b und 60d UrhG. Das sind sog. Schrankenregelungen, die eine ansonsten urheberrechtswidrige Handlung erlauben.
Die Schrankenregelung des § 44b UrhG
Der Umgang mit urheberrechtlich geschütztem Material während des Trainings von KI-Systemen wird in Deutschland durch spezifische Regelungen wie § 44b des Urheberrechtsgesetzes (UrhG) geregelt. Diese Norm trägt den Namen “Text und Data Mining” (TDM) und regelt diese Materie. Diese Vorschrift bildet eine wesentliche Grundlage für die rechtmäßige Nutzung von Daten und Inhalten in diesem Kontext. Die Regelungen der Vorschrift ermöglichen unter bestimmten Bedingungen die Vervielfältigung von rechtlich zugänglichen Werken für TDM-Zwecke, stellen jedoch unterschiedliche Anforderungen an die Nutzer.
Rechtmäßiger Zugang als Grundvoraussetzung
Eine zentrale Bedingung des § 44b UrhG ist, dass für das Training von KI-Modellen nur solche Daten verwendet werden dürfen, zu denen ein rechtmäßiger Zugang besteht. Darunter können Daten fallen, die öffentlich zugänglich sind oder für die eine Lizenz erworben wurde. Im Gegensatz dazu dürfen Inhalte, die rechtswidrig erlangt wurden, nicht verwendet werden.
Löschpflicht nach dem Training
Ein weiteres wichtiges Element dieser Regelung ist die Löschpflicht. Nach Abschluss des Trainingsprozesses besteht die Verpflichtung, die genutzten Daten wieder zu löschen, wenn diese für das TDM nicht mehr erforderlich sind. Dies stellt sicher, dass urheberrechtlich geschütztes Material nicht unberechtigt gespeichert bleibt.
Opt-out und Nutzungsvorbehalt
§ 44b UrhG eröffnet auch die Möglichkeit eines Opt-out oder Nutzungsvorbehalts durch die Rechteinhaber*innen. Das bedeutet, dass Urheber*innen oder Rechteinhaber*innen dadurch die Möglichkeit erhalten, ihre Werke für das Training von KI auszuschließen. Diese Vorbehalte müssen maschinenlesbar sein, um von den Algorithmen entsprechend berücksichtigt zu werden. Durch diese Regelung erhalten Urheber*innen eine direkte Kontrolle darüber, wie ihre Werke in KI-Trainingsprozessen eingesetzt werden. Der Nutzungsvorbehalt ermöglicht es sodann, stattdessen Lizenzen zu vergeben, um die Werke für das Training freizugeben.
§ 60d UrhG: TDM für wissenschaftliche Forschung
§ 60d UrhG ist eine weitere Regelung für TDM. Im Unterschied zu § 44b fokussiert sich § 60d UrhG speziell auf TDM für wissenschaftliche Forschungszwecke. Diese Regelung erlaubt es unter anderem Forschungsorganisationen und einzelnen Forschern*innen, urheberrechtlich geschützte Werke für nicht-kommerzielle wissenschaftliche Forschung zu vervielfältigen. Auch diese Werke müssen in rechtmäßiger Weise erlangt worden sein.
Beide Paragraphen setzen also voraus, dass die Inhalte rechtmäßig zugänglich sind; beispielsweise durch vertragliche Vereinbarung oder freie Verfügbarkeit. Das bedeutet im Ergebnis, dass die beiden Vorschriften kein Recht auf Zugang zu Inhalten gewähren, sondern dass diese für Zwecke des TDM zunächst rechtmäßig erworben worden sein müssen.
Für die Zwecke des § 60d UrhG ist ein Opt-Out nicht möglich.
§ 60h UrhG regelt zudem eine Vergütungspflicht, die unter bestimmten Voraussetzungen für einige Nutzungsarten greift. TDM ist mittlerweile (im Gegensatz zur früheren Regelung) vergütungsfrei möglich.
Phase 2: Während der Eingabe eines Prompts
................................................................................................................................................................................................
(Während der) Eingabe eines Prompts: Der Grundsatz der Schöpfungshöhe
In der fortlaufenden Diskussion um den rechtlichen Umgang mit künstlicher Intelligenz taucht häufig die Frage auf, inwieweit Prompts, die in KI-Systeme eingegeben werden, urheberrechtlichen Schutz genießen können. Diese Fragestellung berührt den Kern des Urheberrechts, nämlich die Schöpfungshöhe und ihre Anwendung auf die digitale Interaktion mit KI-Technologien.
Die wirtschaftliche Bedeutung von sorgfältig und zielgerichtet (oder man könnte auch sagen: elegant, kunstvoll, kreativ etc.) ausgetüftelten Prompts zeigt sich beispielsweise am Aufkommen von Promptdatenbanken und dem Kauf und Verkauf spezialisierter Prompts.
Verschiedene Akteure, darunter Entwickler*innen und Kreative, veröffentlichen Anleitungen für die Erstellung effektiver Prompts. Die Wertschätzung an die Prompterstellung zeigt sich an Bezeichnungen wie Prompt-Engineer, Prompt-Designer oder Prompt-Artist.
Ob das Beimessen eines hohen Stellenwertes an die Promptfertigkeiten gerechtfertigt ist, wird die nahe Zukunft zeigen; denn KI-Systeme sind bereits heute in der Lage, die Intentionen der Nutzer*innen auch ohne präzise Formulierungen zu verstehen und richtig zu interpretieren. Dies wirft die Frage auf, ob in Zukunft die Notwendigkeit für exakt formulierte Prompts abnehmen könnte, da KI-Systeme zunehmend besser darin werden, auch aus vagen Eingaben die gewünschten Ergebnisse abzuleiten.
Wie schnell solche Überlegungen von der Zeit überholt werden können, zeigt die neueste Demo von OpenAI zu ihrem neuen Sprachmodell GPT4o. Das Modell ist in der Lage, sich auf Tablets oder Smartphone in Echtzeit über den Bildschirm- und Kamerinhalt zu unterhalten und laut Demo an der Mimik des Nutzers die aktuelle Gefühlslage zu erkennen. Dabei sind keine ausgeklügelten oder komplizieren Prompts nötig.
Prompts als Schutzgegenstand des Urheberrechts
Urheberrechtsschutz von Prompts: Im Urheberrecht ist eine wesentliche Voraussetzung für den Schutz eines Werkes dessen Schöpfungshöhe. Dies bedeutet, dass ein Werk eine gewisse Originalität und Kreativität aufweisen muss, die über eine bloße technische Funktion hinausgeht. Bei einfachen Prompts, die lediglich aus kurzen Befehlen oder Standardfragen bestehen, ist in der Regel davon auszugehen, dass diese Schöpfungshöhe nicht erreicht wird. Solche Prompts sind primär durch ihre technische Funktion geprägt und enthalten wenig bis keinen kreativen Input des Nutzers. Folglich sind sie in der Regel urheberrechtlich nicht geschützt.
Kreativer Input als Kriterium für Schutz: Es ist jedoch denkbar, dass im Gegensatz dazu, umfangreichere Prompts, die eine deutliche kreative Leistung des Nutzers widerspiegeln, unter Umständen Urheberrechtsschutz genießen. Wenn ein Prompt beispielsweise eine komplexe Anweisung oder Fragestellung enthält, die in ihrer Formulierung individuelle Gedanken oder Ideen ausdrückt, könnte dies die erforderliche Schöpfungshöhe erreichen. Denkt man sich den Text der Eingabe beispielsweise auf einem Blatt Papier geschrieben und gesteht man diesem die erforderliche Schöpfungshöhe zu, sollte es keine Rolle spielen, dass dieser Text stattdessen digital in eine Promptzeile eingegeben wird. In solchen Fällen könnte der Prompt als urheberrechtlich geschütztes Werk angesehen werden.
Ob etwas die erforderliche Schöpfungshöhe erreicht oder nicht, ist eine Wertungsfrage und kann nicht messerscharf festgelegt oder abgegrenzt werden. Jedoch werden an die Schöpfungshöhe keine allzu hohen Anforderungen gestellt.
Schutzumfang und Output: Wichtig zu beachten ist jedoch, dass der Urheberrechtsschutz eines Prompts sich nicht automatisch auf den Output des KI-Systems erstreckt. Die Beurteilung, ob der Output schutzfähig ist oder nicht, ist unabhängig von der rechtlichen Einordnung des Prompts zu treffen. Das KI-Erzeugnis als Reaktion bzw. Folge des Prompt ist individuell zu bewerten.
Wie sieht es aus mit der Frage, ob man jeden beliebigen Inhalt in den Prompt eingeben darf? Was ist, wenn ich (fremde) Dokumente oder dergleichen analysieren möchte? Mittlerweile stellen die Anbieter der Modelle die Möglichkeit des Uploads umfangreicher Dokumente zur Verfügung, um sie zu analysieren oder sich über den Inhalt zu unterhalten.
Einbinden geschützter Inhalte und Vervielfältigung durch Prompts: Eine rechtliche Betrachtung
Es stellt sich die Frage nach der rechtlichen Zulässigkeit der Vervielfältigung dieser Inhalte durch Eingabe, Hochladen, Kopieren usw. in den Prompt. Hierbei stehen zwei wesentliche Paragraphen des deutschen Urheberrechtsgesetzes im Fokus: § 44a, der die vorübergehende Vervielfältigung regelt, und § 53, der die Privatkopie betrifft.
Vorübergehende Vervielfältigung gemäß § 44a UrhG:
§ 44a UrhG ermöglicht die vorübergehende Vervielfältigung von Werken, sofern diese Handlungen flüchtig oder begleitend sind und eine eigenständige wirtschaftliche Bedeutung nicht besitzen: Die Nutzung des Werkes muss sich auf den bloßen Konsum des Nutzers beschränken, darf darüber also nicht hinausgehen.
Problematisch ist, dass -je nach Anbieter- der/die Nutzer*in keine Kontrolle darüber hat, was mit dem Input geschieht und ob dieser gespeichert und für das weitere Training genutzt wird.
In einem solchen Fall wären die Ausnahmebedingungen nicht erfüllt, so dass die Vervielfältigung rechtswidrig erfolgen würde.
Privatkopie nach § 53 UrhG:
Die Erstellung von Privatkopien für den persönlichen Gebrauch ist unter § 53 UrhG geregelt. Dieser Paragraph erlaubt es Individuen, Kopien von urheberrechtlich geschützten Werken für den privaten Gebrauch anzufertigen (“sofern sie weder unmittelbar noch mittelbar Erwerbszwecken dienen”).
Auch hier ist es stark fragwürdig, ob die Einhaltung der Rechtmäßigkeitsvoraussetzungen des § 53 UrhG möglich ist, wenn diese im Rahmen oder im Zusammenhang mit KI genutzt werden sollen.
Phase 3: Nach dem Prompt
................................................................................................................................................................................................
Phase 3 - Nach dem Prompt: Die rechtliche Einordnung des KI-generierten Outputs
Die Frage, ob und wie KI-generierte Erzeugnisse urheberrechtlich geschützt werden können, betrifft den Kern der Debatte über die Rolle künstlicher Intelligenz in der Kreativindustrie und im Urheberrecht. Insbesondere nach der Eingabe eines Prompts und der Generierung eines Werkes durch eine KI steht die rechtliche Einordnung des Outputs im Fokus.
KI-generierte Werke und Urheberrechtsschutz
Die herrschende Auffassung im deutschen Urheberrecht basiert schlicht auf dem Wortlaut des § 7 UrhG, der eine "persönliche geistige Schöpfung" erfordert. Aus dieser Formulierung wird abgeleitet, dass nur menschliche Werke Schutz genießen können und dass Werke, die durch Künstliche Intelligenz generiert werden, in der Regel keinen urheberrechtlichen Schutz beanspruchen können. Daraus folgt, dass KI-generierte Werke, unabhängig von der Erfüllung der Schöpfungshöhe durch den eingegebenen Prompt, in der Regel nicht als urheberrechtlich schutzfähig angesehen werden, da ihnen die menschliche Schöpfungsleistung fehlt. Das ist der Grundsatz, auf dem alle weiteren Überlegungen aufbauen, wenn es um die Frage geht, wann die Mitwirkung von KI in den Hintergrund des Schaffensprozesses tritt.
Die Rolle der KI als Werkzeug im kreativen Prozess
Es ist jedoch denkbar, dass der kreative Schaffensprozess des Menschen derart im Vordergrund steht und das Erzeugnis/Werk so entscheidend prägt, dass die KI lediglich als Hilfsmittel angesehen werden kann. Mit anderen Worten: Die KI fungiert lediglich als Instrument/Werkzeug, der kreative Schaffensprozess des Menschen ist dabei jedoch maßgeblich. Es als also denkbar, dass in Fällen, in denen die KI zur Erweiterung der menschlichen Schaffenskraft eingesetzt wird, und der Anteil der KI nach wertender Betrachtung als unerheblich bei der Erstellung angesehen wird, das Endprodukt in den Genuss des urheberrechtlichen Schutzes kommt.
KI-Erzeugnisse und künstlerischer Stil
Besonders relevant ist die Frage: Was ist, wenn ich mithilfe von KI Bilder im Stile eines Künstlers erstelle? Etwa, wenn ich dies direkt in der Prompt eingebe und das KI-Erzeugnis zielgerichtet in diese Richtung lenke?
Stil eines Künstlers und Gemeinfreiheit:
Genausowenig, wie Ideen, Konzepte, Fakten, Informationen, wissenschaftliche Erkenntnisse und Informationen als solche geschützt sind, ist der Stil eines Künstlers nicht vom Schutz umfasst. Der Stil kann frei nachgeahmt werden, solange keine spezifischen, urheberrechtlich geschützten Werke kopiert werden.
KI-Erzeugnisse und bestehende, geschützte Werke:
Die Herausforderung entsteht, wenn ein KI-Erzeugnis einem bestehenden, geschützten Werk so nahekommt, dass es als Vervielfältigung oder Bearbeitung dieses Werkes angesehen werden könnte. Die Beurteilung, inwieweit ein Werk in einem neuen KI-Erzeugnis in nicht mehr erkennbarer Weise aufgeht, ist eine komplexe Wertungsfrage. Sie lässt sich nicht pauschal beantworten, sondern erfordert eine Einzelfallbetrachtung, die die urheberrechtliche Relevanz der Nutzungshandlung bewertet.
Risiko von Urheberrechtsverstößen:
Daraus ergibt sich das potenzielle Risiko, dass im Output einer KI geschützte Werke enthalten sind und somit ein Verstoß gegen das Urheberrecht begangen werden kann. Dies ist besonders dann der Fall, wenn die KI Inhalte generiert, die existierenden Werken zu ähnlich sind oder diese in einer Weise nutzen, die über die reine Inspiration oder den Stil hinausgeht und in den Bereich der konkreten Nachbildung oder unzulässigen Bearbeitung fällt. Anders ausgedrückt: Im Output sind geschützte Werkteile Dritter enthalten.