Symbolbild zu KI-Training und Urheberrecht: Laptop mit anonymisierten Bildkacheln und Metadaten (Links/Alt-Texte) neben einem Dokument mit Paragraphenzeichen, im Hintergrund eine unscharfe Gerichtsfassade.

KI-TRAINING UND URHEBERRECHT

OLG Hamburg konkretisiert: Wann dürfen Fotos für KI-Datensätze und Text- und Data-Mining genutzt werden?

Mit Urteil vom 10. Dezember 2025 (Az. 5 U 104/24) hat das Oberlandesgericht Hamburg erstmals in grundsätzlicher Weise klargestellt, unter welchen urheberrechtlichen Voraussetzungen Fotografien aus dem Internet für die Erstellung und Nutzung von KI-Datensätzen herangezogen werden dürfen.

Die Entscheidung liefert wichtige Orientierungspunkte für die Praxis – sowohl für Rechteinhaber als auch für Betreiber von Datensätzen und KI-Systemen.

Gegenstand des Verfahrens war die Klage eines professionellen Fotografen gegen einen eingetragenen Verein, der einen öffentlich zugänglichen Datensatz mit rund 5,85 Milliarden Bild-Text-Paaren bereitstellt. Solche Datensätze bilden eine zentrale Grundlage für das Training moderner, bild- und sprachbasierter KI-Systeme.

Was sind KI-Datensätze?

KI-Datensätze bestehen aus sehr großen Mengen strukturierter digitaler Informationen, die es Künstlicher Intelligenz ermöglichen, Muster, Zusammenhänge und Bedeutungen zu erlernen. Sie fungieren gewissermaßen als „Lernmaterial“ für KI-Modelle.

Im hier entschiedenen Fall enthielt der Datensatz keine Bilddateien selbst, sondern ausschließlich:

  • einen Hyperlink (URL), der auf ein im Internet abrufbares Bild verweist, sowie
  • eine textliche Beschreibung des Bildinhalts, etwa in Form eines sogenannten Alt-Texts.

Der veröffentlichte Datensatz enthielt keine Bilddateien, sondern ausschließlich Metadaten (insbesondere URLs und textliche Beschreibungen/Alt-Texte). Damit sollten KI-Systeme (und deren Training) dabei unterstützt werden, Zusammenhänge zwischen Bildinhalten und sprachlichen Beschreibungen zu erkennen und zuzuordnen.

Ob die im Zuge des automatisierten Abgleichs heruntergeladenen Bilddateien anschließend gelöscht wurden, blieb zwischen den Parteien streitig. Für die Entscheidung war das aber nicht ausschlaggebend, weil es rechtlich vor allem darauf ankam, dass der veröffentlichte Datensatz nach den Feststellungen des OLG keine Bildkopien, sondern nur Verweise/Metadaten enthielt; weitergehender Vortrag des Klägers zur tatsächlichen Speicherung war zudem prozessual nicht entscheidungserheblich.

Wie wurden die Daten gewonnen? – Scraping verständlich erklärt

Zur Erstellung des streitgegenständlichen Datensatzes bediente sich der Beklagte eines mehrstufigen, vollständig automatisierten Verfahrens:

  1. Ausgangspunkt war ein bereits bestehender US-amerikanischer Datensatz, der für eine Vielzahl von Internetbildern die jeweiligen Bild-URLs sowie textliche Bildbeschreibungen enthielt.
  2. Die über diese URLs erreichbaren Bilder wurden automatisiert aus dem Internet heruntergeladen.
  3. Anschließend überprüfte eine Software, ob der tatsächliche Bildinhalt mit der vorhandenen textlichen Beschreibung übereinstimmte.
  4. Bild-Text-Kombinationen, bei denen keine ausreichende Übereinstimmung festgestellt wurde, wurden herausgefiltert.
  5. In dem neu erstellten Datensatz verblieben schließlich ausschließlich Metadaten, insbesondere die jeweilige URL des Bildes sowie dessen Beschreibung.

Dieses automatisierte Vorgehen wird im technischen und rechtlichen Kontext regelmäßig als „Scraping“ bezeichnet. Darunter versteht man das maschinelle Abrufen und Auswerten öffentlich zugänglicher Inhalte, ohne dass jede einzelne Abfrage durch einen Menschen manuell ausgelöst wird.

Die streitgegenständlichen Downloads fanden in der zweiten Jahreshälfte 2021 statt.

Kontaktieren Sie uns und vereinbaren Sie einen Beratungstermin!

Das streitgegenständliche Foto

Auch ein Foto des klagenden Fotografen wurde im Rahmen des beschriebenen automatisierten Verfahrens erfasst und heruntergeladen. Dabei handelte es sich nicht um das hochauflösende Originalbild, sondern um eine mit einem Wasserzeichen versehene Vorschauversion, die auf der Website einer Bildagentur öffentlich zugänglich war. Das OLG behandelte das Foto jedenfalls als Lichtbild i.S.d. § 72 UrhG (ohne Feststellung eines Lichtbildwerks) und prüfte die Schranken zudem im Lichte des Drei-Stufen-Tests.

Eine Lizenz für diese Nutzung hatte der Beklagte nicht erworben. Auf der Website der Bildagentur fand sich allerdings ein englischsprachiger Nutzungshinweis, der den Einsatz automatisierter Programme (Bots, Scraping-Tools) untersagte.

Die Kernaussagen des OLG Hamburg

Das Oberlandesgericht Hamburg hat die Klage abgewiesen und die Nutzung des Fotos als urheberrechtlich zulässig angesehen. Ausschlaggebend war die Anwendung der Schranke für Text- und Data-Mining (§ 44b UrhG). Unabhängig davon hat das OLG die Zulässigkeit der Nutzung auch auf die Forschungsschranke (§ 60d UrhG) gestützt.

Nach Auffassung des Gerichts stellt das automatisierte Herunterladen und Auswerten des Fotos Text- und Data-Mining im Sinne des § 44b UrhG dar. Die Norm erfasst jede automatisierte Analyse digitaler Werke zur Gewinnung von Informationen, etwa über Zusammenhänge oder Korrelationen. Dazu zählt auch der softwaregestützte Abgleich eines Bildes mit seiner textlichen Beschreibung.

Eine Rechtfertigung über § 44a UrhG (flüchtige/begleitende Vervielfältigungen) lehnte das OLG ab, weil der Download zur Analyse gezielt erfolgte und weder flüchtig noch (rein) begleitend war. § 44b UrhG greift auch bei der Analyse einzelner Werke und auch dann, wenn der Vorgang nur der automatisierten Validierung für ein späteres KI-Training dient. Entscheidend ist die automatisierte Informationsgewinnung; das Foto war online rechtmäßig zugänglich.

Ob schon aufgrund der Online-Zugänglichkeit eine schlichte Einwilligung anzunehmen wäre, ließ das OLG ausdrücklich offen, weil die Nutzung bereits über die Schranken gerechtfertigt war.

Fachanwalt für Urheber- und Medienrecht
Fachanwalt für Gewerblichen Rechtsschutz
Master of Laws (Medienrecht & IP)

Kein wirksamer Nutzungsvorbehalt mangels Maschinenlesbarkeit

Zentral für die Entscheidung war die Frage, ob der Fotograf die Nutzung seines Werks wirksam ausgeschlossen hatte. § 44b Abs. 3 UrhG erlaubt Text- und Data-Mining nur dann nicht, wenn der Rechteinhaber einen maschinenlesbaren Nutzungsvorbehalt (Opt-out) erklärt hat.

Bei online zugänglichen Inhalten ist ein Nutzungsvorbehalt nach § 44b Abs. 3 UrhG nur wirksam, wenn er maschinenlesbar erklärt wird, also von automatisierten Systemen auffindbar, zuordenbar und auswertbar ist.

Im entschiedenen Fall reichte der bloß natürlichsprachliche Hinweis in den Nutzungsbedingungen nicht aus, weil der Kläger für den maßgeblichen Zeitpunkt 2021 nicht darlegen konnte, dass dieser Vorbehalt technisch so ausgestaltet war, dass automatisierte Systeme ihn zuverlässig erkennen und auswerten konnten. Das OLG lässt dabei offen, ob natürlichsprachliche Hinweise grundsätzlich genügen könnten; entscheidend war hier das fehlende konkrete Vorbringen zur Maschinenlesbarkeit 2021.

Das OLG stellte klar, dass der Nutzer grundsätzlich darlegen muss, dass kein wirksamer Nutzungsvorbehalt nach § 44b Abs. 3 UrhG entgegensteht. Behauptet der Rechteinhaber einen solchen Vorbehalt, trifft ihn jedenfalls eine sekundäre Darlegungslast zur konkreten technischen Ausgestaltung – insbesondere dazu, ob der Vorbehalt zum Zeitpunkt der Nutzung (hier: 2021) maschinenlesbar bzw. maschinell auswertbar war; daran fehlte es hier.

Im vorliegenden Fall beschränkte sich der Vorbehalt auf einen textlichen Hinweis in den Nutzungsbedingungen der Website. Der Kläger konnte nicht hinreichend substantiiert darlegen, dass dieser Hinweis im Jahr 2021 technisch so ausgestaltet war, dass er von automatisierten Systemen zuverlässig erkannt und korrekt ausgewertet werden konnte. Der Nutzungsvorbehalt war daher rechtlich unwirksam, sodass die Schranke des § 44b UrhG zugunsten des Beklagten eingriff.

Kontaktieren Sie uns und vereinbaren Sie einen Beratungstermin!

Kein unzulässiger Eingriff in die wirtschaftliche Verwertung

Das OLG sah in der konkreten Nutzung auch keinen unzulässigen Eingriff in die normale Verwertung des Fotos. Ausschlaggebend war insbesondere, dass die Vervielfältigung lediglich einem internen Verarbeitungsschritt diente und der veröffentlichte Datensatz keine Bildkopien, sondern lediglich Verweise auf externe Quellen enthielt.

Der allgemeine Einwand, KI-Systeme könnten künftig als Konkurrenz für kreative Leistungen auftreten, genügt nach Auffassung des Gerichts nicht, um die Anwendung der gesetzlichen Schranke auszuschließen.

Zusätzlich gerechtfertigt durch die Forschungsschranke

Unabhängig davon stützte das OLG die Zulässigkeit der Nutzung auch auf die Forschungsschranke des § 60d UrhG. Das OLG ordnete die Tätigkeit des Beklagten als nicht-kommerziell im Sinne der Forschungsschranke ein (maßgeblich: keine Gewinnorientierung). Es setzte sich auch mit dem Vorwurf eines entgeltlichen/privilegierten Zugangs (5.000 US-$) auseinander, sah darin aber keinen hinreichenden Beleg, dass der Datensatz „zu kommerziellen Zwecken“ bereitgestellt wurde.

Dass Dritte – auch Unternehmen – den Datensatz später verwenden können, steht der Anwendung der Schranke nicht entgegen, solange kein bestimmender Einfluss eines Unternehmens auf die Tätigkeit des Beklagten besteht.

SternSternSternSternStern

ANWALT.DE 5,0
von 79 Bewertungen

SternSternSternSternStern

GOOGLE 4,9
von 45 Bewertungen

SternSternSternSternStern

PROVENEXPERT 4,91
von 140 Bewertungen

Was bedeutet das Urteil in der Praxis?

Das Urteil des OLG Hamburg liefert wichtige Orientierungspunkte für den Umgang mit urheberrechtlich geschützten Fotos in KI-Datensätzen. Es zeigt, dass die Nutzung öffentlich zugänglicher Inhalte für KI-Zwecke nicht grundsätzlich unzulässig ist, zugleich aber hohe Anforderungen an technische Gestaltung und rechtliche Sorgfalt stellt.

Für Fotografen und Kreative bedeutet die Entscheidung, dass allgemeine Scraping-Verbote im Einzelfall nicht ausreichen können, wenn sie nicht maschinenlesbar umgesetzt und für den Nutzungszeitpunkt belegbar sind. Wer die Nutzung seiner Werke für KI-Training ausschließen will, muss einen maschinenlesbaren Nutzungsvorbehalt erklären und dessen technische Umsetzung sowie zeitlichen Bestand im Streitfall belegen können.

Für KI-Unternehmen und Datensatzanbieter bestätigt das Urteil, dass Text- und Data-Mining rechtlich zulässig sein kann, sofern wirksame Opt-outs beachtet werden. Eine interne Verarbeitung der Inhalte und die Veröffentlichung ausschließlich in Form von Links statt Bildkopien reduzieren dabei das rechtliche Risiko erheblich. Entscheidend ist eine lückenlose Dokumentation der Datenerhebung und -verarbeitung.

Das OLG Hamburg hat die Revision zugelassen. Eine Entscheidung des Bundesgerichtshofs ist daher zu erwarten und dürfte weitere Klarheit zum Verhältnis von KI-Training und Urheberrecht schaffen.

Fachanwalt für Urheber- und Medienrecht
Fachanwalt für Gewerblichen Rechtsschutz
Master of Laws (Medienrecht & IP)

Geßner Legal – Ihre Ansprechpartner im Urheberrecht

Ob Sie Rechteinhaber sind und Ihre Werke schützen oder Ansprüche durchsetzen möchten – oder ob Ihnen als Nutzer, Unternehmen oder Plattform eine Urheberrechtsverletzung vorgeworfen wird: Wir beraten und vertreten Sie im Urheberrecht.

Die Geßner Legal Medienkanzlei unterstützt sowohl bei der außergerichtlichen Klärung als auch bei der gerichtlichen Durchsetzung bzw. Abwehr von Ansprüchen. Wir prüfen die Rechtslage, bewerten Kosten- und Haftungsrisiken und entwickeln eine pragmatische, rechtssichere Strategie.

Kontakt: kontakt@gessner-legal.de


Kontaktieren Sie uns und vereinbaren Sie einen Beratungstermin!

Aktuelle Beiträge

Erfahrungen & Bewertungen zu Rechtsanwalt David Geßner

News

Abmahnung wegen „Wonderful Dream“ von Melanie Thornton

Die IPPC LAW mahnt aktuell erneut zahlreiche Social-Media-Nutzer wegen der Nutzung des Songs „Wonderful Dream (Holidays Are Coming)“ ab. Besonders Nutzer von TikTok, Instagram und anderen Plattformen geraten ins Visier, wenn sie Musik in Reels oder Kurzvideos einsetzen, ohne über die erforderlichen Rechte zu verfügen.

Auslistungsanspruch nach Art. 17 DSGVO

Neues Video veröffentlicht: Auslistungsansprüche nach DSGVO – So lassen sich Google-Suchergebnisse entfernen Unser neues YouTube-Video ist jetzt verfügbar! Fachanwalt David Geßner erklärt darin, wie Betroffene veraltete oder rechtswidrige Inhalte aus…
Chat Icon
Logo

Guten Tag,

Wir stehen Ihnen gerne bei allen rechtlichen Fragen zur Seite. Kontaktieren Sie uns jederzeit für Unterstützung. Nutzen Sie unseren Wegweiser für eine vereinfachte Navigation.

Beratungsgespräch buchen Beratungsgespräch buchen
Kontakt Kontakt
Schnellhilfe Schnellhilfe
Rechtsgebiete Rechtsgebiete
In den Medien In den Medien

HTML Snippets Powered By : XYZScripts.com