Home / Geschäft und Politik / Wie man Fotografien und Daten vor generierter künstlicher Intelligenz schützt

Wie man Fotografien und Daten vor generierter künstlicher Intelligenz schützt

Image by: foto

In letzter Zeit gab es viel Diskussion im Internet über Texte und Fotografien, die von künstlicher Intelligenz generiert wurden, was viele Debatten und Ängste innerhalb der kreativen Gemeinschaft ausgelöst hat. Kreative haben protestiert, weil KI-Generatoren künstlerische Werke, Texte und alle anderen Arten von geistigem Eigentum nutzen, um ’neue‘ Versionen zu erstellen, natürlich ohne die Zustimmung der menschlichen Schöpfer.

Während es Spaß macht, die Werke längst verstorbener Künstler wie Van Gogh oder Frida Kahlo mit einem KI-Generator nachzuahmen, gilt dies nicht für lebende Künstler. Wenn fast jeder ein Bild ‚im Stil‘ eines Künstlers erstellen kann, was viele Generatoren anbieten, kann dies dazu führen, dass ihr Markt mit Kopien überschwemmt wird, was sicherlich zu Authentizitätsproblemen und potenziellem Einkommensverlust für Künstler und Kreative führt.

Als Reaktion darauf suchen die Menschen nach Möglichkeiten, ihre Bilder und Werke vor KI-Kunstgeneratoren zu schützen.

Wie KI-Generatoren Daten erhalten

KI-Kunstgeneratoren durchlaufen eine ‚Trainings‘-Phase, um zu lernen, ein Bild zu erzeugen, wenn ihnen eine textuelle Anfrage gegeben wird. Im Rahmen des Lernprozesses ist es notwendig, Hunderte Millionen von Bild-Text-Paaren zu studieren, um letztendlich ein genaues Bild von Objekten, Farben und Szenen aus der realen Welt zu erstellen – zusammen mit künstlerischen Techniken und Stilen. Wie so oft müssen KI-Modelle von menschlicher Kreativität lernen.

Zum Beispiel sind Midjourney und Stability Diffusion zwei KI-‚Kunst‘-Generatoren, die auf dem Open-Source-Datensatz LAION-5B trainiert wurden, der Milliarden von Bildern aus dem Internet enthält. Mit Hilfe von Web-Indexierungstools zum Scraping von Websites für Daten erstellen diese Datensätze Listen von Bild-URLs sowie deren Titel, in etwas, das wie eine massive Excel-Tabelle aussehen könnte.

Opting Out von KI-Trainingsdatensätzen

Eine Gruppe von Künstlern, die sich unter dem Spitznamen ‚Spawning‘ versammelt hat, hat eine Website namens ‚Have I Been Trained?‘ ins Leben gerufen, die es Ihnen ermöglicht zu überprüfen, ob Ihre Werke und Bilder im LAION-5B-Datensatz enthalten sind, und es gibt auch eine Opt-out-Funktion aus dieser Datenbank. Laut der Vereinbarung leitet Spawning die Opt-out-Listen der Benutzer aus der LAION-5B-Datenbank weiter, aber es gibt keine Vereinbarungen mit anderen Datensätzen.

Da viele KI-Unternehmen keine Details darüber offenlegen, wie ihre KI-Modelle aufgebaut sind, ist manchmal unklar, welchen Datensatz sie verwenden. DALL-E ist ein beliebter KI-Kunstgenerator, der beispielsweise diese Informationen nicht teilt. Alternativ, wenn Sie beispielsweise DeviantART verwenden, um Ihre Kunstwerke zu teilen, sind Ihre Bilder standardmäßig vor der Verwendung für KI-Trainingsdatensätze geschützt. DeviantART kennzeichnet Bilder mit dem ’noai‘-Label, was bedeutet, dass, wenn festgestellt wird, dass ein KI-Modell dieses Bild für das Training verwendet hat, dies gegen die Nutzungsbedingungen von DeviantART verstoßen würde.

Natürlich sind diese Opt-out-Maßnahmen nicht durchsetzbar, sodass Dritte sie ignorieren können, wenn sie möchten. Obwohl dies nicht die effektivste Lösung ist, ist es auf dem richtigen Weg, um mehr Regeln und Vorschriften zum Schutz von Künstlern einzuführen.

In einer idealen Welt würden die Menschen die Möglichkeit haben, sich aktiv anzumelden, anstatt sich abmelden zu müssen.

Schützen Sie Ihre Arbeit mit Urheberrecht

Anfang 2023 war die renommierte Comic-Künstlerin Sarah Andersen Teil einer Gruppe von Künstlern, die Klage gegen die KI-Unternehmen Stability AI und Midjourney sowie die Kunstsharing-Website DeviantART erhoben, weil sie ihre Kunst ohne Zustimmung gescraped haben. Ein weiteres Beispiel ist die Website Getty Images, die Klage gegen Stability AI erhoben hat, weil sie ihre Bilder ohne Lizenz gescraped hat.

Die Art und Weise, wie er entdeckte, dass seine urheberrechtlich geschützten Bilder verwendet wurden, war, als KI-generierte Bilder mit dem Wasserzeichen von Getty Images auftauchten – was ein ziemlich offensichtlicher Fehler der KI ist. Während die Rechtmäßigkeit zu gegebener Zeit geklärt wird, ist das Urheberrecht eines der wenigen Dinge, die Künstler nutzen können, um für die Rechte an ihren Werken zu kämpfen. Es ist eine Praxis, die es wert ist, darüber zu lernen, damit Sie Ihre Arbeit vor Diebstahl schützen können, unabhängig davon, ob KI beteiligt ist oder nicht.

Crawler mit Robots.txt blockieren

Crawler werden für die Indizierung verwendet und sind nützlich, um Suchmaschinen wie Google zu helfen, die relevantesten Informationen zu finden und zu indizieren, die auf der Suchergebnisseite angezeigt werden. Andere werden verwendet, um Bilder von Websites zu suchen, um sie in KI-Trainingsdatensätze aufzunehmen.

Hier kommt Robots.txt ins Spiel. Robots.txt ist eine Textdatei, die im Backend-Code einer Website platziert werden kann, um Web-Crawlern mitzuteilen, was sie scannen und indizieren können und was nicht. Robots.txt kann auch verwendet werden, wenn Sie nicht möchten, dass KI Ihre Bilder scrapt.

Was in der Zukunft zu erwarten ist

Einerseits sind rechtliche Verfahren im Gange, um zu bestimmen, was legal ist und wie das Urheberrecht bei KI-generierten Bildern funktioniert. Solche Verfahren sowie öffentliche Diskussionen werden rechtliche Standards und möglicherweise Vorschriften festlegen, die KI-Unternehmen einhalten müssen. Andererseits denken Entwickler darüber nach, wie das Problem mit neuer Technologie gelöst werden kann. In einer vielversprechenden Studie zeigt die Forschung, dass Sie künstliche Intelligenz nutzen können, um gegen sich selbst zu kämpfen, indem Sie ein Bild ‚unsichtbar‘ für die Datensätze machen, die zum Training von KI verwendet werden.

Markiert: