Bilder vor KI schützen, wie geht das?

Nightshade und Glaze sind zwei Softwarelösungen, womit das Web-Scraping von KI-Firmen einen Riegel geschoben werden soll. Die beiden Produkte sind deshalb erste Versuche, Copyright-Verletzungen vorzubeugen. Wie schützen wir uns vor der dunklen Seite der Macht?

Künstliche Intelligenz arbeitet mit Modellen. Diese Modelle sind Algorithmen, die für spezifische Zwecke trainiert werden. Dafür werden im Netz gefundene Texte und Bilder benutzt. Eine solche Nutzung führt unweigerlich zu verschiedenen rechtlichen und ethischen Fragen. Die Bildindustrie ist stark betroffen, einerseits, weil Fotos von Fotografen ungefragt und ohne Entgelt genutzt werden, andererseits, weil die so gefütterten Modelle für die Erzeugung neuer Bilder genutzt werden, und sogar die Stilmerkmale von Fotografen kopieren können.

Glaze und Nightshade

Neulich wurden von der Universität von Chicago zwei Produkte lanciert, die Bilder für Künstliche Intelligenz verbergen. Es sind die zwei Produkte Glaze und Nightshade. Beide Produkte ändern Bilder. Die Änderungen sind für das menschliche Auge nicht sichtbar, jedoch wird das Bild von Künstlicher Intelligenz auf andere Art interpretiert. KI schaut direkt auf die Datei, während das menschliche Auge die 2D-Darstellung interpretiert.

  • Glaze ändert den Stil des Bildes
    KI wird abgelenkt.
  • Nightshade ändert die Elemente des Bildes
    KI wird gestört.

Beide Werkzeuge erstellen so etwas, wie eine extra Dimension im Bild, die vom menschlichen Auge kaum wahrgenommen wird, jedoch bei der Verarbeitung von KI zu deutlich unterschiedlichen Resultaten führt. Das funktioniert nicht bei allen Bildtypen gleichermassen gut und es gibt deswegen unterschiedlichen Stärken, womit diese Bildoptimierung berechnet werden kann. Als Resultat werden neue Bilddateien generiert, die dann etwa auf Websites hochgeladen werden können.

Beide Werkzeuge generieren nicht so etwas wie ein Wasserzeichen, sondern das Bild wird gesamthaft angepasst. Diese Technologie ist auch dann wirksam, wenn das Bild beschnitten oder abgeändert wird.

Defensiv und offensiv

Auf der Website der Universität werden die Unterschiede zwischen Glaze und Nightshade als «defensiv» und «offensiv» beschrieben. Glaze führt AI-Werkzeuge auf eine falsche Fährte und gaukelt ein Stil vor, der im Bild nicht vorhanden ist. Nightshade irritiert offensiv mit einer Änderung der Bildelemente.

Beide Werkzeuge ergänzen sich und es soll bereits an einer kombinierten Software gearbeitet werden. Zweifellos werden weitere Werkzeuge entwickelt, denn die Gesetzgebung hinkt noch lange hinter der technischen Entwicklung hinterher. Ein Nachteil der Lösungen bleibt, dass es ein extra Arbeitsschritt bedeutet, die auch Zeit beansprucht. Der Vorteil liegt darin, dass jeder selbst seine Arbeit schützen kann, bevor sie online gestellt werden.


Nationale und internationale Verbände für die Bildindustrie

Wer Bilder produziert oder einkauft, hat mit Bildrechten, Preise und verschiedenen Lizenzierungsmodellen zu tun. Rechtliche Aspekte sind ebenso wichtig wie ein gutes Verständnis über Rechte und Pflichten bei der Produktion, dem Einkauf oder der Verwendung von Bildmaterial. Nationale und internationale Organisationen können dabei helfen, die Anliegen aller Beteiligten eine Stimme zu geben.

Es gibt viele Verbände, die für ihre Mitglieder eine gemeinsame Stimme bilden können. Dazu zählen etwa Fotografen-Verbände, aber auch Verbände von Bildagenturen. Auf Wikipedia findet sich eine Liste mit solchen unterschiedlichen Verbänden:

Es geht jedoch um mehr als einzelne Aspekte. Fotografen-Verbände etwa kümmern sich um Fotografen, weniger um Bildagenturen. Verbände wie die BVPA in Deutschland, die SAB in der Schweiz, die BAPLA in Grossbritannien oder die SNAPIG in Frankreich sind Verbände für Bildagenturen. Bildagenturen gehören zu einer Bildindustrie, die von der Vermarktung von Fotos und Illustrationen lebt.

Fotografen können jedoch auch in Lohndienst stehen, sich mit Hochzeitsfotografie oder Architekturfotografie profilieren, sich ausschliesslich um Kunstfotografie oder etwa Museumsdokumentationen kümmern. Ihre Anliegen sind unterschiedlich, je nach Ausrichtung. Eine Bildindustrie jedoch will die Bilder von Fotografen für andere nutzbar machen. Ihre Anliegen sind speziell, und rechtlich oft viel komplexer.

Bildagenturen stehen schon länger unter Druck. Dafür gibt es mehrere Gründe:

  • Kunden kennen sich nicht aus und erwarten Microstock-Preise für exklusive Rechte
  • Grosse Technologie-Firmen nutzen Online-Bildmaterial (Google, Facebook & Co.), ohne dass die Fotografen davon profitieren.

Bei der rasanten Technologie-Entwicklung fehlt häufig ein rechtlicher Rahmen. Missbrauch von Fotografenleistungen wird nicht geahndet, weil es dafür keine Gesetze gibt. Die CEPIC etwa, ein internationaler Zusammenschluss von nationalen Organisationen und weiteren Partnern, setzt sich auf Europäischem Niveau dafür ein, dass Missbrauch von Fotografen und Bildagenturen durch grosse Techfirmen einen Riegel geschoben wird.

Wer sich für politische Lösungen einsetzt, kann dies in der Regel nicht als Firma oder Privatperson. Deshalb sind nationale und internationale Firmen wichtig. Sie repräsentieren die Anliegen einer grösseren Gruppe und sind deshalb politisch relevanter. Durch diese Zusammenschlüsse können rechtliche Fragen besser geklärt und auch mit entsprechendem Gewicht auf die politische Agenda landen.

Die CEPIC ist vielleicht am ehesten bekannt wegen des jährlichen Kongresses. Das ist nicht nur eine gute Gelegenheit, sich international zu vernetzen, sondern es gibt viele Vorträge und Einblicke in aktuelle Diskussionen. Dazu hier einen Einblick aus 2023:


Deep Steaks und Deep Fakes

Jeder hat schon einmal von Deepfakes gehört, diese Videos, die von künstlicher Intelligenz erzeugt werden. Oft werden bekannte Personen abgebildet, täuschend echt, und ihnen werden Aussagen in den Mund gelegt, die sie nie gesagt haben. Es geht um Manipulation von Zuschauern und Meinungsbildung.

Man könnte meinen, diese Deepfakes betreffen nur Politiker und bekannte Persönlichkeiten. Es geht jedoch um mehr. Deepfakes können eine direkte Beeinflussung von unserer eigenen Identität und unserer Gesellschaft werden. Jetzt gibt es eine Website, die dies anschaulich vor Augen führt.

Auf der Website deepsteaks.ai gibt es ein anschauliches Beispiel, wie Deepfakes Aussagen von jedem Menschen beeinflussen können.

Auf der Website deepsteaks.ai erklärt ein soziales Experiment, wie Menschen mittels Deepfakes Dinge sagen, die sie nie gesagt haben. Konkret geht es darum, dass Veganer mittels Deepfakes aussagen, dass Sie Fleisch besonders geniessen. Die Website sagt, dass diese Entwicklungen jeden betreffen können und deshalb politische Stellungnahmen wichtig sind.

Interessanterweise wird die Website von einer Firma initiiert, die echten Steak verkauft. Website und Video kann man hier anschauen:

Deepsteaks.ai

Berichterstattung in Zeiten des Krieges

Kriege und kriegerische Auseinandersetzungen finden heute an mehreren Fronten statt. Eine Front ist die Berichterstattung und Manipulation der Sozialen Medien. Darin geht es um mehrere Ebenen. Eine wichtige Rolle steht darin die Benutzung von Bildmaterial zu. Fotos und Videos werden heute weit häufiger manipuliert als vor wenigen Jahren.

Die Front in den Medien

Zwei Konflikte der letzten Jahre seien hier beispielhaft genannt: Russlands Angriff auf die Ukraine und Hamas‘ Angriff auf Israel. Sie werden ganz stark über Desinformation genährt. Desinformation baut mithilfe verschiedener Dinge eine alternative Wirklichkeit auf. Dazu wird die Geschichte kurzerhand neu geschrieben, es werden Menschen mit Zahlen manipuliert (mehr Verwundete = mehr Zuspruch in den Medien), und nicht zuletzt wird mit Bildmaterial jede Behauptung verstärkt.

Ist Berichterstattung neutral? Das lässt sich schnell hinterfragen, denn die Fakten müssen immer interpretiert werden. Aus der Berichterstattung entsteht eine Narrative. Sie liegt näher oder ferner von den Fakten weg und ist häufig durch Missinterpretation und Vorurteile genährt. Guter Journalismus ist entscheidend wichtig, aber in den Sozialen Medien funktionieren ganz andere Mechanismen. Manipulation wird oft bewusst gefördert. Die Wahl von Donald Trump 2016 war etwa auf Manipulation über Social Media zurückzuführen (Cambridge-Analytica Skandal).

Ein aktuelles Beispiel ist der Krieg zwischen Russland und der Ukraine. Auf der Website newsguardtech.com werden per heutigem Datum 410 Websites mit Falschinformationen zum Russischen Krieg gegen Ukraine verfolgt. Alle diese Websites verbreiten gezielt Falschinformationen, in einem Versuch, die Wahrnehmung zum Krieg der russischen Narrative anzupassen. Auf der Seite des deutschen Correctiv erschien einen Beitrag, der an beiden Seiten des Krieges Falschinformationen darstellt.

Dies ist die Front in den Medien. Es wird massiv Propaganda gemacht. Dafür werden auch Bilder und Videos manipulativ eingesetzt. Faktenchecker gibt es viele, oft mit einem bestimmten Fokus. Deutschsprachige Faktenchecker sind etwa folgende:

Weitere Angaben und Links finden sich beispielsweise auf Wikipedia.

Manipulation von Fotos und Videos

Eine falsche Berichterstattung wird über falsche Bilder und Videos erreicht. Es gibt ein berühmtes Foto aus dem Konflikt zwischen Israel und Arabern aus Gaza und Westbank. Dabei war das Foto zwar echt, aber es wurde nicht vollständig gezeigt. Eine falsche Bildunterschrift hat die Fake-Nachricht dann vervollständigt. Hier gibt es die Geschichte zum Bild:

Es gibt massenhaft Fotos, die manipuliert wurden, um die Narrative der «brutalen israelischen Armee gegen wehrlose Palästinenser» zu begründen. HonestReporting deckt aber auf, dass gerade das Gegenteil stattgefunden hat. Seitdem berichtet HonestReporting zu Falschdarstellungen über Israel in den Medien.

Pallywood

Es gibt einen Ausdruck für falsche Bilder aus offiziellen palästinensischen Quellen: Pallywood, ein Wort zusammengesetzt aus «Palästina» und «Hollywood». Spätestens seit der zweiten Intifada werden immer wieder Bilder und Videos veröffentlicht, die von Mediencrews erstellt wurden. Es werden Menschen als Schauspieler für inszenierte Szenarien engagiert. So entstehen Fotos und Videos, die falsche Narrative unterstützen. Tote und Verwundete sind oft weder tot noch verwundet, sondern nur Teil einer filmischen Darstellung.

Einige der Darstellungen werden auch als falsch entlarvt:

Es ist nicht immer einfach, zu erkennen, worum es geht. Bilder aus Gaza gibt es meist nicht aus unabhängigen Quellen.

Falsche Zuordnung von Fotos und Videos

Regelmässig gibt es Fotos und Videos, die nichts mit dem angeblichen Ereignis zu tun haben. Es handelt sich zwar um richtige Bilder, aber die Zuordnung ist nicht korrekt. Hier ein Beispiel:

Hier kann man nur die Quellen prüfen. Wer redaktionelle Bilder einsetzen möchte, sollte sich um die korrekten Angaben kümmern. Es hilft, Bilder bei etablierten Bildagenturen und Fotografen einzukaufen. Auch dort sollte man sich für korrekte Angaben einsetzen.

KI-generierte Bilder und Deep Fakes

Mittlerweile wurde Bildmanipulation und Bilderstellung durch Künstliche Intelligenz popularisiert. In der aktuellen Auseinandersetzung zwischen Israel und der Terrororganisation Hamas tauchen deshalb vermehrt Bilder auf, die mit der Wirklichkeit nichts mehr zu tun haben. Sie ersetzen sozusagen den Wert journalistischer Berichterstattung.

Auf den von mir besuchten Social-Media-Kanäle habe ich KI-generierte Bilder an beiden Seiten gesehen. Auf israelischer Seite bemüht sich etwa auch FakeReporter für mehr Transparenz bei falschen Bildern und Videos. HonestReporting etwa bietet Hintergrundinformationen, damit jeder sich besser ein eigenes Bild machen kann – eine Voraussetzung für die korrekte Interpretation von Bildern und Videos.

Manipulation von Landkarten

Es ist immer ein Problem, wenn Kontext weggelassen wird. Das gilt jedoch speziell für die Konflikte in dieser Welt. Die Wahrheit liegt nicht immer bei der Aussage. Zwar lässt sich eine Interpretation nie ganz vermeiden, aber eine bewusste Manipulation soll aufgedeckt werden. Es sei denn, auch das ist eine Manipulation.

In dieser Woche gab es etwa die Meldung, dass der Name Israel auf Karten verschiedener chinesischen Websites fehlt. Es wurde so dargestellt, dass Israel nach dem Angriff von Hamas bei China in Ungnade gefallen war und das Land kurzerhand von der Karte gefegt wurde (ganz im Sinne der Hamas).

Bei einer näheren Untersuchung wurde jedoch festgestellt, dass der Name Israel bereits länger von den genannten Karten entfernt wurde. Daraus kann geschlossen werden, dass der Name zwar fehlte, aber der Zusammenhang mit den Hamas Terrorakten war nicht gegeben.

Auch Karten sind Bilder und werden munter manipuliert, um bestimmte Narrativen zu unterstützen.

Diese geschichtliche Entwicklung von Palästina in 4 Karten wäre der Beweis dafür, dass Israel Land von Palästinensern «besetzt» und «gekapert hat». Nichts liegt jedoch ferner der Wahrheit. Karten können etwas vorgaukeln, was nie da war, etwa ein palästinensischer Staat oder ein palästinensisches Volk (beide von Yasser Arafat in den 1960ern frei erfunden). Mit dieser Karte soll die Geschichte deshalb manipuliert werden. Besonders brisant ist natürlich, dass es bis heute ein weitverbreitetes Bild ist. Diese Narrative wird hartnäckig festgehalten, aber hier widerlegt:

Geschichte einblenden

Im Rahmen dieses Beitrages können wir aus diesem Beispiel lernen, dass man die Geschichte nicht einfach ausblenden kann. Man soll auch bedenken, dass die meisten Länder im Mittleren Osten bis zum Ersten Weltkrieg Osmanisches Reich waren. Frankreich und England teilten sich als Sieger den Mitten Osten auf und daraus entstanden zuerst einige Mandatsgebiete. Frankreich hatte die Mandate Syrien und Libanon. England hatte Mandate für Mesopotamien und Palästina. Aus diesen Mandaten und einigen weiteren Initiativen wurden allmählich die heutigen Länder erschaffen. Noch heute sieht man auf der Karte des Mitten-Ostens, dass es viele kerzengerade Grenzen gibt. Sie wurden mit dem Lineal auf der Karte gezogen. Libanon, Syrien, Jordanien und auch Israel entstanden im letzten Jahrhundert.

  • 1922: Ägypten wird unabhängig vom Vereinigten Königreich
  • 1943: Libanon erklärt die Unabhängigkeit
  • 1946: Syrien wurde nach mehreren Bestrebungen faktisch unabhängig
  • 1946: Jordanien gewinnt Unabhängigkeit
  • 1948: Israel wird Unabhängig
  • 1952: Ägypten wird zur Republik

Das Erstaunliche bei dieser Liste ist, dass alle Länder, die Israel das Existenzrecht abgesprochen haben, selbst in diesen Jahren aufgerichtet wurden. Die geschichtlichen Zusammenhänge werden heute populistisch umgedeutet und zum Mainstream gemacht, wobei die Aufmerksamkeit nur auf die angebliche Besatzungsmacht Israel gelegt wird. So sieht ein Medienkrieg aus. Das spiegelt sich in den Narrativen – und auch im verwendeten Bildmaterial.

Kultur verstehen

Bilder und Karten versuchen oft nur emotionalen Grund zu erobern. Für ein besseres Verständnis hilft es, die Hintergründe der Narrativen besser zu verstehen. Dabei geht es auch um die Art der Berichterstattung. Zum Schluss dieses Beitrages deshalb ein Buchtipp. Der Journalist Joris Luyendijk arbeitete 5 Jahre im Mitten Osten und hat dabei einige Entdeckungen gemacht, die in mehreren Büchern veröffentlicht wurden. Etwa diesees hier:

Eines der Punkte, der von Joris Luyendijk sehr deutlich herausgearbeitet wurde, ist das unterschiedliche Denkmuster und die unterschiedliche Realität beim Vergleich von Europa und dem Mitten-Osten. Er beschreibt, wie Medien berichten, und dass eine westliche Sicht keinesfalls ausreicht, die Aktualität auf dem Boden zu erkennen. Die journalistische Freiheit des Westens gibt es nicht überall im Mitten Osten.

Direkte Folgen mangelhafter Berichterstattung

Es ist hilfreich, sich der Komplexität bewusst zu werden, bevor man selbst Bilder publiziert und Narrativen unterstützt. In einer mutigen Berichterstattung geht es nicht darum, die eine oder andere Seite blind zu unterstützen, sondern vor allem darum, den eigenen Beitrag zur Lösung bewusst zu werden. Seit den mörderischen Angriffen der Hamas auf die Zivilbevölkerung in Israel hat eine beispiellose Täter-Opfer-Umkehr stattgefunden. Es finden weltweit Proteste gegen Israel statt. Als Hamas am 7. Oktober Israel überfiel, blieben solche Kundgebungen aus. Nicht nur hat Hamas bewusst die Zivilbevölkerung angegriffen, sondern missbraucht die eigene Bevölkerung als Schutzschilde gegen Israel, wie in verschiedenen Berichten wiederholt festgestellt (etwa hier, hier und hier).

Seit den mörderischen Angriffen der Hamas auf die Zivilbevölkerung in Israel hat weltweit eine beispiellose Täter-Opfer-Umkehr stattgefunden.

Auf der ganzen Welt finden massive Kundgebungen statt. Es wird mittlerweile auch in Europa offen zum Mord auf Juden aufgerufen. Berechtigterweise fragen sich einige, ob die Alliierten im Zweiten Weltkrieg gegen die Nazis gewonnen hätten, wenn die Situation in der Berichterstattung wie heute ausgesehen hätte.

Es benötigt Zivilcourage, sich heute entschieden gegen Manipulation aller Art zu stellen. Das betrifft auch die Wahl der Bilder und Videos, die wir teilen, und welche Geschichten wir in Zeiten des Krieges damit fördern. Wer Bilder zur Berichterstattung einsetzt, hat sich mit gestellten Situationen, selektiver Wahrnehmung, oft ungeprüften Bildquellen und verschiedenen Narrativen auseinanderzusetzen.


Wie prüft man ob ein Bild echt ist?

Echt von unecht unterscheiden zu können, ist heute anspruchsvoller als je zuvor. Künstliche Intelligenz produziert Texte, Bilder, Videos, die zunehmend kaum noch von echt zu unterscheiden sind. Bestimmt wird sich unsere Wahrnehmung dadurch ändern, ebenso wie das tat, als nicht mehr alls gemalt und gezeichnet werden musste, sondern fotografiert werden konnte. Zeiten ändern sich und damit auch die Techniken und Technologien. Wie wir damit umgehen, will gelernt sein. Damit befasst sich auch die «Content Authenticity Initiative».

Fakt oder Fake?

Bilder können täuschen und manipulieren. Wir sind damit aufgewachsen und begegnen es auf Schritt und Tritt. Bewusst etwa wird das für Werbung eingesetzt. Produkte und Themen werden mit Bildern emotionalisiert. Produktverpackungen, Plakatkampagnen, Buchcover, Bildsprache auf einer Corporate Website – alle diese Beispiele sind Teil unserer Realität. Die Grenzen zwischen Kommunikation und Manipulation verlaufen fliessend.

Wir bewerben sogar uns selbst. Der Begriff «Person» stammt etwa vom lateinischen «Persona», ursprünglich «hindurch-tönen». Der Begriff wurde möglicherweise durch das alte römische Theater geprägt, wo Schauspieler eine Maske trugen und die «Person» durch die Maske «hindurch-tönte». Es ist die Darstellung des Selbst oder die Art, wie man sich präsentiert. Es ist das, was man anderen von sich mitteilt, ganz unabhängig davon, was tatsächlich dahinter ist.

Diese Vielschichtigkeit ist komplex. Authentizität ist wichtig in der Kommunikation. Wir werden heute mit Texten, Bildern und Videos konfrontiert, die von Künstlicher Intelligenz (KI) erstellt werden. Die Authentizität ist dann nicht gegeben. Die Resultate von KI werden laufend besser und lassen sich häufig kaum noch von echt unterscheiden. Es können Realitäten «erfunden» werden, mit dem Ziel der Manipulation. Fake News, Deep Fakes und weitere von KI erstellten «Werke» überschwemmen die Soziale Medien und werden vermehrt auch in unserem Alltag Einzug halten. Da stellt sich die Frage: Wie lassen sich Dinge auf ihre Authentizität prüfen?

Content Authenticity Initiative

Die «Content Authenticity Initiative» ist eine Interessegemeinschaft, die sich der Frage der Authentizität in den Medien stellt. Mitglieder sind etwa Technologie-Firmen, wie Adobe, Microsoft, Canon, Leica oder Fotoware, oder Medienhäuser wie AFP, New York Times, Axel Springer. Dazu auch Branchenverbände wie die CEPIC, oder Internetplattforme wie Shutterstock oder PhotoShelter und Anbieter von KI-generierten Bilder wie Getty Images, Metaphysic oder Synthesia.

Alle diese Firmen und Interessegemeinschaften setzen sich gemeinsam für mehr Klarheit ein, zugunsten einer besseren Transparenz. Es geht nicht darum, sich neuen Technologien zu verschliessen, sondern darum, sie nutzbar zu machen. Dazu gehört Aufklärungsarbeit und die Suche nach geeigneten Werkzeugen, echt von unecht unterscheiden zu können.

Mehr dazu findet sich auf der Website der Initiative:

contentauthenticity.org

Wie prüft man, ob ein Bild echt ist?

Diese Frage benötigt heute professionelle und eine technologische Unterstützung und ein Zusammenschluss vieler Menschen und Organisationen. Wer im Bildmarkt tätig ist oder allenfalls Bilder, Videos und Texte von unterschiedlichen Quellen einsetzt, tut vermutlich gut daran, sich laufend weiterzubilden, um auch in einigen Monaten noch echt von unecht unterscheiden zu können.


Die Bildmenge von 150 Jahre Fotografie in einem Jahr mit KI erreicht

Auf dem Blog von everypixel.com wird ausführlich über die Entwicklung von künstlicher Intelligenz (KI) gesprochen. Die Website bietet eine Suche über 50 Websites mit Stockfotografie, mithilfe von KI. Ausserdem gibt es einen Blog und ein Lab, worin etwa Keywording mithilfe von KI ermöglicht wird. Im letzten Beitrag werden Statistiken aus 2023 zusammengeführt, die zeigen, welche riesige Bildmengen bereits von KI erstellt werden.

Der Titel eines Beitrages, auf Deutsch übersetzt, heisst «Die KI hat bereits so viele Bilder erstellt, wie Fotografen in 150 Jahren aufgenommen haben.» Das wird nachfolgend begründet. Verschiedene vorhandene Tools, wie Midjourney, DALL-E und Firefly werden erwähnt, mit allen Angaben, soweit die öffentlich verfügbar sind.

Der Eindruck, der daraus entsteht, ist überwältigend. Bereits so viel Bilder, wie die Geschichte der Fotografie gesamthaft hervorgebracht hat, wurden allein in diesem Jahr (wir sind in August) erstellt. Es ist ein explosives Wachstum. Die Menge lässt aufhorchen.

Wie mit jeder neuen Technologie, werden die neuen Errungenschaften zuerst belächelt, dann genutzt und plötzlich ist es überall gegenwärtig. Das passiert gerade vor unseren Augen. KI ist hier und wird bleiben. Die Qualität und Vielseitigkeit der erzeugten Bilder wird zunehmen und weitere Anwendungsgebiete entstehen.


Bildvariationen mithilfe künstlicher Intelligenz

Immer mehr Softwarelösungen arbeiten mit künstlicher Intelligenz. Das ist bekannt. Jetzt aber steigen Bildagenturen ein. Als Bildanbieter können sie mithilfe von künstlicher Intelligenz neue Angebote erschliessen. Wird hier die Büchse des Pandora geöffnet oder ist dies bloss eine natürliche Weiterentwicklung?

Anwendungen für Bildagenturen

Vor einiger Zeit hatte 123RF bereits damit begonnen, als Ergänzung zum regulären Angebot, Bilder auf Abruf von künstlicher Intelligenz (KI) generieren zu lassen. Dafür benötigt man lediglich ein Konto auf der Website und schon lassen sich mit Textbeschreibungen Bilder generieren, die anschliessend heruntergeladen und lizenziert werden können. Das Aufgabengebiet:

  • Bilder generieren

Auch für andere Anwendungen verspricht die Firma konkrete KI-Hilfe:

  • Bildsuche
  • Bilder freistellen
  • Bilder optimieren

Zu diesen Möglichkeiten hat sich jetzt eine weitere gesellt:

  • Bildvariationen erstellen.

Man stelle sich vor, dass man ein Bild gefunden hat, was in etwa dem gewünschten Stil entspricht. Auf Knopfdruck lassen sich dann Bildvariationen erstellen, die alle lizenzierbar sind. Es benötigt eine Ausgangsfotografie, aber das war es schon. Eine ganze Serie liesse sich daraus mittels künstlicher Intelligenz erzeugen.

Die verschiedenen Angebote finden sich hier:

123RF AI

Büchse des Pandora?

Ob es sich hier um die Büchse von Pandora handelt oder eine geniale Erweiterung der bisherigen Möglichkeiten ist, lässt sich nicht auf Anhieb erkennen. Diese Umwälzung ist nicht die Erste. Der Wechsel von Analog-Film zu Digitalkameras war bereits eine grosse Umwälzung. Die Dunkelkammer wurde von einem Desktoprechner, sogar von Laptops und Tablets ersetzt. Bilder lassen sich digital manipulieren. All das ist nicht neu, und doch auch noch nicht alt.

Bereits geht es mit künstlicher Intelligenz in die nächste Runde. Hier wird die digitale Welt mit neuen Möglichkeiten stark erweitert. Bildfindung, Bildoptimierung, Bildvariationen – es handelt sich immer noch um Bilder, jedoch auch um neue Möglichkeiten. Bestimmt erleben wir heute erst die Anfänge. Die Umwälzung kommt jedoch und es werden vermutlich weitere Berufe dem Wandel zum Opfer fallen. Es wird vielleicht bald schon neue Einkaufsmöglichkeiten geben.

Die beste Bildagentur

Zuletzt hatte ich selbst über 60 Millionen Bilder online, als die Kursiv Bildagentur noch lief. Es war eine gigantische Anzahl Bilder, die heute, nur wenige Jahre später, bei vielen Agenturen vervielfacht ist. Ist mehr immer besser? Bestimmt nicht. Ich stellte mir immer vor, dass die beste Bildagentur nur über ein einziges Bild verfügte, dass sie unzählige Male verkaufen konnten. Das würde die Kosten niedrig halten, das Rendement am Höchsten.

Mit den heutigen Möglichkeiten sind wir zwar nicht bei einer Bildagentur mit nur einem Bild angekommen, aber jedes Bild lässt sich mit Variationen «weiterentwickeln», bis die gewünschte Ausprägung und Aussage dem Wunschbild entspricht. Verfügen Bildagenturen künftig über weniger Bilder mit theoretisch unbeschränkte Möglichkeiten? Die Zeit wird es zeigen. Die Entwicklung ist interessant, weil es nicht darum geht, immer nur noch mehr Bilder zu generieren. Vielleicht benötigt es sogar eine neue Art der Fotografie, spezialisiert auf besonders vielseitig umzusetzende «Start Sujets», woraus die künstliche Intelligenz dann die Kundenanforderungen realisiert. Liefern Fotografen künftig nur noch «Ingredienzen», woraus «Prompt-Engineers» neue visuelle Welten erschaffen?

123RF zeigt auf ihrer Website, dass auch damit zusammenhängende Fragen, etwa nach ethischen Themen, bewusst einbezogen werden. Die Welt, worin wir leben, wurde gerade ein Stück komplexer.

Video, Audio und Animation

Rendering eines Astronauten, der Samba tanzt (via elements.envato.com). Musik wurde mittels künstlicher Intelligenz generiert (via musicfy.com).

Weitere Entwicklungen

Andere Bildagenturen beschreiten denselben Weg:

Wer heute die Qualität oder Möglichkeiten von künstlicher Intelligenz bemängelt, darf sich gewiss sein, dass es viele Entwicklungsschritte geben wird. Zweifellos werden die Lösungen immer wieder überraschen und die heutige Qualität ist nicht dieselbe, die es in einem Jahr geben wird. Firmen, die heute einsteigen, erforschen die Möglichkeiten und gewinnen so wertvollen Input. Vielleicht tun auch die Bildkäufer gut daran, sich entsprechendes Know-how anzueignen?

Bild: 3D-Render. Dieses Bild wurde digital erzeugt und via Envato für diesen Beitrag lizenziert.


Der Vormarsch von künstlicher Intelligenz in der Bildindustrie

Die ersten Hinweise auf Künstliche Intelligenz und Bilder dienten der Generierung von Porträts und dergleichen mehr. Es gibt diese Anwendungen schon seit Jahren und sie werden immer besser. Heute jedoch geschieht etwas Neues. Es erscheinen Werkzeuge, womit sich Bilder bearbeiten lassen. Das geschieht etwa in Softwarelösungen wie Photoshop, aber auch auf Internet-Plattformen.

Google

Am 23. Mai 2023 hat Google «Product Studio» lanciert. Product Studio ist eines von mehreren Dienstleistungen, die auf künstliche Intelligenz basieren. Google nutzt die Technologie für Suchen, das Erstellen von Werbetexten und auch für die Bildverarbeitung.

Wenn zu Anfang nur ganze Bilder generiert wurden, geht es heute um die Bildoptimierung und Verarbeitung. Konkret werden drei Anwendungsmöglichkeiten genannt:

  1. Produktfoto mit Hintergrund ergänzen
  2. Produktfoto freistellen
  3. Eine höhere Bildauflösung für das Produktfoto erstellen.

Was hier von einem «Produktfoto» gesagt wird, lässt sich technisch selbstverständlich auch mit anderen Fotos erreichen. Für Google geht es darum, die Wirksamkeit von Werbefotos zu vergrössern und damit die Werbeplattform attraktiver zu machen.

Adobe

Mit Adobe Firefly hat Adobe eine AI-Technologie erarbeitet, die etwa in Photoshop bereits integriert ist. Mit ihr lassen sich Bilder ergänzen, retuschieren und optimieren.

Wie Google künstliche Intelligenz zur Stärkung der eigenen Werbeplattform sieht, so erweitert Adobe die eigenen Produkte mit neuen kreativen Möglichkeiten. Einige der Möglichkeiten:

  • Bildvergrösserung
  • Bilderweiterung
  • Bildoptimierung
  • Bildretusche
  • Bildkomposition
  • Varianten von Vektorgrafiken ab Skizzen erstellen
  • Videobearbeitung
  • Bildvarianten erstellen
  • 3D-Modelle erstellen.

Auf der verlinkten Seite stehen Beispiele, die komplexe Kompositionen in Sekunden erstellen.

Die Entwicklung im Zeitraffer

Künstliche Intelligenz wird viel Arbeit ersetzen. Die Technologie wird Bilder erstellen können, ganz ohne Fotografen. Es wird Bilder liefern können, ganz ohne Bildagenturen. Fotos können blitzschnell retuschiert, optimiert, ergänzt, freigestellt werden. Die Spielweise scheint eröffnet zu sein. Allerdings hört es mit dem Spass auf, wenn dadurch Arbeitsplätze bedroht und Know-how durch Künstliche Intelligenz ersetzt wird.

Es dürfte aus der heutigen Entwicklung deutlich sein, dass künstliche Intelligenz bloss ein Werkzeug ist. Der Sprung nach vorn ist jedoch gewaltig. Es wird ähnlich disruptiv sein wie vor einigen Jahrzehnten. Vor 30 Jahren etablierten sich Desktopcomputer. Das war der Beginn einer beispiellosen Umwälzung in der grafischen Industrie. Man sprach von Desktop-Publishing (DTP) und später von der Text-Bild-Integration. Sie lösten in der grafischen Industrie das Zeitalter dedizierter Satzmaschinen ab. Von vielen anfänglich belächelt, hat sich die Technologie breit gemacht und gegen Ende der 1990er-Jahren waren Desktop Computer allgegenwärtig.

Zuerst kam die neue Technologie mit der Verheissung, dass jede Sekretärin nun Hochglanzmagazine gestalten könnte. Das war selbstverständlich nicht der Fall. Handarbeit wurde jedoch weitgehend von Bildschirmarbeit ersetzt. Vieles wurde besser, aber vor allem wurde alles anders. Es waren neue Fähigkeiten gefragt. Arbeitsabläufe mussten angepasst werden. Es dauerte, bis alles seinen Platz gefunden hat. Fast identisch werden wohl auch heute die Fantasien zur Hochform auflaufen. Erneut werden noch unbekannte Fähigkeiten gefragt sein. Berufe werden verschwinden. Ganze Arbeitszweige werden neue Wege finden müssen.

Als die digitale Fotografie erschien, waren nach einigen Jahren die Bilder in hoher Auflösung erhältlich. Als Bildagentur waren viele Bilder, obwohl digital, von analogem Filmmaterial eingescannt. Das Filmkorn war deutlich sichtbar. Das war aber kein Bildfehler. Grafiker reklamierten in diesen Jahren regelmässig, dass die Bilder «verpixelt» waren, obwohl nur das Filmkorn sichtbar war. Innert kurzer Zeit hatten sich die Anforderungen und Erwartungen der Kundschaft angepasst und immer weniger Grafiker wussten noch, was Filmkorn bedeutete.

Lichtstimmung in der Negev-Wüste. Das Bild entstand analog und wurde mit einem grobkörnigem Film (ILFORD 3200) aufgenommen und später digitalisiert.

Bildagenturen und künstliche Intelligenz

Jede Bildagentur hat heute mit künstlicher Intelligenz zu tun. Man setzt sich damit auseinander oder stellt Richtlinien auf. Es gibt ein Bestreben, Bilder entsprechend zu kennzeichnen, die mithilfe von künstlicher Intelligenz entstanden. Getty etwa meldete 2022, dass sie KI-Bilder aus ihren Kollektionen verbannen, vorwiegend wegen möglichen rechtlichen Implikationen (hier). Damit war künstliche Intelligenz nicht vom Tisch. Einige Monate später jedoch schreibt NVIDIA, dass sie eine Zusammenarbeit mit Getty haben, um Bilder mit künstlicher Intelligenz anzubieten, die eine volle Lizenzierung sicherstellen (hier). In diesem Zusammenhang werden Begriffe geprägt wie «Verantwortungsbewusste KI» („Responsible AI“). Damit wird dem Umstand Rechnung getragen, dass viele Fragen in Zusammenhang mit künstlicher Intelligenz noch gar nicht geklärt sind. Da geht es um rechtliche Fragen, ethische Fragen, künstlerische Aspekte und dergleichen mehr.

Am anderen Ende des Spektrums gibt es etwa Stock AI oder One More AI, Bildagenturen, die ausschliesslich Bilder verkaufen, die mit künstlicher Intelligenz erstellt wurden.

Wir sind am Anfang

Viele beschreiben die aktuelle Situation mit den Worten «Wir stehen erst am Anfang». Als QuickTime von Apple lanciert wurde, war das eine Sensation, aber eine kleine Sensation. Das Videoformat war winzig, die Qualität liess zu wünschen übrig. Das war aber nur eine Frage der Zeit. Heute werden Kinofilme gestreamt, Fernsehen läuft über das Internet in höchster Qualität. Was am Anfang stand, ist nicht mit dem heutigen Stand zu vergleichen. Verständlich, dass man deswegen auch die heutige Entwicklung nur als Startschuss einschätzt. Bereits der Unterschied von ChatGPT 3 und ChatGPT 4, die recht kurz nacheinander erschienen, hat hohe Wellen geworfen. Die Leistung von ChatGPT 4 war deutlich höher als der Vorgängerversion. Ein sprunghafter Anstieg der Möglichkeiten scheint logisch zu sein.

Weiterlesen


Kunst und künstliche Intelligenz

Spielt es eine grosse Rolle, mit welchen Werkzeugen wir unsere Welt vorstellen, gestalten und ändern? Ist Fingerfarbe etwa authentischer als die Benutzung eines Bleistifts? Ist künstliche Intelligenz besser, oder nur einfach anders als die Verwendung einer Analog-Kamera? Es gibt bereits mehrere Projekte, die fotografische Kunst mithilfe künstlicher Intelligenz erstellen.

Fashion show for the elders

Malik Afeqbua ist ein Film Director aus Nigeria. Unter dem Titel «Fashion Show for the Elders» erstellte er eine virtuelle Ausstellung, worin ältere Menschen in moderner afrikanischer Kleidung gezeigt werden. Die Menschen sind fiktiv. Alle Bilder wurden mithilfe künstlicher Intelligenz erstellt. Die Bilder jedoch beeindrucken durch Farbe, Aussagekraft und Stil. Sie sind lebensecht und vermitteln eine Botschaft von Inklusivität und Ästhetik. Für Malik Afeqbua ist es eine Art Geschichten zu erzählen.

Porträts von Jos Avery

Auf Instagram hat Jos Avery (@averyseasonart) eine Serie mit Porträts veröffentlicht, die ihm viele Follower bescherte. Dem Anschein nach geht es um anspruchsvolle Schwarzweissfotografie. Das stimmt jedoch nicht. Die Bilder sind fast ausnahmslos durch Künstliche Intelligenz (Midjourney) erzeugt und anschliessend retuschiert. Die Bilder erscheinen lebensecht und differenziert.

Andrea Pizzini

Wohin diese Entwicklung führt, kann man heute nur erahnen. Andere Fotografen testen die neuen Möglichkeiten ebenfalls aus. In einem informativen Video zeigt der Fotograf Andrea Pizzini, wohin seine Experimente führen.

Herausforderungen

Künstliche Intelligenz baut auf Algorithmen, die lernfähig sind. Gelernt wird mit verfügbaren Daten. Für die Generierung von Bildern wird deshalb auf bereits bestehende Bilderwelten zurückgegriffen. Erstellt eine künstliche Intelligenz Bilder, kann man sie im Stile von [NAME ERGÄNZEN] anfordern. Ein Foto im Stile von Robert Doisneau oder Li Wei? Man muss bei künstlicher Intelligenz nur den Bezug angeben und schon werden bestehende Bilder im Netz als Information für neue Bilder benutzt. Dabei tauchen selbstredend Fragen nach Authentizität, Copyright und weiteren rechtlichen Aspekten auf.

Die Herausforderungen von künstlicher Intelligenz müssen wir uns erst bewusst werden. Das Schützen eigener Werke dürfte schwieriger werden. Und wem gehören die Bilder, die erzeugt werden? Gehören die dem Fragensteller? Der Softwarefirma, welche die AI erstellt hat? Es benötigt vielleicht eine neue Sicht auf Bilder, Kunst, und wie wir die Welt sehen.


Wird Keywording von Fotos bald durch Künstliche Intelligenz ersetzt werden?

Künstliche Intelligenz ist auf dem Vormarsch und wird bald alle Lebens- und Arbeitsbereiche durchdringen. Es wird Research vereinfachen, konkrete Lösungen für komplexe Aufgaben bieten und vieles mehr. Das geschieht gerade auch in der Fotografie, worin das computergestützte Fotografieren mit Mobiltelefonen eine immer bessere Qualität generiert und dadurch laufend neue Einsatzgebiete erschliesst. Dasselbe geschieht auch bei der Verschlagwortung von Bildern. Von diesem «Keywording» handelt dieser Beitrag.

Suchbegriffe für Fotos

Die Bildsuche läuft vorwiegend über Suchbegriffe. Nur bei winzigen Kollektionen kann eine Suche via Bildgalerien genutzt werden. Die Erschliessung von sehr grossen Bildmengen gelingt heute via Suchbegriffen. Diese Suchbegriffe müssen zu den Bildern zugeordnet werden, damit die Bilder später mit denselben Begriffen gefunden werden können. Mann nennt das «Tagging» oder «Keywording». Ein Keyword ist ein Suchbegriff. Ein Tag ist ein Label. Beides meint in etwa dasselbe. Damit ein Foto gefunden werden kann, benötigt es oft Dutzende solcher Suchbegriffe pro Bild.

Fotos in professionellen Bildkollektionen werden in der Regel von Hand verschlagwortet. Dies ist eine anspruchsvolle Arbeit, die viel Zeit und Know-how verlangt. Es geht nicht darum, die eigenen Vorstellungen über ein Bild in Worten zu fassen, sondern auch die Suchbegriffe zu finden, die andere Benutzer eines Tages nutzen werden, um genau dieses oder jenes Bild zu finden.

Gutes Keywording ist aufwändig und kostet entsprechend. Bei spezialisierten Bildkollektionen benötigt es entsprechend geschultes Personal, erweiterte Kataloge mit Suchbegriffen und dergleichen Dinge mehr. Kein Wunder, dass viele an einfachere Methoden interessiert sind.

Visuelle Bildanalyse und das Keywording von morgen

Künstliche Intelligenz kann Bilder analysieren. Künstliche Intelligenz arbeitet mit Modellen, dessen Definition verbessert wird, je mehr aus neuen Bildern gelernt werden kann. Es geht dabei nicht um ein fixiertes Vorgehen, sondern um ein stetiges Lernen.

Eine visuelle Bildanalyse kann auf das Erkennen vieler Bildelemente trainiert werden. Es können Farbpaletten erkannt werden, aber auch Gegenstände oder Menschen. Von dort aus lernen Systeme dazu und erkennen Situationen, Konzepte und weitere abstrakte Ideen.

Wer ein iPhone einsetzt, kann eine automatische Zuordnung von Keywords in der Apple Photos-App zurückfinden. Hier hat man selbst vermutlich keine Keywords hinzugefügt, kann aber trotzdem nach einfachen Begriffen wie «Strasse», «Hund» oder ähnlich suchen. Das ist Künstliche Intelligenz in Aktion.

Bei dieser Anwendung hört es jedoch nicht auf. Die israelische Firma BRIA (bria.ai) ist in diesem Bereich tätig. Sie nutzen Künstliche Intelligenz für verschiedene Szenarien:

  • Fotos und Videos generieren
  • Fotos animieren (Bewegung hinzufügen wie bewegende Elemente, Kamerafahrten)
  • Fotos lokalisieren (dieselbe Szene, mit anderen Menschen, Objekten, Farben, usw.)
  • Fotos retuschieren (Objekte entfernen, einsetzen, neu zusammenstellen)
  • Visuelle Bildsuche.

Im Kontext dieses Beitrages ist die visuelle Bildsuche interessant. Eine visuelle Bilderkennung soll automatisch zu Suchbegriffen führen. Keywording ist dabei nicht mehr nötig. Mehr dazu erklärt Yair Adato in diesem Beitrag auf medium.com:

Er teilt hier die Vision, dass ein System mit künstlicher Intelligenz die Aufgabe von Keywording eliminieren könnte. Eine visuelle Bilderkennung findet die richtigen Begriffe, erkennt eine natürliche Sprache, arbeitet mit mehreren Sprachen und kann geeignete Suchresultate zeigen.

Zweifellos ist dies ein Trend, der sich durchsetzen wird. Allerdings geschieht das nicht von heute auf morgen. Wie mit anderen Technologien erfolgt die Entwicklung Schrittweise. Zuerst können allgemeine Themen erkannt werden, danach erst folgen später mehr komplexe Szenarien. Wenn etwas heute noch nicht möglich ist, heisst das keineswegs, dass es künftig nicht möglich sein wird.

Aufgrund eigener Erfahrung mit Bildkollektionen und Keywording, gehe ich davon aus, dass es zwar allgemeine Anwendungen gibt, für die erste Anwendungen entstehen, jedoch viele spezialisierte Bedürfnisse bestehen. Für diese letzte Gruppe ist ein Keywording nicht eindeutig. Hoch spezialisierte Bildkollektionen benötigen eigene Taxonomien. Und wie ist es mit firmeninternen Datenbanken, worin auch die eigenen Marketing-Begriffe eingebaut werden müssen? Es kann deshalb kaum erwartet werden, dass alles auf einmal von Systemen mit künstlicher Intelligenz überrannt wird. Die Richtung ist heute jedoch absehbar.

Ethische und rechtliche Fragen zu Generative AI sind heute meist noch nicht geklärt. Im folgenden Beitrag von James Vincent wird darauf Bezug genommen:

wer diese Technologien heute einsetzt, muss sich auf weitere Auseinandersetzungen gefasst machen.

BRIA und Getty Images

Die Firma BRIA und Getty Images sind eine Partnerschaft eingegangen. Das Potenzial von Künstlicher Intelligenz wird die Bildindustrie nachhaltig prägen. Getty sieht dies mit Weitblick kommen und bereitet sich so vor.

In diesem Pressebericht werden keine speziellen Aufgaben genannt. Es geht auch nicht um bestimmte Aufgaben, sondern um eine technologische Entwicklung mit vielen Anwendungsgebieten. Mit künstlich erzeugten Bildern sind etwa Modellfreigaben nicht mehr nötig, oder können Bilder exakt nach Vorstellungen von Kunden erstellt werden. Eine Optimierung der Suchresultate aufgrund von Bildmerkmalen gehört ebenso zu den Möglichkeiten.

Was Getty hier im grossen Stil denkt und plant, wird auch die kleineren Bildagenturen und Fotografen betreffen. Erscheinen etwa bei Getty Images in der Suchmaschine bessere Suchresultate, dann wird sich das herumsprechen.

Mit diesen Entwicklungen ist kein Ende abzusehen. Vielmehr stehen wir an der Grenze neuer Möglichkeiten. Aktuell ist gutes Keywording immer noch die beste Methode für die meisten Kollektionen. Bereits entstehen aber interessante Alternativen.