Berichterstattung in Zeiten des Krieges

Kriege und kriegerische Auseinandersetzungen finden heute an mehreren Fronten statt. Eine Front ist die Berichterstattung und Manipulation der Sozialen Medien. Darin geht es um mehrere Ebenen. Eine wichtige Rolle steht darin die Benutzung von Bildmaterial zu. Fotos und Videos werden heute weit häufiger manipuliert als vor wenigen Jahren.

Die Front in den Medien

Zwei Konflikte der letzten Jahre seien hier beispielhaft genannt: Russlands Angriff auf die Ukraine und Hamas‘ Angriff auf Israel. Sie werden ganz stark über Desinformation genährt. Desinformation baut mithilfe verschiedener Dinge eine alternative Wirklichkeit auf. Dazu wird die Geschichte kurzerhand neu geschrieben, es werden Menschen mit Zahlen manipuliert (mehr Verwundete = mehr Zuspruch in den Medien), und nicht zuletzt wird mit Bildmaterial jede Behauptung verstärkt.

Ist Berichterstattung neutral? Das lässt sich schnell hinterfragen, denn die Fakten müssen immer interpretiert werden. Aus der Berichterstattung entsteht eine Narrative. Sie liegt näher oder ferner von den Fakten weg und ist häufig durch Missinterpretation und Vorurteile genährt. Guter Journalismus ist entscheidend wichtig, aber in den Sozialen Medien funktionieren ganz andere Mechanismen. Manipulation wird oft bewusst gefördert. Die Wahl von Donald Trump 2016 war etwa auf Manipulation über Social Media zurückzuführen (Cambridge-Analytica Skandal).

Ein aktuelles Beispiel ist der Krieg zwischen Russland und der Ukraine. Auf der Website newsguardtech.com werden per heutigem Datum 410 Websites mit Falschinformationen zum Russischen Krieg gegen Ukraine verfolgt. Alle diese Websites verbreiten gezielt Falschinformationen, in einem Versuch, die Wahrnehmung zum Krieg der russischen Narrative anzupassen. Auf der Seite des deutschen Correctiv erschien einen Beitrag, der an beiden Seiten des Krieges Falschinformationen darstellt.

Dies ist die Front in den Medien. Es wird massiv Propaganda gemacht. Dafür werden auch Bilder und Videos manipulativ eingesetzt. Faktenchecker gibt es viele, oft mit einem bestimmten Fokus. Deutschsprachige Faktenchecker sind etwa folgende:

Weitere Angaben und Links finden sich beispielsweise auf Wikipedia.

Manipulation von Fotos und Videos

Eine falsche Berichterstattung wird über falsche Bilder und Videos erreicht. Es gibt ein berühmtes Foto aus dem Konflikt zwischen Israel und Arabern aus Gaza und Westbank. Dabei war das Foto zwar echt, aber es wurde nicht vollständig gezeigt. Eine falsche Bildunterschrift hat die Fake-Nachricht dann vervollständigt. Hier gibt es die Geschichte zum Bild:

Es gibt massenhaft Fotos, die manipuliert wurden, um die Narrative der «brutalen israelischen Armee gegen wehrlose Palästinenser» zu begründen. HonestReporting deckt aber auf, dass gerade das Gegenteil stattgefunden hat. Seitdem berichtet HonestReporting zu Falschdarstellungen über Israel in den Medien.

Pallywood

Es gibt einen Ausdruck für falsche Bilder aus offiziellen palästinensischen Quellen: Pallywood, ein Wort zusammengesetzt aus «Palästina» und «Hollywood». Spätestens seit der zweiten Intifada werden immer wieder Bilder und Videos veröffentlicht, die von Mediencrews erstellt wurden. Es werden Menschen als Schauspieler für inszenierte Szenarien engagiert. So entstehen Fotos und Videos, die falsche Narrative unterstützen. Tote und Verwundete sind oft weder tot noch verwundet, sondern nur Teil einer filmischen Darstellung.

Einige der Darstellungen werden auch als falsch entlarvt:

Es ist nicht immer einfach, zu erkennen, worum es geht. Bilder aus Gaza gibt es meist nicht aus unabhängigen Quellen.

Falsche Zuordnung von Fotos und Videos

Regelmässig gibt es Fotos und Videos, die nichts mit dem angeblichen Ereignis zu tun haben. Es handelt sich zwar um richtige Bilder, aber die Zuordnung ist nicht korrekt. Hier ein Beispiel:

Hier kann man nur die Quellen prüfen. Wer redaktionelle Bilder einsetzen möchte, sollte sich um die korrekten Angaben kümmern. Es hilft, Bilder bei etablierten Bildagenturen und Fotografen einzukaufen. Auch dort sollte man sich für korrekte Angaben einsetzen.

KI-generierte Bilder und Deep Fakes

Mittlerweile wurde Bildmanipulation und Bilderstellung durch Künstliche Intelligenz popularisiert. In der aktuellen Auseinandersetzung zwischen Israel und der Terrororganisation Hamas tauchen deshalb vermehrt Bilder auf, die mit der Wirklichkeit nichts mehr zu tun haben. Sie ersetzen sozusagen den Wert journalistischer Berichterstattung.

Auf den von mir besuchten Social-Media-Kanäle habe ich KI-generierte Bilder an beiden Seiten gesehen. Auf israelischer Seite bemüht sich etwa auch FakeReporter für mehr Transparenz bei falschen Bildern und Videos. HonestReporting etwa bietet Hintergrundinformationen, damit jeder sich besser ein eigenes Bild machen kann – eine Voraussetzung für die korrekte Interpretation von Bildern und Videos.

Manipulation von Landkarten

Es ist immer ein Problem, wenn Kontext weggelassen wird. Das gilt jedoch speziell für die Konflikte in dieser Welt. Die Wahrheit liegt nicht immer bei der Aussage. Zwar lässt sich eine Interpretation nie ganz vermeiden, aber eine bewusste Manipulation soll aufgedeckt werden. Es sei denn, auch das ist eine Manipulation.

In dieser Woche gab es etwa die Meldung, dass der Name Israel auf Karten verschiedener chinesischen Websites fehlt. Es wurde so dargestellt, dass Israel nach dem Angriff von Hamas bei China in Ungnade gefallen war und das Land kurzerhand von der Karte gefegt wurde (ganz im Sinne der Hamas).

Bei einer näheren Untersuchung wurde jedoch festgestellt, dass der Name Israel bereits länger von den genannten Karten entfernt wurde. Daraus kann geschlossen werden, dass der Name zwar fehlte, aber der Zusammenhang mit den Hamas Terrorakten war nicht gegeben.

Auch Karten sind Bilder und werden munter manipuliert, um bestimmte Narrativen zu unterstützen.

Diese geschichtliche Entwicklung von Palästina in 4 Karten wäre der Beweis dafür, dass Israel Land von Palästinensern «besetzt» und «gekapert hat». Nichts liegt jedoch ferner der Wahrheit. Karten können etwas vorgaukeln, was nie da war, etwa ein palästinensischer Staat oder ein palästinensisches Volk (beide von Yasser Arafat in den 1960ern frei erfunden). Mit dieser Karte soll die Geschichte deshalb manipuliert werden. Besonders brisant ist natürlich, dass es bis heute ein weitverbreitetes Bild ist. Diese Narrative wird hartnäckig festgehalten, aber hier widerlegt:

Geschichte einblenden

Im Rahmen dieses Beitrages können wir aus diesem Beispiel lernen, dass man die Geschichte nicht einfach ausblenden kann. Man soll auch bedenken, dass die meisten Länder im Mittleren Osten bis zum Ersten Weltkrieg Osmanisches Reich waren. Frankreich und England teilten sich als Sieger den Mitten Osten auf und daraus entstanden zuerst einige Mandatsgebiete. Frankreich hatte die Mandate Syrien und Libanon. England hatte Mandate für Mesopotamien und Palästina. Aus diesen Mandaten und einigen weiteren Initiativen wurden allmählich die heutigen Länder erschaffen. Noch heute sieht man auf der Karte des Mitten-Ostens, dass es viele kerzengerade Grenzen gibt. Sie wurden mit dem Lineal auf der Karte gezogen. Libanon, Syrien, Jordanien und auch Israel entstanden im letzten Jahrhundert.

  • 1922: Ägypten wird unabhängig vom Vereinigten Königreich
  • 1943: Libanon erklärt die Unabhängigkeit
  • 1946: Syrien wurde nach mehreren Bestrebungen faktisch unabhängig
  • 1946: Jordanien gewinnt Unabhängigkeit
  • 1948: Israel wird Unabhängig
  • 1952: Ägypten wird zur Republik

Das Erstaunliche bei dieser Liste ist, dass alle Länder, die Israel das Existenzrecht abgesprochen haben, selbst in diesen Jahren aufgerichtet wurden. Die geschichtlichen Zusammenhänge werden heute populistisch umgedeutet und zum Mainstream gemacht, wobei die Aufmerksamkeit nur auf die angebliche Besatzungsmacht Israel gelegt wird. So sieht ein Medienkrieg aus. Das spiegelt sich in den Narrativen – und auch im verwendeten Bildmaterial.

Kultur verstehen

Bilder und Karten versuchen oft nur emotionalen Grund zu erobern. Für ein besseres Verständnis hilft es, die Hintergründe der Narrativen besser zu verstehen. Dabei geht es auch um die Art der Berichterstattung. Zum Schluss dieses Beitrages deshalb ein Buchtipp. Der Journalist Joris Luyendijk arbeitete 5 Jahre im Mitten Osten und hat dabei einige Entdeckungen gemacht, die in mehreren Büchern veröffentlicht wurden. Etwa diesees hier:

Eines der Punkte, der von Joris Luyendijk sehr deutlich herausgearbeitet wurde, ist das unterschiedliche Denkmuster und die unterschiedliche Realität beim Vergleich von Europa und dem Mitten-Osten. Er beschreibt, wie Medien berichten, und dass eine westliche Sicht keinesfalls ausreicht, die Aktualität auf dem Boden zu erkennen. Die journalistische Freiheit des Westens gibt es nicht überall im Mitten Osten.

Direkte Folgen mangelhafter Berichterstattung

Es ist hilfreich, sich der Komplexität bewusst zu werden, bevor man selbst Bilder publiziert und Narrativen unterstützt. In einer mutigen Berichterstattung geht es nicht darum, die eine oder andere Seite blind zu unterstützen, sondern vor allem darum, den eigenen Beitrag zur Lösung bewusst zu werden. Seit den mörderischen Angriffen der Hamas auf die Zivilbevölkerung in Israel hat eine beispiellose Täter-Opfer-Umkehr stattgefunden. Es finden weltweit Proteste gegen Israel statt. Als Hamas am 7. Oktober Israel überfiel, blieben solche Kundgebungen aus. Nicht nur hat Hamas bewusst die Zivilbevölkerung angegriffen, sondern missbraucht die eigene Bevölkerung als Schutzschilde gegen Israel, wie in verschiedenen Berichten wiederholt festgestellt (etwa hier, hier und hier).

Seit den mörderischen Angriffen der Hamas auf die Zivilbevölkerung in Israel hat weltweit eine beispiellose Täter-Opfer-Umkehr stattgefunden.

Auf der ganzen Welt finden massive Kundgebungen statt. Es wird mittlerweile auch in Europa offen zum Mord auf Juden aufgerufen. Berechtigterweise fragen sich einige, ob die Alliierten im Zweiten Weltkrieg gegen die Nazis gewonnen hätten, wenn die Situation in der Berichterstattung wie heute ausgesehen hätte.

Es benötigt Zivilcourage, sich heute entschieden gegen Manipulation aller Art zu stellen. Das betrifft auch die Wahl der Bilder und Videos, die wir teilen, und welche Geschichten wir in Zeiten des Krieges damit fördern. Wer Bilder zur Berichterstattung einsetzt, hat sich mit gestellten Situationen, selektiver Wahrnehmung, oft ungeprüften Bildquellen und verschiedenen Narrativen auseinanderzusetzen.


Wie prüft man ob ein Bild echt ist?

Echt von unecht unterscheiden zu können, ist heute anspruchsvoller als je zuvor. Künstliche Intelligenz produziert Texte, Bilder, Videos, die zunehmend kaum noch von echt zu unterscheiden sind. Bestimmt wird sich unsere Wahrnehmung dadurch ändern, ebenso wie das tat, als nicht mehr alls gemalt und gezeichnet werden musste, sondern fotografiert werden konnte. Zeiten ändern sich und damit auch die Techniken und Technologien. Wie wir damit umgehen, will gelernt sein. Damit befasst sich auch die «Content Authenticity Initiative».

Fakt oder Fake?

Bilder können täuschen und manipulieren. Wir sind damit aufgewachsen und begegnen es auf Schritt und Tritt. Bewusst etwa wird das für Werbung eingesetzt. Produkte und Themen werden mit Bildern emotionalisiert. Produktverpackungen, Plakatkampagnen, Buchcover, Bildsprache auf einer Corporate Website – alle diese Beispiele sind Teil unserer Realität. Die Grenzen zwischen Kommunikation und Manipulation verlaufen fliessend.

Wir bewerben sogar uns selbst. Der Begriff «Person» stammt etwa vom lateinischen «Persona», ursprünglich «hindurch-tönen». Der Begriff wurde möglicherweise durch das alte römische Theater geprägt, wo Schauspieler eine Maske trugen und die «Person» durch die Maske «hindurch-tönte». Es ist die Darstellung des Selbst oder die Art, wie man sich präsentiert. Es ist das, was man anderen von sich mitteilt, ganz unabhängig davon, was tatsächlich dahinter ist.

Diese Vielschichtigkeit ist komplex. Authentizität ist wichtig in der Kommunikation. Wir werden heute mit Texten, Bildern und Videos konfrontiert, die von Künstlicher Intelligenz (KI) erstellt werden. Die Authentizität ist dann nicht gegeben. Die Resultate von KI werden laufend besser und lassen sich häufig kaum noch von echt unterscheiden. Es können Realitäten «erfunden» werden, mit dem Ziel der Manipulation. Fake News, Deep Fakes und weitere von KI erstellten «Werke» überschwemmen die Soziale Medien und werden vermehrt auch in unserem Alltag Einzug halten. Da stellt sich die Frage: Wie lassen sich Dinge auf ihre Authentizität prüfen?

Content Authenticity Initiative

Die «Content Authenticity Initiative» ist eine Interessegemeinschaft, die sich der Frage der Authentizität in den Medien stellt. Mitglieder sind etwa Technologie-Firmen, wie Adobe, Microsoft, Canon, Leica oder Fotoware, oder Medienhäuser wie AFP, New York Times, Axel Springer. Dazu auch Branchenverbände wie die CEPIC, oder Internetplattforme wie Shutterstock oder PhotoShelter und Anbieter von KI-generierten Bilder wie Getty Images, Metaphysic oder Synthesia.

Alle diese Firmen und Interessegemeinschaften setzen sich gemeinsam für mehr Klarheit ein, zugunsten einer besseren Transparenz. Es geht nicht darum, sich neuen Technologien zu verschliessen, sondern darum, sie nutzbar zu machen. Dazu gehört Aufklärungsarbeit und die Suche nach geeigneten Werkzeugen, echt von unecht unterscheiden zu können.

Mehr dazu findet sich auf der Website der Initiative:

contentauthenticity.org

Wie prüft man, ob ein Bild echt ist?

Diese Frage benötigt heute professionelle und eine technologische Unterstützung und ein Zusammenschluss vieler Menschen und Organisationen. Wer im Bildmarkt tätig ist oder allenfalls Bilder, Videos und Texte von unterschiedlichen Quellen einsetzt, tut vermutlich gut daran, sich laufend weiterzubilden, um auch in einigen Monaten noch echt von unecht unterscheiden zu können.


Die Bildmenge von 150 Jahre Fotografie in einem Jahr mit KI erreicht

Auf dem Blog von everypixel.com wird ausführlich über die Entwicklung von künstlicher Intelligenz (KI) gesprochen. Die Website bietet eine Suche über 50 Websites mit Stockfotografie, mithilfe von KI. Ausserdem gibt es einen Blog und ein Lab, worin etwa Keywording mithilfe von KI ermöglicht wird. Im letzten Beitrag werden Statistiken aus 2023 zusammengeführt, die zeigen, welche riesige Bildmengen bereits von KI erstellt werden.

Der Titel eines Beitrages, auf Deutsch übersetzt, heisst «Die KI hat bereits so viele Bilder erstellt, wie Fotografen in 150 Jahren aufgenommen haben.» Das wird nachfolgend begründet. Verschiedene vorhandene Tools, wie Midjourney, DALL-E und Firefly werden erwähnt, mit allen Angaben, soweit die öffentlich verfügbar sind.

Der Eindruck, der daraus entsteht, ist überwältigend. Bereits so viel Bilder, wie die Geschichte der Fotografie gesamthaft hervorgebracht hat, wurden allein in diesem Jahr (wir sind in August) erstellt. Es ist ein explosives Wachstum. Die Menge lässt aufhorchen.

Wie mit jeder neuen Technologie, werden die neuen Errungenschaften zuerst belächelt, dann genutzt und plötzlich ist es überall gegenwärtig. Das passiert gerade vor unseren Augen. KI ist hier und wird bleiben. Die Qualität und Vielseitigkeit der erzeugten Bilder wird zunehmen und weitere Anwendungsgebiete entstehen.


Bildvariationen mithilfe künstlicher Intelligenz

Immer mehr Softwarelösungen arbeiten mit künstlicher Intelligenz. Das ist bekannt. Jetzt aber steigen Bildagenturen ein. Als Bildanbieter können sie mithilfe von künstlicher Intelligenz neue Angebote erschliessen. Wird hier die Büchse des Pandora geöffnet oder ist dies bloss eine natürliche Weiterentwicklung?

Anwendungen für Bildagenturen

Vor einiger Zeit hatte 123RF bereits damit begonnen, als Ergänzung zum regulären Angebot, Bilder auf Abruf von künstlicher Intelligenz (KI) generieren zu lassen. Dafür benötigt man lediglich ein Konto auf der Website und schon lassen sich mit Textbeschreibungen Bilder generieren, die anschliessend heruntergeladen und lizenziert werden können. Das Aufgabengebiet:

  • Bilder generieren

Auch für andere Anwendungen verspricht die Firma konkrete KI-Hilfe:

  • Bildsuche
  • Bilder freistellen
  • Bilder optimieren

Zu diesen Möglichkeiten hat sich jetzt eine weitere gesellt:

  • Bildvariationen erstellen.

Man stelle sich vor, dass man ein Bild gefunden hat, was in etwa dem gewünschten Stil entspricht. Auf Knopfdruck lassen sich dann Bildvariationen erstellen, die alle lizenzierbar sind. Es benötigt eine Ausgangsfotografie, aber das war es schon. Eine ganze Serie liesse sich daraus mittels künstlicher Intelligenz erzeugen.

Die verschiedenen Angebote finden sich hier:

123RF AI

Büchse des Pandora?

Ob es sich hier um die Büchse von Pandora handelt oder eine geniale Erweiterung der bisherigen Möglichkeiten ist, lässt sich nicht auf Anhieb erkennen. Diese Umwälzung ist nicht die Erste. Der Wechsel von Analog-Film zu Digitalkameras war bereits eine grosse Umwälzung. Die Dunkelkammer wurde von einem Desktoprechner, sogar von Laptops und Tablets ersetzt. Bilder lassen sich digital manipulieren. All das ist nicht neu, und doch auch noch nicht alt.

Bereits geht es mit künstlicher Intelligenz in die nächste Runde. Hier wird die digitale Welt mit neuen Möglichkeiten stark erweitert. Bildfindung, Bildoptimierung, Bildvariationen – es handelt sich immer noch um Bilder, jedoch auch um neue Möglichkeiten. Bestimmt erleben wir heute erst die Anfänge. Die Umwälzung kommt jedoch und es werden vermutlich weitere Berufe dem Wandel zum Opfer fallen. Es wird vielleicht bald schon neue Einkaufsmöglichkeiten geben.

Die beste Bildagentur

Zuletzt hatte ich selbst über 60 Millionen Bilder online, als die Kursiv Bildagentur noch lief. Es war eine gigantische Anzahl Bilder, die heute, nur wenige Jahre später, bei vielen Agenturen vervielfacht ist. Ist mehr immer besser? Bestimmt nicht. Ich stellte mir immer vor, dass die beste Bildagentur nur über ein einziges Bild verfügte, dass sie unzählige Male verkaufen konnten. Das würde die Kosten niedrig halten, das Rendement am Höchsten.

Mit den heutigen Möglichkeiten sind wir zwar nicht bei einer Bildagentur mit nur einem Bild angekommen, aber jedes Bild lässt sich mit Variationen «weiterentwickeln», bis die gewünschte Ausprägung und Aussage dem Wunschbild entspricht. Verfügen Bildagenturen künftig über weniger Bilder mit theoretisch unbeschränkte Möglichkeiten? Die Zeit wird es zeigen. Die Entwicklung ist interessant, weil es nicht darum geht, immer nur noch mehr Bilder zu generieren. Vielleicht benötigt es sogar eine neue Art der Fotografie, spezialisiert auf besonders vielseitig umzusetzende «Start Sujets», woraus die künstliche Intelligenz dann die Kundenanforderungen realisiert. Liefern Fotografen künftig nur noch «Ingredienzen», woraus «Prompt-Engineers» neue visuelle Welten erschaffen?

123RF zeigt auf ihrer Website, dass auch damit zusammenhängende Fragen, etwa nach ethischen Themen, bewusst einbezogen werden. Die Welt, worin wir leben, wurde gerade ein Stück komplexer.

Video, Audio und Animation

Rendering eines Astronauten, der Samba tanzt (via elements.envato.com). Musik wurde mittels künstlicher Intelligenz generiert (via musicfy.com).

Weitere Entwicklungen

Andere Bildagenturen beschreiten denselben Weg:

Wer heute die Qualität oder Möglichkeiten von künstlicher Intelligenz bemängelt, darf sich gewiss sein, dass es viele Entwicklungsschritte geben wird. Zweifellos werden die Lösungen immer wieder überraschen und die heutige Qualität ist nicht dieselbe, die es in einem Jahr geben wird. Firmen, die heute einsteigen, erforschen die Möglichkeiten und gewinnen so wertvollen Input. Vielleicht tun auch die Bildkäufer gut daran, sich entsprechendes Know-how anzueignen?

Bild: 3D-Render. Dieses Bild wurde digital erzeugt und via Envato für diesen Beitrag lizenziert.


Der Vormarsch von künstlicher Intelligenz in der Bildindustrie

Die ersten Hinweise auf Künstliche Intelligenz und Bilder dienten der Generierung von Porträts und dergleichen mehr. Es gibt diese Anwendungen schon seit Jahren und sie werden immer besser. Heute jedoch geschieht etwas Neues. Es erscheinen Werkzeuge, womit sich Bilder bearbeiten lassen. Das geschieht etwa in Softwarelösungen wie Photoshop, aber auch auf Internet-Plattformen.

Google

Am 23. Mai 2023 hat Google «Product Studio» lanciert. Product Studio ist eines von mehreren Dienstleistungen, die auf künstliche Intelligenz basieren. Google nutzt die Technologie für Suchen, das Erstellen von Werbetexten und auch für die Bildverarbeitung.

Wenn zu Anfang nur ganze Bilder generiert wurden, geht es heute um die Bildoptimierung und Verarbeitung. Konkret werden drei Anwendungsmöglichkeiten genannt:

  1. Produktfoto mit Hintergrund ergänzen
  2. Produktfoto freistellen
  3. Eine höhere Bildauflösung für das Produktfoto erstellen.

Was hier von einem «Produktfoto» gesagt wird, lässt sich technisch selbstverständlich auch mit anderen Fotos erreichen. Für Google geht es darum, die Wirksamkeit von Werbefotos zu vergrössern und damit die Werbeplattform attraktiver zu machen.

Adobe

Mit Adobe Firefly hat Adobe eine AI-Technologie erarbeitet, die etwa in Photoshop bereits integriert ist. Mit ihr lassen sich Bilder ergänzen, retuschieren und optimieren.

Wie Google künstliche Intelligenz zur Stärkung der eigenen Werbeplattform sieht, so erweitert Adobe die eigenen Produkte mit neuen kreativen Möglichkeiten. Einige der Möglichkeiten:

  • Bildvergrösserung
  • Bilderweiterung
  • Bildoptimierung
  • Bildretusche
  • Bildkomposition
  • Varianten von Vektorgrafiken ab Skizzen erstellen
  • Videobearbeitung
  • Bildvarianten erstellen
  • 3D-Modelle erstellen.

Auf der verlinkten Seite stehen Beispiele, die komplexe Kompositionen in Sekunden erstellen.

Die Entwicklung im Zeitraffer

Künstliche Intelligenz wird viel Arbeit ersetzen. Die Technologie wird Bilder erstellen können, ganz ohne Fotografen. Es wird Bilder liefern können, ganz ohne Bildagenturen. Fotos können blitzschnell retuschiert, optimiert, ergänzt, freigestellt werden. Die Spielweise scheint eröffnet zu sein. Allerdings hört es mit dem Spass auf, wenn dadurch Arbeitsplätze bedroht und Know-how durch Künstliche Intelligenz ersetzt wird.

Es dürfte aus der heutigen Entwicklung deutlich sein, dass künstliche Intelligenz bloss ein Werkzeug ist. Der Sprung nach vorn ist jedoch gewaltig. Es wird ähnlich disruptiv sein wie vor einigen Jahrzehnten. Vor 30 Jahren etablierten sich Desktopcomputer. Das war der Beginn einer beispiellosen Umwälzung in der grafischen Industrie. Man sprach von Desktop-Publishing (DTP) und später von der Text-Bild-Integration. Sie lösten in der grafischen Industrie das Zeitalter dedizierter Satzmaschinen ab. Von vielen anfänglich belächelt, hat sich die Technologie breit gemacht und gegen Ende der 1990er-Jahren waren Desktop Computer allgegenwärtig.

Zuerst kam die neue Technologie mit der Verheissung, dass jede Sekretärin nun Hochglanzmagazine gestalten könnte. Das war selbstverständlich nicht der Fall. Handarbeit wurde jedoch weitgehend von Bildschirmarbeit ersetzt. Vieles wurde besser, aber vor allem wurde alles anders. Es waren neue Fähigkeiten gefragt. Arbeitsabläufe mussten angepasst werden. Es dauerte, bis alles seinen Platz gefunden hat. Fast identisch werden wohl auch heute die Fantasien zur Hochform auflaufen. Erneut werden noch unbekannte Fähigkeiten gefragt sein. Berufe werden verschwinden. Ganze Arbeitszweige werden neue Wege finden müssen.

Als die digitale Fotografie erschien, waren nach einigen Jahren die Bilder in hoher Auflösung erhältlich. Als Bildagentur waren viele Bilder, obwohl digital, von analogem Filmmaterial eingescannt. Das Filmkorn war deutlich sichtbar. Das war aber kein Bildfehler. Grafiker reklamierten in diesen Jahren regelmässig, dass die Bilder «verpixelt» waren, obwohl nur das Filmkorn sichtbar war. Innert kurzer Zeit hatten sich die Anforderungen und Erwartungen der Kundschaft angepasst und immer weniger Grafiker wussten noch, was Filmkorn bedeutete.

Lichtstimmung in der Negev-Wüste. Das Bild entstand analog und wurde mit einem grobkörnigem Film (ILFORD 3200) aufgenommen und später digitalisiert.

Bildagenturen und künstliche Intelligenz

Jede Bildagentur hat heute mit künstlicher Intelligenz zu tun. Man setzt sich damit auseinander oder stellt Richtlinien auf. Es gibt ein Bestreben, Bilder entsprechend zu kennzeichnen, die mithilfe von künstlicher Intelligenz entstanden. Getty etwa meldete 2022, dass sie KI-Bilder aus ihren Kollektionen verbannen, vorwiegend wegen möglichen rechtlichen Implikationen (hier). Damit war künstliche Intelligenz nicht vom Tisch. Einige Monate später jedoch schreibt NVIDIA, dass sie eine Zusammenarbeit mit Getty haben, um Bilder mit künstlicher Intelligenz anzubieten, die eine volle Lizenzierung sicherstellen (hier). In diesem Zusammenhang werden Begriffe geprägt wie «Verantwortungsbewusste KI» („Responsible AI“). Damit wird dem Umstand Rechnung getragen, dass viele Fragen in Zusammenhang mit künstlicher Intelligenz noch gar nicht geklärt sind. Da geht es um rechtliche Fragen, ethische Fragen, künstlerische Aspekte und dergleichen mehr.

Am anderen Ende des Spektrums gibt es etwa Stock AI oder One More AI, Bildagenturen, die ausschliesslich Bilder verkaufen, die mit künstlicher Intelligenz erstellt wurden.

Wir sind am Anfang

Viele beschreiben die aktuelle Situation mit den Worten «Wir stehen erst am Anfang». Als QuickTime von Apple lanciert wurde, war das eine Sensation, aber eine kleine Sensation. Das Videoformat war winzig, die Qualität liess zu wünschen übrig. Das war aber nur eine Frage der Zeit. Heute werden Kinofilme gestreamt, Fernsehen läuft über das Internet in höchster Qualität. Was am Anfang stand, ist nicht mit dem heutigen Stand zu vergleichen. Verständlich, dass man deswegen auch die heutige Entwicklung nur als Startschuss einschätzt. Bereits der Unterschied von ChatGPT 3 und ChatGPT 4, die recht kurz nacheinander erschienen, hat hohe Wellen geworfen. Die Leistung von ChatGPT 4 war deutlich höher als der Vorgängerversion. Ein sprunghafter Anstieg der Möglichkeiten scheint logisch zu sein.

Weiterlesen


Kunst und künstliche Intelligenz

Spielt es eine grosse Rolle, mit welchen Werkzeugen wir unsere Welt vorstellen, gestalten und ändern? Ist Fingerfarbe etwa authentischer als die Benutzung eines Bleistifts? Ist künstliche Intelligenz besser, oder nur einfach anders als die Verwendung einer Analog-Kamera? Es gibt bereits mehrere Projekte, die fotografische Kunst mithilfe künstlicher Intelligenz erstellen.

Fashion show for the elders

Malik Afeqbua ist ein Film Director aus Nigeria. Unter dem Titel «Fashion Show for the Elders» erstellte er eine virtuelle Ausstellung, worin ältere Menschen in moderner afrikanischer Kleidung gezeigt werden. Die Menschen sind fiktiv. Alle Bilder wurden mithilfe künstlicher Intelligenz erstellt. Die Bilder jedoch beeindrucken durch Farbe, Aussagekraft und Stil. Sie sind lebensecht und vermitteln eine Botschaft von Inklusivität und Ästhetik. Für Malik Afeqbua ist es eine Art Geschichten zu erzählen.

Porträts von Jos Avery

Auf Instagram hat Jos Avery (@averyseasonart) eine Serie mit Porträts veröffentlicht, die ihm viele Follower bescherte. Dem Anschein nach geht es um anspruchsvolle Schwarzweissfotografie. Das stimmt jedoch nicht. Die Bilder sind fast ausnahmslos durch Künstliche Intelligenz (Midjourney) erzeugt und anschliessend retuschiert. Die Bilder erscheinen lebensecht und differenziert.

Andrea Pizzini

Wohin diese Entwicklung führt, kann man heute nur erahnen. Andere Fotografen testen die neuen Möglichkeiten ebenfalls aus. In einem informativen Video zeigt der Fotograf Andrea Pizzini, wohin seine Experimente führen.

Herausforderungen

Künstliche Intelligenz baut auf Algorithmen, die lernfähig sind. Gelernt wird mit verfügbaren Daten. Für die Generierung von Bildern wird deshalb auf bereits bestehende Bilderwelten zurückgegriffen. Erstellt eine künstliche Intelligenz Bilder, kann man sie im Stile von [NAME ERGÄNZEN] anfordern. Ein Foto im Stile von Robert Doisneau oder Li Wei? Man muss bei künstlicher Intelligenz nur den Bezug angeben und schon werden bestehende Bilder im Netz als Information für neue Bilder benutzt. Dabei tauchen selbstredend Fragen nach Authentizität, Copyright und weiteren rechtlichen Aspekten auf.

Die Herausforderungen von künstlicher Intelligenz müssen wir uns erst bewusst werden. Das Schützen eigener Werke dürfte schwieriger werden. Und wem gehören die Bilder, die erzeugt werden? Gehören die dem Fragensteller? Der Softwarefirma, welche die AI erstellt hat? Es benötigt vielleicht eine neue Sicht auf Bilder, Kunst, und wie wir die Welt sehen.


Wird Keywording von Fotos bald durch Künstliche Intelligenz ersetzt werden?

Künstliche Intelligenz ist auf dem Vormarsch und wird bald alle Lebens- und Arbeitsbereiche durchdringen. Es wird Research vereinfachen, konkrete Lösungen für komplexe Aufgaben bieten und vieles mehr. Das geschieht gerade auch in der Fotografie, worin das computergestützte Fotografieren mit Mobiltelefonen eine immer bessere Qualität generiert und dadurch laufend neue Einsatzgebiete erschliesst. Dasselbe geschieht auch bei der Verschlagwortung von Bildern. Von diesem «Keywording» handelt dieser Beitrag.

Suchbegriffe für Fotos

Die Bildsuche läuft vorwiegend über Suchbegriffe. Nur bei winzigen Kollektionen kann eine Suche via Bildgalerien genutzt werden. Die Erschliessung von sehr grossen Bildmengen gelingt heute via Suchbegriffen. Diese Suchbegriffe müssen zu den Bildern zugeordnet werden, damit die Bilder später mit denselben Begriffen gefunden werden können. Mann nennt das «Tagging» oder «Keywording». Ein Keyword ist ein Suchbegriff. Ein Tag ist ein Label. Beides meint in etwa dasselbe. Damit ein Foto gefunden werden kann, benötigt es oft Dutzende solcher Suchbegriffe pro Bild.

Fotos in professionellen Bildkollektionen werden in der Regel von Hand verschlagwortet. Dies ist eine anspruchsvolle Arbeit, die viel Zeit und Know-how verlangt. Es geht nicht darum, die eigenen Vorstellungen über ein Bild in Worten zu fassen, sondern auch die Suchbegriffe zu finden, die andere Benutzer eines Tages nutzen werden, um genau dieses oder jenes Bild zu finden.

Gutes Keywording ist aufwändig und kostet entsprechend. Bei spezialisierten Bildkollektionen benötigt es entsprechend geschultes Personal, erweiterte Kataloge mit Suchbegriffen und dergleichen Dinge mehr. Kein Wunder, dass viele an einfachere Methoden interessiert sind.

Visuelle Bildanalyse und das Keywording von morgen

Künstliche Intelligenz kann Bilder analysieren. Künstliche Intelligenz arbeitet mit Modellen, dessen Definition verbessert wird, je mehr aus neuen Bildern gelernt werden kann. Es geht dabei nicht um ein fixiertes Vorgehen, sondern um ein stetiges Lernen.

Eine visuelle Bildanalyse kann auf das Erkennen vieler Bildelemente trainiert werden. Es können Farbpaletten erkannt werden, aber auch Gegenstände oder Menschen. Von dort aus lernen Systeme dazu und erkennen Situationen, Konzepte und weitere abstrakte Ideen.

Wer ein iPhone einsetzt, kann eine automatische Zuordnung von Keywords in der Apple Photos-App zurückfinden. Hier hat man selbst vermutlich keine Keywords hinzugefügt, kann aber trotzdem nach einfachen Begriffen wie «Strasse», «Hund» oder ähnlich suchen. Das ist Künstliche Intelligenz in Aktion.

Bei dieser Anwendung hört es jedoch nicht auf. Die israelische Firma BRIA (bria.ai) ist in diesem Bereich tätig. Sie nutzen Künstliche Intelligenz für verschiedene Szenarien:

  • Fotos und Videos generieren
  • Fotos animieren (Bewegung hinzufügen wie bewegende Elemente, Kamerafahrten)
  • Fotos lokalisieren (dieselbe Szene, mit anderen Menschen, Objekten, Farben, usw.)
  • Fotos retuschieren (Objekte entfernen, einsetzen, neu zusammenstellen)
  • Visuelle Bildsuche.

Im Kontext dieses Beitrages ist die visuelle Bildsuche interessant. Eine visuelle Bilderkennung soll automatisch zu Suchbegriffen führen. Keywording ist dabei nicht mehr nötig. Mehr dazu erklärt Yair Adato in diesem Beitrag auf medium.com:

Er teilt hier die Vision, dass ein System mit künstlicher Intelligenz die Aufgabe von Keywording eliminieren könnte. Eine visuelle Bilderkennung findet die richtigen Begriffe, erkennt eine natürliche Sprache, arbeitet mit mehreren Sprachen und kann geeignete Suchresultate zeigen.

Zweifellos ist dies ein Trend, der sich durchsetzen wird. Allerdings geschieht das nicht von heute auf morgen. Wie mit anderen Technologien erfolgt die Entwicklung Schrittweise. Zuerst können allgemeine Themen erkannt werden, danach erst folgen später mehr komplexe Szenarien. Wenn etwas heute noch nicht möglich ist, heisst das keineswegs, dass es künftig nicht möglich sein wird.

Aufgrund eigener Erfahrung mit Bildkollektionen und Keywording, gehe ich davon aus, dass es zwar allgemeine Anwendungen gibt, für die erste Anwendungen entstehen, jedoch viele spezialisierte Bedürfnisse bestehen. Für diese letzte Gruppe ist ein Keywording nicht eindeutig. Hoch spezialisierte Bildkollektionen benötigen eigene Taxonomien. Und wie ist es mit firmeninternen Datenbanken, worin auch die eigenen Marketing-Begriffe eingebaut werden müssen? Es kann deshalb kaum erwartet werden, dass alles auf einmal von Systemen mit künstlicher Intelligenz überrannt wird. Die Richtung ist heute jedoch absehbar.

Ethische und rechtliche Fragen zu Generative AI sind heute meist noch nicht geklärt. Im folgenden Beitrag von James Vincent wird darauf Bezug genommen:

wer diese Technologien heute einsetzt, muss sich auf weitere Auseinandersetzungen gefasst machen.

BRIA und Getty Images

Die Firma BRIA und Getty Images sind eine Partnerschaft eingegangen. Das Potenzial von Künstlicher Intelligenz wird die Bildindustrie nachhaltig prägen. Getty sieht dies mit Weitblick kommen und bereitet sich so vor.

In diesem Pressebericht werden keine speziellen Aufgaben genannt. Es geht auch nicht um bestimmte Aufgaben, sondern um eine technologische Entwicklung mit vielen Anwendungsgebieten. Mit künstlich erzeugten Bildern sind etwa Modellfreigaben nicht mehr nötig, oder können Bilder exakt nach Vorstellungen von Kunden erstellt werden. Eine Optimierung der Suchresultate aufgrund von Bildmerkmalen gehört ebenso zu den Möglichkeiten.

Was Getty hier im grossen Stil denkt und plant, wird auch die kleineren Bildagenturen und Fotografen betreffen. Erscheinen etwa bei Getty Images in der Suchmaschine bessere Suchresultate, dann wird sich das herumsprechen.

Mit diesen Entwicklungen ist kein Ende abzusehen. Vielmehr stehen wir an der Grenze neuer Möglichkeiten. Aktuell ist gutes Keywording immer noch die beste Methode für die meisten Kollektionen. Bereits entstehen aber interessante Alternativen.


5 Tipps für besseres Keywording von Fotos

Mit «Keywording» meint man die Verschlagwortung von Fotos, damit diese in digitalen Archiven gefunden werden können. Zum Thema Keywording gehören nicht nur die «Keywords», also die Suchbegriffe, sondern in der Regel auch eine Beschreibung vom Bild sowie weitere Metadaten. Mit den folgenden Tipps lässt sich etwas Ordnung in die Arbeit bringen.

Der Begriff «Keywording» wird häufig im Zusammenhang mit Suchmaschinenoptimierung im Web (SEO) verknüpft. Das ist jedoch etwas anderes. Im Kontext von diesem Beitrag geht es um Suchbegriffen, die Bildern hinzugefügt werden, damit die Bilder auch gefunden werden. Es geht um bildspezifische Angaben, nicht um eine Suchmaschinenoptimierung. Keywording für Fotos wird häufig auch als «Tagging» beschrieben. Das ist ähnlich, aber ein Hinzufügen von Tags ist gleichzeitig Ausdruck einer bestimmten Form von Keywording. Es gibt bessere Formen von Keywording als Tagging. Das wäre jedoch ein Thema für einen weiteren Beitrag.

Warum sollte man Bilder verschlagworten?

Es gibt dafür viele Gründe. Der wichtigste Grund ist jedoch dieser: Bilder haben einen Wert für den Fotografen, für den Kunden, für den Verkauf, für die Dokumentation. Damit diese Bilder gefunden werden können, müssen sie zugeordnet werden. Eine Zuordnung geschieht vielleicht durch Ablage in Kategorien, aber eine vielseitigere Art ist das Hinzufügen von Suchbegriffen, über die Bilder dann nach verschiedenen Kriterien gesucht und gefunden werden können.

Ein Keywording von Fotos will Werte erhalten, sichtbar machen, nützlich machen. Zwar gibt es immer mehr künstliche Intelligenz, die das Keywording übernehmen, aber die Genauigkeit und spezifische Zuordnung von Keywords kann nicht in jedem Fall gewährleistet werden. Wie soll etwa eine künstliche Intelligenz Wörter kennen, die es noch nicht gelernt hat? Etwa den Namen einer Marketing-Kampagne, für die ein bestimmtes Bild genutzt wird und wonach gesucht werden muss? Es gibt für einen solchen Begriff keine Bildmerkmale und kann deshalb nie von einer künstlichen Intelligenz auf Basis von Bildmerkmalen einer solchen Kampagne zugeordnet werden.

5 Tipps für besseres Keywording

  • Beschreibe nur, was du siehst
  • Kenne die Benutzer und die Suchmaschine
  • Nutze Synonyme, Mehrzahlformen und Deklinationen (wenn benötigt)
  • Benenne allgemeine Angaben
  • Definiere Ausschlusskriterien.

1. Beschreibe nur, was du siehst

Wenn wir die Welt betrachten, interpretieren wir. Die Interpretation ist nützlich, aber für eine nüchterne Beschreibung eines Bildes oft nicht hilfreich, denn sie zeigt nur Deine Sicht der Welt. Das Ziel von Keywording ist es jedoch, dass andere Menschen die Bilder finden. Für die ist das Keywording gemeint.

Beschreibe also zuerst die Dinge, die direkt sichtbar sind, wie die Landschaft, das Objekt, die Menschen und ihre Altersgruppen, die Beschäftigung und dieser Dinge mehr. Vermeide es, Dinge zu nennen, die nicht sichtbar sind. Die Idee dahinter ist, dass Menschen nach bestimmten Wörtern suchen und dann auch konkrete Vorstellungen haben, was das für Objekte, Menschen, Berufe, Beschäftigungen und dergleichen sind. Erscheinen in den Suchresultaten dann Bilder, die kaum etwas mit dem gesuchten Thema zu tun haben, dann «verschmutzt» das die Suchresultate. Wer bessere Resultate bei der Bildsuche will, muss bei den Keywords selektiv vorgehen.

Vermeide schwammige Konzepte. Sieht man auf dem Bild etwa ein «Senior» stehen, der «lächelnd in die Kamera schaut», dann sind das die Wörter und Ausdrücke, die man im Bild erkennt. Nicht erkennbar ist dagegen, ob dieser ältere Mann ein Grossvater ist, pensioniert ist, ein Prostataleiden hat oder sich nach besseren Zeiten sehnt. Alle diese Ideen können wichtige Konzepte sein, die auf unbestimmte Art zum Thema der Fotoserie gehören, aber sie werden im Bild nicht ausgedrückt. Konzeptangaben wie diese sollten sehr zurückhaltend angewendet werden.

2. Kenne die Benutzer und die Suchmaschine

Es gibt viele Angebote für ein allgemeines Keywording. Gedacht sind diese Dienstleistungen für Fotografen und Bildagenturen, die mit allgemeinen Themen schnell und günstig ihre Fotos verschlagworten wollen, damit sie möglichst schnell in den Verkauf gehen.

Die Idee ist gut, hat einst auch funktioniert, aber diese allgemeine Verschlagwortung führt heute nicht mehr zu guten Resultaten – wegen der Unmenge an verfügbaren Bildern. Eine allgemeine Verschlagwortung für allgemeine Bilder lässt diese Bilder schnell in der Masse untergehen.

Ein angepasstes Keywording schaut nach Benutzern und der genutzten Suchmaschine. Gehören die Bilder etwa einer Firma und werden die Bilder nur Firmenintern genutzt, lassen sich oft spezielle Angaben machen, firmeninterne Bezeichnungen, Produktnummern und dergleichen mehr. Diese Angaben zu ergänzen, führt direkt zu einem besseren Benutzererlebnis. Bilddatenbanken laufen auf unterschiedlichste Systeme.

Nach welchem Muster werden Bilder in der Suchmaschine erkannt? Wird gesucht auf

  • Wordanfang (Suchbegriff «Man» findet «Mann», aber auch «Manhattan»),
  • Wortende (Suchbegriff «Man» findet «Woman»),
  • ganze Wörter (Suchbegriff «New» findet sowohl «New» als auch «New York»),
  • ganze Suchbegriffe (Suchbegriff «New» findet «New», aber nicht «New York»),
  • Teil des Strings (Suchbegriff «Bar» findet «embargo») oder
  • Unscharfe Suche (Suchbegriff «Fernseher» findet auch «Fernsehgerät», «Ferne» findet auch «Weite»)

Die Einstellung der Suchmaschine ist ebenso wichtig wie das korrekte Keywording und beeinflusst massgeblich die Suchresultate.

3. Nutze Synonyme, Mehrzahlformen und Deklinationen

Es gibt Suchmaschinen, die nutzen Synonyme, Mehrzahlformen und Deklinationen. Wenn das der Fall ist, führt die Suche «weiblich» auch zu Bildern von Frauen. Das erscheint logisch, ist es aber nicht, denn Suchmaschinen können in der Regel nur finden, was auch definiert wurde. Eine Datenbank für Synonyme und weiteren Sprachvarianten findet deutlich mehr Treffer. Ist keine Datenbank mit Synonymen vorhanden, wird die Suche nach «weiblich» nicht automatisch Bildern von Frauen finden – es sei denn, dass dort der Suchbegriff «weiblich» explizit hinzugefügt wurde. Wer nach «gelbe Tulpen» sucht, der kombinierte Begriff jedoch nicht explizit zu Fotos hinzugefügt wurde, findet nur Treffer, wenn die Suchmaschine vielseitig interpretiert.

Die Angabe von Synonymen, Mehrzahlformen und Deklinationen beim Keywording ist ein Qualitätsmerkmal, das insbesondere dann wichtig ist, wenn Suchmaschinen keine Zusatzdatenbanken für Synonyme und dergleichen führen.

Ähnliches gilt für mehrsprachige Suchmaschinen.

4. Benenne allgemeine Angaben

Sowohl präzise als auch allgemeine Angaben zur Beschreibung eines Bildes sind wichtig. Präzise Angaben helfen beim Finden genau definierter Bildelemente. Allgemeine Angaben helfen dabei, einen Kontext zu definieren.

  • Die Suche nach «Frau» wird verschiedenste Bilder finden.
  • Die Suche nach «Business Frau» wird Frauen im Kontext von Business finden.
  • Die Suche nach «Business Meeting Frau» wird Geschäftsfrauen bei Meetings finden.

Allgemeine Angaben können (je nach Suchmaschine und deren Möglichkeiten) auch als Ausschlusskriterium genutzt werden.

  • Suche nach «+Frau -Business» findet Frauen, aber nicht im Business Kontext.

Allgemeine Angaben sollten auch über weitere Bildmerkmale Aufschluss geben, die das Bild beschreiben, etwa:

  • Indoor oder Outdoor?
  • Bei Tag oder bei Nacht? Sonnenaufgang? Sonnenuntergang?
  • Weitwinkelaufnahme oder Detailaufnahme? Schaut in die Kamera?
  • Vogelperspektive, von unten, von der Seite?
  • Auffällige Farben im Bild
  • Low-key oder High-key Eindruck?
  • Ort, Land

5. Definiere Ausschlusskriterien

Ausschlusskriterien helfen dabei, eine Bildauswahl einzugrenzen. Das ist insbesondere bei grossen Datenbanken wichtig, damit gewünschte Sujets schneller gefunden werden.

Wie findet man etwa Bilder ohne Menschen? Da hilft es, ein Begriff wie «Niemand» aufzuführen, welches treffend beschreibt, dass keine Menschen in Bild sind.

  • Suche «Boot Niemand» findet Bilder von Schiffen ohne Menschen.
  • Suche «Schulplatz Niemand» findet Bilder von leeren Schulplätzen

Alles kann ein Ausschlusskriterium sein. Kenne deshalb den Auftraggeber, sein Arbeitsgebiet, seine Fotos und spreche ab, welche Ausschlusskriterien bei der Bildsuche hilfreich sind. Diese Begriffe füge hinzu.

Beim Keywording hilft es, diese Angaben als Muster für den Arbeitsfluss zu verwenden. Schritt für Schritt geht man vom ersten bis zum letzten Punkt dieser Liste und fügt entsprechend der Gruppe die Keywords hinzu. Der grosse Unterschied in der Qualität des Keywording liegt in den kleinen Schritten hin zum guten Resultat.


Fotorealistische Bilder durch künstliche Intelligenz

Der Aufwand für ein Fotoshoot ist beträchtlich. Der Ort, die Models, das Licht, die Freigaben – es gibt ausserordentlich viele Parameter bis zu einer gelungenen Fotoserie. Geht das auch anders?

Künstliche Intelligenz hält in immer mehr Lebens- und Arbeitsbereichen Einzug. Jetzt ist die Fotografie an der Reihe. BRIA ist eine Firma, spezialisiert in die Erzeugung von fotorealistischen Bildern und Videos mithilfe künstlicher Intelligenz. Diese Entwicklung dürfte den Markt für Stockfotografie nachhaltig beeinflussen.

Auf der Website bria.ai stellt die Firma vor, wie sie sich die Erzeugung von Bildern und Videos vorstellen. Durch künstliche Intelligenz lassen sich alle Objekte und Personen im Film einzeln beeinflussen. Dadurch können Personen frei gewählt, Gesichtsausdrücke manipuliert und Hautfarbe angepasst werden. Es entsteht im Handumdrehen eine Szene, die es in Wirklichkeit nie gab, und die frei beeinflussbar ist.

Das Resultat sind lebensechte Fotos und Videos, für die es keine Modell-Freigaben benötigt, die für Werbung also problemlos nutzbar sind und für viele Anforderungen eine hohe Qualität aufweisen.

Diese Entwicklung wird sich durchsetzen. Fotografen sind nicht mehr für alles wichtig. Modell-Karieren für Stockfotografie dürften knapper werden. Für den Bildeinkäufer wird vieles einfacher, auch wenn es aktuell noch kein Mainstream ist. Das erscheint jedoch nur eine Frage der Zeit, wie sich auch andere Technologien bereits lange durchgesetzt haben.

BRIA wirbt mit folgenden Vorteilen:

  • Vorhersehbarkeit (definierbare Resultate)
  • Kontrollierbarkeit (alle Bildelemente sind anpassbar)
  • Qualität (hohe Auflösung, fotorealistisch)
  • Automatisierung (Variationen)
  • Benutzerfreundlichkeit (Einbindung via API in anderen Lösungen)

Die neuralen Netzwerken von BRIA zeigen auch Anwendungsbeispielen für etwa Fotografie auf. Fotos können zu Videos umgewandelt werden, indem bestimmte Bildteile animiert werden. Dadurch wird nicht nur die Unterscheidung zwischen Foto und Video aufgehoben, sondern es eröffnen sich auch ganz andere Anwendungsgebiete für bestehendes Fotomaterial. Zweifellos ist Bewegtbild heute wichtig auf jeder Website.

In Zukunft wird es immer mehr Anbieter von automatisch-generierten Bildern und Videos geben. Dasselbe gibt es auch bereits für Audio-Dateien. Noch sind es wenige Firmen, die in neue Richtung vorstossen, aber das dürfte sich in den nächsten Jahren drastisch ändern.

Bildagenturen haben sich bislang über massive Bildkollektionen definiert. Gibt es bald spezialisierte Agenturen wie BRIA, die Bilder auf Bestellung produzieren? Ganz ohne rechtliche Probleme und auch in letzter Sekunde? Diese Vereinfachung dürfte zu einem veränderten Kaufverhalten führen und steigert die Erwartung an Bildagenturen.

Ich warte nur darauf, dass Bildeinkäufer die neuen Möglichkeiten entdecken.

BRIA.ai

Verlustfreie Bildvergrösserung

Manchmal benötigt man eine grössere Bilddatei. Vielleicht ist das verfügbare Foto nur in begrenzter Auflösung erhältlich oder es muss ein aussergewöhnlich grosses Bild erzeugt werden. Wie geht man vor?

Verschiedene Optionen für Bildvergrösserungen

Immer bessere Kameras liefern immer höhere Auflösungen. Der Bedarf für Bildvergrösserungen hat abgenommen. Allerdings gibt es immer wieder Situationen, in denen man um bessere und hochaufgelöste Bilddaten froh wäre. Wenn die nicht neu erzeugt werden können, muss man die gewünschte Resultate auf andere Weise versuchen zu erhalten.

Interpolation

Bildverarbeitungen wie Photoshop & Co. bieten häufig eine sogenannte Interpolation an. Dafür gibt es verschiedene Methoden. Die Idee ist folgende: Das Bild wird auf eine neue Grösse gerechnet und fehlende Bildinformationen werden aus den verfügbaren benachbarten Pixeln «interpoliert». Liegen etwa zwei Bildpixel mit den Werten schwarz und weiss nebeneinander, dann werden Sie bei einer Vergrösserung auseinandergezogen und dazwischen wird ein mittleres grau eingefügt. Das scheint zwar logisch, aber hat den Nachteil, dass dadurch Details verloren gehen, Rändern im Bild verschwommen werden und dergleichen Dinge mehr.

Fraktalen und andere Tricks

Das Resultat bei Bildvergrösserungen lässt sich deutlich verbessern, wenn man spezielle Techniken einsetzt. Ein klares Beispiel dafür ist das ehemalige Produkt GenuineFractals, das Ende der 1990er-Jahre von der Firma Altamira Group entwickelt wurde (Quelle) und damals von Kursiv in der Schweiz vertrieben wurde. Später ging GenuineFractals an die Firma onOne Software (ON1.com), die seinerseits ein Spin-off der Firma Extensis ist. Die fraktale Technologie beschrieb das Bild nicht in Pixeln, sondern mit Formeln. Die Formel nun war skalierbar und die beschriebenen Bild-Details konnten gut skaliert werden.

Diese neue Art, Bilder zu beschreiben, wurde mit weiteren Tricks ergänzt. Wurde im Bild etwa eine Begrenzung erkannt, eine Linie oder Fläche, dann liess man bei der Vergrösserung diesen Rand in der Originalstärke, vergrösserte sie also nicht mit. Stellt man sich eine 1-Pixel starke Linie vor, und das Bild wird 10x vergrössert, müsste die Linie 10 Pixel breit werden. Belässt man die Linie jedoch bei einer 1-Pixel-Stärke, entsteht dadurch subjektiv den Eindruck, dass das Bild schärfer ist. Auch liess sich bei der Vergrösserung «Noise» einrechnen, wodurch vermeintliche Details hinzugefügt wurden. Das Letzte ist allerdings sehr unspezifisch und wenig natürlich, hat jedoch bei einigen Bildern eine angemessene Wirkung.

Ein weiteres Produkt, welches hervorragende Vergrösserungen produziert, ist «BlowUp» von der Firma Exposure Software. Auch diese Software bringt deutlich bessere Vergrösserungen hervor als Photoshop-eigene Funktionen. Ein zusätzlicher Nutzen der Speziallösungen ist die, dass zusätzliche Funktionen für besondere Zwecke vorhanden sind. Dabei kann man an Bildvergrösserungen für Kunstdrucke denken, wobei man den Bildrand um die Leinwand herum definieren kann, oder übergrosse Bilder in druckbaren Streifen produziert.

Künstliche Intelligenz

Nun steht die nächste Optimierung an. onOne Software kündigt für April 2022 eine neue Version Ihrer Bildvergrösserungssoftware an. Unter dem Namen «ON1 Resize AI» erscheint ein Nachfolge-Produkt, das mit künstlicher Intelligenz funktioniert. Die Idee ist folgende: Ein lernfähiges System erkennt nicht nur die Pixel eines Bildes, sondern hat verstehen gelernt, wie die Originaldetails bei vergleichbaren guten Bildern aussehen. Dadurch können typische Bildstrukturen im Nachhinein ergänzt werden und das Bild erscheint in der Vergrösserung auf natürliche Art deutlich detaillierter. Das ist nicht die einzige Lösung, die mit künstlicher Intelligenz arbeitet. Gigapixel von Topaz Labs bietet eine ähnliche Funktionsweise.

Im folgenden Video gibt es eine Vorschau auf das neue On1 Resize AI.

Die Resultate nach dem Video sind umwerfend besser. Es werden sogar Details der Originalfotos verbessert. Allerdings gibt es auch den Eindruck, dass die Tiefe des Bildes noch nicht berücksichtigt wird. Eine natürliche Sicht verliert Details, je weiter sie entfernt sind. In den gezeigten Beispielen werden jedoch auf fast jede Distanz Verbesserungen erzielt. Das ist erstaunlich. Hier und dort erschien mir das Resultat gerade dadurch jedoch etwas unnatürlicher. Es kann gut sein, dass man mit ON1 Resize AI zwar die besten Resultate erhält, für überzeugende Resultate jedoch vielleicht mit Masken für Vordergrund und Hintergrund arbeiten muss, damit nicht zu viel Detail im Hintergrund hinzugefügt wird.

Weitere Beispiele finden sich hier:

Zusammenfassung

Die Software für Bildvergrösserungen wird immer besser. Eine «verlustfreie Bildvergrösserung» kann immer nur angenähert werden. Die möglichen Resultate sind heute besser als je zuvor.


Translate »

Privacy Preference Center