Künstliche Intelligenz ist auf dem Vormarsch und wird bald alle Lebens- und Arbeitsbereiche durchdringen. Es wird Research vereinfachen, konkrete Lösungen für komplexe Aufgaben bieten und vieles mehr. Das geschieht gerade auch in der Fotografie, worin das computergestützte Fotografieren mit Mobiltelefonen eine immer bessere Qualität generiert und dadurch laufend neue Einsatzgebiete erschliesst. Dasselbe geschieht auch bei der Verschlagwortung von Bildern. Von diesem «Keywording» handelt dieser Beitrag.

Suchbegriffe für Fotos

Die Bildsuche läuft vorwiegend über Suchbegriffe. Nur bei winzigen Kollektionen kann eine Suche via Bildgalerien genutzt werden. Die Erschliessung von sehr grossen Bildmengen gelingt heute via Suchbegriffen. Diese Suchbegriffe müssen zu den Bildern zugeordnet werden, damit die Bilder später mit denselben Begriffen gefunden werden können. Mann nennt das «Tagging» oder «Keywording». Ein Keyword ist ein Suchbegriff. Ein Tag ist ein Label. Beides meint in etwa dasselbe. Damit ein Foto gefunden werden kann, benötigt es oft Dutzende solcher Suchbegriffe pro Bild.

Fotos in professionellen Bildkollektionen werden in der Regel von Hand verschlagwortet. Dies ist eine anspruchsvolle Arbeit, die viel Zeit und Know-how verlangt. Es geht nicht darum, die eigenen Vorstellungen über ein Bild in Worten zu fassen, sondern auch die Suchbegriffe zu finden, die andere Benutzer eines Tages nutzen werden, um genau dieses oder jenes Bild zu finden.

Gutes Keywording ist aufwändig und kostet entsprechend. Bei spezialisierten Bildkollektionen benötigt es entsprechend geschultes Personal, erweiterte Kataloge mit Suchbegriffen und dergleichen Dinge mehr. Kein Wunder, dass viele an einfachere Methoden interessiert sind.

Visuelle Bildanalyse und das Keywording von morgen

Künstliche Intelligenz kann Bilder analysieren. Künstliche Intelligenz arbeitet mit Modellen, dessen Definition verbessert wird, je mehr aus neuen Bildern gelernt werden kann. Es geht dabei nicht um ein fixiertes Vorgehen, sondern um ein stetiges Lernen.

Eine visuelle Bildanalyse kann auf das Erkennen vieler Bildelemente trainiert werden. Es können Farbpaletten erkannt werden, aber auch Gegenstände oder Menschen. Von dort aus lernen Systeme dazu und erkennen Situationen, Konzepte und weitere abstrakte Ideen.

Wer ein iPhone einsetzt, kann eine automatische Zuordnung von Keywords in der Apple Photos-App zurückfinden. Hier hat man selbst vermutlich keine Keywords hinzugefügt, kann aber trotzdem nach einfachen Begriffen wie «Strasse», «Hund» oder ähnlich suchen. Das ist Künstliche Intelligenz in Aktion.

Bei dieser Anwendung hört es jedoch nicht auf. Die israelische Firma BRIA (bria.ai) ist in diesem Bereich tätig. Sie nutzen Künstliche Intelligenz für verschiedene Szenarien:

  • Fotos und Videos generieren
  • Fotos animieren (Bewegung hinzufügen wie bewegende Elemente, Kamerafahrten)
  • Fotos lokalisieren (dieselbe Szene, mit anderen Menschen, Objekten, Farben, usw.)
  • Fotos retuschieren (Objekte entfernen, einsetzen, neu zusammenstellen)
  • Visuelle Bildsuche.

Im Kontext dieses Beitrages ist die visuelle Bildsuche interessant. Eine visuelle Bilderkennung soll automatisch zu Suchbegriffen führen. Keywording ist dabei nicht mehr nötig. Mehr dazu erklärt Yair Adato in diesem Beitrag auf medium.com:

Er teilt hier die Vision, dass ein System mit künstlicher Intelligenz die Aufgabe von Keywording eliminieren könnte. Eine visuelle Bilderkennung findet die richtigen Begriffe, erkennt eine natürliche Sprache, arbeitet mit mehreren Sprachen und kann geeignete Suchresultate zeigen.

Zweifellos ist dies ein Trend, der sich durchsetzen wird. Allerdings geschieht das nicht von heute auf morgen. Wie mit anderen Technologien erfolgt die Entwicklung Schrittweise. Zuerst können allgemeine Themen erkannt werden, danach erst folgen später mehr komplexe Szenarien. Wenn etwas heute noch nicht möglich ist, heisst das keineswegs, dass es künftig nicht möglich sein wird.

Aufgrund eigener Erfahrung mit Bildkollektionen und Keywording, gehe ich davon aus, dass es zwar allgemeine Anwendungen gibt, für die erste Anwendungen entstehen, jedoch viele spezialisierte Bedürfnisse bestehen. Für diese letzte Gruppe ist ein Keywording nicht eindeutig. Hoch spezialisierte Bildkollektionen benötigen eigene Taxonomien. Und wie ist es mit firmeninternen Datenbanken, worin auch die eigenen Marketing-Begriffe eingebaut werden müssen? Es kann deshalb kaum erwartet werden, dass alles auf einmal von Systemen mit künstlicher Intelligenz überrannt wird. Die Richtung ist heute jedoch absehbar.

Ethische und rechtliche Fragen zu Generative AI sind heute meist noch nicht geklärt. Im folgenden Beitrag von James Vincent wird darauf Bezug genommen:

wer diese Technologien heute einsetzt, muss sich auf weitere Auseinandersetzungen gefasst machen.

BRIA und Getty Images

Die Firma BRIA und Getty Images sind eine Partnerschaft eingegangen. Das Potenzial von Künstlicher Intelligenz wird die Bildindustrie nachhaltig prägen. Getty sieht dies mit Weitblick kommen und bereitet sich so vor.

In diesem Pressebericht werden keine speziellen Aufgaben genannt. Es geht auch nicht um bestimmte Aufgaben, sondern um eine technologische Entwicklung mit vielen Anwendungsgebieten. Mit künstlich erzeugten Bildern sind etwa Modellfreigaben nicht mehr nötig, oder können Bilder exakt nach Vorstellungen von Kunden erstellt werden. Eine Optimierung der Suchresultate aufgrund von Bildmerkmalen gehört ebenso zu den Möglichkeiten.

Was Getty hier im grossen Stil denkt und plant, wird auch die kleineren Bildagenturen und Fotografen betreffen. Erscheinen etwa bei Getty Images in der Suchmaschine bessere Suchresultate, dann wird sich das herumsprechen.

Mit diesen Entwicklungen ist kein Ende abzusehen. Vielmehr stehen wir an der Grenze neuer Möglichkeiten. Aktuell ist gutes Keywording immer noch die beste Methode für die meisten Kollektionen. Bereits entstehen aber interessante Alternativen.

Neue Beiträge automatisch erhalten

Am 1. Dienstag im Monat werden, wenn vorhanden, Beiträge vom letzten Monat als Übersicht verschickt. Der Newsletter lässt sich jederzeit über einen Link unter jedem E-Mail abbestellen.

Wir senden keinen Spam. Erfahre mehr in unserer Datenschutzerklärung.

0
0