Fotos und Illustrationen, die man nicht mehr finden kann, haben keinen Wert. Die Zuordnung von Suchbegriffen (Keywords) zu Bildern, sowie die Pflege der Metadaten, helfen dabei diese Werte zu erhalten und zu nutzen. Das ist jedoch einfacher gesagt als getan. Wie kann man die eigene Strategie für den Umgang mit Bildinformationen planen?
Begriffserklärungen
Metadaten sind Informationen über etwas anderes. Es sind Beschreibungen über Dinge, über Dateien, über Bilder. Verfügt man etwa über eine Bildkollektion, dann geht es um Informationen über die einzelnen Fotos und Illustrationen. Man kann dabei an den Namen des Fotografen oder den Tag der Aufnahme denken, jedoch ebenso an eine Beschreibung von dem, was auf dem Bild ersichtlich ist.
Metadaten werden oft in den Dateien selbst gespeichert, sofern das im Dateiformat vorgesehen ist. Das ist nicht immer der Fall und damit soll man umgehen können. Eine JPG-Datei kann ausführliche Informationen speichern, eine PNG-Datei dagegen nicht. Selbstverständlich kann man PNG-Dateien trotzdem beschreiben, aber die Information muss extern gespeichert werden, etwa in einer Datenbank, mit einer Referenz auf die Datei.
IPTC ist ein Standard in der Definition von Metadaten-Einheiten. Es sind so etwas wie Felder, worin man Informationen ablegen kann. Der Vorteil des IPTC-Standards ist auch, dass der Inhalt definiert ist. Es ist beschrieben, was in welchem Feld gehört. Damit ist der IPTC-Standard einmalig. (iptc.org)
EXIF ist ein Standard in der Definition von Metadaten-Einheiten, der von Kameraherstellern genutzt wird. Es werden vorwiegend technische Daten aufbewahrt. EXIF steht für «Exchangeable Image File Format» und ist ein Standard, der in der zweiten Hälfte der 1990-er Jahre populär wurde und sowohl für JPG als auch für TIFF-Dateien galt.
XML («Exchangeable Image File Format») ist ein strukturiertes Datenformat, in welchem Informationen abgelegt werden können. Dabei können Felder und deren Inhalt beliebig zugeordnet werden. XML ist flexibel und wird in vielen Varianten für Informationen genutzt. Es gibt jedoch einen wichtigen Unterschied zu einem Datenstandard wie IPTC: XML definiert keine Felder. Jeder kann also eigene Felder erzeugen und eigene Definitionen festlegen. Solange diese Informationen innerhalb derselben Firma genutzt werden, stellt das kein Problem dar. Für den Datenaustausch zwischen verschiedenen Plattformen ist das jedoch wenig optimal. IPTC-Felder sind standardisiert. XML-Felder können überall unterschiedlich genutzt werden.
XMP («Extensible Metadata Platform») ist ein Datenformat, das von Adobe entwickelt und genutzt wird. XMP ist eine Anwendung von XML und wird von Adobe als Standard vorgestellt. Adobe hat dieses Format und weitere Standardisierungen vorangetrieben. Es gibt viele Vorteile, wie eine fast universelle Anwendbarkeit. XMP hat als Firmenlösung angefangen und hat sich heute als Standard neben IPTC etabliert. Es gibt Überlappungen zwischen etwa IPTC, XMP und EXIF, für die es technische Lösungen benötigt. Wichtig ist dieser Umstand auch für das Keywording. Wenn etwa eine Bildbeschreibung in IPTC und XMP abgespeichert wird, soll man sicherstellen, dass entweder der andere Container ebenfalls aktualisiert oder gegebenenfalls gelöscht wird.
Unterschiedliche Informationen
Es darf einleuchtend sein, dass man Informationen über Bilder auch in den Bildern speichert. Dabei gibt es jedoch einige Dinge zu beachten. Das liegt primär daran, dass Informationen sich selbst nicht aktualisieren. Im Verlauf der Zeit können Änderungen deshalb verloren gehen. Hier ein paar Stolpersteine:
- Unterschiedliche Datenblocken
Viel genutzte Bildformate wie JPG können mehrere Datenformate beinhalten, etwa EXIF, IPTC und XMP. Informationen aus den jeweiligen Blöcken können dabei überlappend sein. Eine Bildbeschreibung kann etwa in den IPTC-Feldern, aber auch in den XMP-Feldern abgelegt werden. Ändert man jetzt die Bildbeschreibung im XMP-Container, was passiert mit demselben Informationsblock in den IPTC-Feldern? Leicht entstehen widersprüchliche Informationen. Sollte man sich etwa auf den Standard IPTC begrenzen oder doch lieber einen quasi-Standard wie XMP nutzen, weil dieser flexibler zu nutzen ist? - Mehrere Sprachen
Seit vielen Jahren versucht das IPTC-Konsortium, eine Mehrsprachigkeit für IPTC zu definieren. Das ist bislang nicht gelungen. Als Resultat gibt es für IPTC-Felder nur eine einzige Sprache. Dasselbe gilt für XMP-Container. Rein technisch könnte man in einer XML-Beschreibung (ähnlich XMP), Sprachen als zusätzliche Information zu Datenfeldern speichern. Man spricht dann über technische Lösungen. Wie sieht aber ein Datenstandard für Felddefinitionen aus, der weltweit gelten sollte? Da kann man keine technischen Lösungen voraussetzen, denn es geht um Felddefinitionen. Einsprachigkeit ist heute demnach der Standard. Man sollte sorgfältig überlegen, welche Informationen in welcher Sprache in den Dateien gespeichert werden sollen. - Überlappungen
Bildinformationen (EXIF, IPTC, XMP) werden häufig in verschiedenen Datenblocken abgelegt. Einige Felder werden von einigen Softwarelösungen automatisch abgeglichen. Dabei ist es auf den ersten Blick nicht immer klar, welche Felder aktualisiert werden und welche Hierarchie dabei gilt. Das kann viel Verwirrung stiften. Es scheint hilfreich zu sein, sich für einen Datenblock (IPTC/XMP) zu entscheiden und alle Alternativen sorgfältig zu eliminieren. Geschieht das nicht, können alte Metadaten erhalten bleiben, die bei späteren Uploads und Verarbeitungen für Verwirrung sorgen. Was passiert etwa mit den Informationen zur Bildgrösse, die von der Kamera in EXIF-Feldern abgelegt werden, wenn das Bild neu skaliert wird? Was passiert mit dem Copyright-Verweis, wenn ein Kunde eine Lizenz zur Bildnutzung erhält? - Bilddatenbanken
Heute werden Fotos und Illustrationen häufig auf (firmeninternen) Websites bereitgestellt. Lädt man ein Bild hoch, werden Informationen vom System dieser Website häufig extrahiert, um danach für Bildsuchen genutzt zu werden. Welche Information wird von diesem System bevorzugt? Erwartet die Website Bilder als JPG mit IPTC-Daten? Oder werden XMP-Daten vorgezogen, wenn beide vorhanden sind? Was passiert mit Informationen, die auf Deutsch erfasst wurden, aber die Website ist auf Englisch? Für welche Informationen gibt es Behälter auf der Website, jedoch nicht in den Bilddaten selbst? Was passiert, wenn man auf der Website eine Information korrigiert – werden die Korrekturen in die Bilddaten zurückgeschrieben?
Diese und weitere Fragen bedürfen sorgfältige Abklärungen.
Metadaten pflegen
Damit Bilder genutzt werden können, müssen sie gefunden werden. Die aktuelle Bilderflut wird kaum abreissen. Es ist deshalb absehbar, dass jede Bildkollektion wachsen wird. Bei einer wachsenden Menge an Bildern ergeben sich automatisch steigende Anforderungen. Hat man 20 Business-Bilder, reicht vielleicht ein Stichwort wie «Business», um diese Bilder zu finden. Was aber bei 20’000 Business-Bildern? Dann benötigt es zusätzliche Begriffe, damit man diese in kleinere Kategorien aufsplitten kann. Nur so werden grosse Bildbestände nutzbar. Spezifische Informationen zur Eingrenzung von Suchresultaten werden immer bedeutsamer, je grösser die Konkurrenz von anderen Bildern ist.
Suchbegriffe sind ein Teil der Metadaten. Zu allgemeinen Metadaten gehören Informationen zur Bildgrösse, des Fotografen, Aufnahmedatum und vieles mehr. Die allgemeinen Metadaten können ebenso hilfreich sein wie die Bildbeschreibung und Suchbegriffe (Keywords). Welche Informationen genutzt werden können, ist auch von der Software oder der Website abhängig, womit man arbeitet.
Zur Vorbereitung einer guten Keywording-Strategie hilft es, den gesamten Arbeitsablauf vom Fotografen bis zum Endbenutzer vorzustellen. Auf jeder Stufe wird Software genutzt. Wie greifen diese Software-Bausteine ineinander? Was geht verloren, was bleibt unbeantwortet, was wird benötigt?
Metadaten sind essenzielle Informationen darüber, was ein Bild ausmacht. Diese Informationen können bewusst aufgebaut und ausgebaut werden, damit die Nutzung und Auffindbarkeit gewährleistet ist. Eine Strategie zur Nutzung der Bildinformationen muss dafür sorgen, dass die benötigten Informationen den Bildern auch hinzugefügt werden.
Keywording von Fotos
Der Begriff «Keywording» meint in unserem Kontext das Hinzufügen von Suchbegriffen zu Bildern, damit diese gefunden werden. Dabei stellt man sich jemanden als Endbenutzer vor, der vor einer Website oder Datenbanksoftware sitzt und Bilder sucht. Diese Person schreibt Suchbegriffe in einem Suchformular, um bei der Suche eine Auswahl an Bildern zu erhalten. Das funktioniert selbstverständlich nur, wenn diese Suchbegriffe vorrangig den Bildern zugeordnet werden.
Bei der Planung einer geeigneten Keywording-Strategie muss man die Eigenschaften der Bildkollektion kennen, die Möglichkeiten der Software oder Website sowie die Anforderungen der Bildbenutzer. Man stelle sich etwa vor, dass man von einer Bildkollektion eines Museums spricht. Es gibt ausführliche Fotos von allen Objekten, die bestimmten Länder und Orte, Stilperioden, Objektgruppen und Eigenschaften abbilden. Diese Dinge dürften alle wichtig sein, müssen also erfasst werden, damit sie genutzt werden können.
Nicht unerheblich ist auch die Suchmaschine, über die gesucht wird. Werden etwa automatisch Synonyme bereitgestellt? Wird Einzahl und Mehrzahl erkannt? Werden Keywords in einer Sprache automatisch übersetzt? Ist das unerwünscht oder gar Pflicht?
Keywordanforderungen
Die Anforderungen an Suchbegriffen sind für jede Firma unterschiedlich. Es gibt allgemeine Bildwelten und sehr spezifische Anforderungen. Wissenschaftliche Beschreibungen sind nur für bestimmte Benutzer bedeutsam, für andere jedoch irrelevant. Wie beschreibt man etwa Pflanzen und Tiere? Mit lateinischen Beschreibungen? In der jeweiligen Landessprache? Werden lokale Namen für Kräuter oder Blumen aufgeführt?
Was sachlich richtig ist, hilft nicht immer weiter. Eine Umfrage der CEPIC hat einmal ergeben, dass bei Stockfotografie die Bildeinkäufer häufig nur mit einem einfachen Begriff suchen. Damit sogar professionelle Benutzer gute Suchresultate erhalten, müssen nicht nur die Keywords sorgfältig definiert, sondern vielleicht auch die Anwender geschult werden.
Bei der Bildsuche sind Einschlusskriterien (Mann, Frau, Kind) manchmal ebenso wichtig wie Ausschlusskriterien (niemand). Bildeigenschaften (lowkey, highkey), Bildtyp (Foto, Illustration), Lizenztyp (Royalty-Free, Public Domain, Lizenzpflichtig), drinnen oder draussen, Jahreszeit, Tageszeit, und viele Dinge mehr können für eine effiziente Bildsuche sehr hilfreich sein.
Firmenintern
Keywording kann sehr allgemein sein. Werden Bildserien etwa für bestimmte Werbekampagnen genutzt, kann ein Stichwort zur Kampagne dabei helfen, alle Bilder dieser Kampagne zu finden. Firmen nutzen häufig interne Begriffe für bestimmte Abläufe oder Produkte. Diese Begriffe sollten als Suchbegriff hinzugefügt werden.
Fotos und Illustrationen neigen dazu, nach einigen Jahren weniger genutzt zu werden. Autos auf Strassenbildern erscheinen plötzlich alt, so auch der Haarstil, die Mode und viele andere Dinge. Bilder als «neu» zu beschreiben, ist bald veraltet und überholt. Ähnliches kann für die Kennzeichnung bestimmter Konzepte gelten. Begriffe wie «Pensionierung» oder «Wellness» lassen sich zwar bebildern, aber die Bildwelten können in 5 Jahren komplett anders aussehen. Solche Meta-begriffe sind wichtig, aber wie führt man sie auf?
Hier ist eine Möglichkeit, wie man mit konzeptuellen Begriffen umgeht: Manche Firmen kommen dazu, die Bilder nur mit Wörtern zu beschreiben, die man tatsächlich auf dem Bild sieht. Beispiel: Ein Bild von einem Senior wird nicht mit Pensionierung beschrieben, weil ältere Menschen nicht immer pensioniert sind und «Pensionierung» kein sichtbares, sondern nur ein angenommenes Merkmal darstellt. Das letzte beschreibt nicht das Bild, sondern lediglich die Gedanken der Person, die das Bild verschlagwortet.
Macht man diesen Unterschied zwischen «was sichtbar ist» und «was vielleicht auch noch zutrifft», kann man sich eine Zwischenebene vorstellen, in der reale Begriffe mit Konzepten zusammengebracht werden. Etwa so: In einer separaten Tabelle, die man für die Suche als «Zwischenebene» nutzt, lassen sich konzeptuelle Begriffe aufführen, die mit den konkreten Bildern über vorhandene Keywords verknüpft werden. In der Zwischenebene wird etwa «Grüne Energie» aufgeführt, mit den heute dafür zutreffenden Begriffen wie «Windpark, Mobilität, Sonnenenergie, Batterie» und so weiter. Wenn jetzt der Begriff «Grüne Energie» in einigen Jahren leicht umdefiniert wird, mit neuen Bildwelten, lassen sich in der Zwischenebene Begriffe ergänzen, ohne sämtliche Bilder neu verschlagworten zu müssen.
Hoch spezialisierte Bildkollektionen werden manchmal auf Basis von bestehenden Taxonomien verarbeitet. Ist dies der Fall, sollte man prüfen, wie man die Taxonomien in eigenen Softwarelösungen implementiert und wie man sie korrekt und konsistent anwendet.
Strategie entwickeln und planen
Eine Keywording-Strategie wird man nicht einmalig entwickeln, sondern öfter anpassen müssen. In der Planung hilft es deshalb, sich künftige Entwicklungen vorzustellen, sich den aktuellen und künftigen Technologien vorzustellen und dafür in der Planung Raum zu schaffen. Wie kann etwa künstliche Intelligenz bei der Bildbeschreibung helfen? Unterstützen unsere Server etwa Synonyme oder müssen wir diese manuell hinzufügen? Steht ein Serverwechsel an und ergeben sich dadurch neue Möglichkeiten? Was passiert bei einem Systemwechsel?
Wie man ein Bild beschreiben kann oder muss, ist von vielen Faktoren abhängig. Eine Planung berücksichtigt so viele Faktoren wie möglich und skizziert gleichzeitig, in welchen Abständen aktuelle Abläufe aktualisiert werden sollten.
Consulting
Hast Du bei diesen Ausführungen nützliche Hinweise entdeckt? Benötigst Du oder Deine Firma Hilfe bei der Evaluation neuer Keywording-Strategien? Dann helfe ich gerne. Nutze die Kontaktseite, mit mir in Kontakt zu kommen.



