Editorial

Tausend Worte

Uhr
René Jaun, Redaktor. (Source: Netzmedien)
René Jaun, Redaktor. (Source: Netzmedien)

"Dieses Bild zeigt eine sehr detaillierte Nahaufnahme der Erde aus dem Weltraum." Mit diesem Satz erfreute ein KI-Modell kürzlich ein Forschungsteam der EPFL. Der Satz war dem Team so wichtig, dass es ihn in einer Medienmitteilung prominent verewigte.

Eigentlich seltsam, dürften Sie nun denken; denn an und für sich ist der Satz nicht der Rede wert, selbst wenn ihn eine KI generiert hat.

Ich begegne derartigen Sätzen tagtäglich beim Surfen im Web. Die Bilder, die ich wegen meiner Blindheit nicht sehen kann, ersetzt mein Screenreader durch die sogenannten ­Alternativtexte – zumindest dann, wenn die Entwickler, Designer und Redaktoren der jeweiligen Website solche Texte hinterlegt haben. Der Inhalt der Alternativtexte ist frei wählbar. Er hängt meiner Erfahrung nach davon ab, wie sehr der Websitebetreuer für Accessibility sensibilisiert ist, wie viel Zeit er investiert und welche KI-Ressourcen er zur Hand hat. Oft genug lese ich Alt-Texte wie "Bild" oder "xyz". Zu häufig treffe ich auf den äusserst frustrierenden Alt-Text "Dieses Bild enthält Text" – der eigentliche Text selbst fehlt dagegen.

Dagegen ist der eingangs zitierte Satz natürlich geradezu wohltuend. Dennoch komme ich ins Stutzen, lasse ich ihn mir auf der Zunge zergehen: Was genau meint die KI mit der "sehr detaillierten Nahaufnahme der Erde"? Was ist denn nun konkret zu sehen? Je nachdem, in welchem Kontext ich diese Frage stelle, könnten mich andere Details interessieren: Welche Städte sind zu erkennen? Erfahre ich etwas über die Wetter­lage? Welche Farben dominieren auf dem Foto?

Das Besondere an Bildern ist, dass sie eine Vielzahl von Fragen aus einer Vielzahl von Blickwinkeln gleichzeitig zu beantworten vermögen. Sie sagen eben in der Tat mehr als tausend Worte. Ein Alternativtext allein wird diese Fülle an Informationen nie in befriedigendem Masse geben können. Der Verfasser des Alt-Textes sollte sich aber immerhin bemühen, die im Kontext der Website relevanten Informationen zu hinterlegen. Und vielleicht haben wir eines Tages interaktive, KI-getriebene Alt-Texte, die wir nach eigenem Gusto und je nach Kontext weiter befragen können.

Apropos Kontext: Dass das eingangs erwähnte EPFL-Team einen KI-generierten Satz per Medienmitteilung verbreitete, hat nichts mit dem eigentlichen Inhalt des Satzes zu tun, sondern mit dessen Entstehung. Das dafür genutzte KI-Modell lief nämlich nicht in einem gewöhnlichen Rechenzentrum, sondern auf einem Server in einem Satelliten, weit über der Erdoberfläche. Die ganze Geschichte lesen Sie hier.

Webcode
2sSJWpEB