Digitaler Künstler

Microsoft-Forscher bringen KI das Malen bei

Uhr

Ein Team von Microsoft hat ein System entwickelt, das anhand von Beschreibungen Bilder malt. Es entwirft und beurteilt die virtuellen Kunstwerke so lange selbst, bis ein zufriedenstellendes Resultat vorliegt.

(Source: bodobe/pixabay.com/CC0 Creative Commons)
(Source: bodobe/pixabay.com/CC0 Creative Commons)

Forscher von Microsoft haben eine künstliche Intelligenz (KI) entwickelt, die aus Texteingaben Bilder fabriziert. Wie das US-Unternehmen auf seinem KI-Blog schreibt, hätten Xiaodong He und sein Team mit dem sogenannten "Generative Adversarial Network" einen Ansatz gewählt, bei dem ein Machine-Learning-System ein Bild anhand eines Textes erstellt. Anschliessend beurteile ein zweites Modul die Glaubwürdigkeit der Darstellung. Das erste System verfeinere den Entwurf dann so oft, bis das zweite mit dem Ergebnis einverstanden sei.

Virtueller Piepmatz

Damit das funktioniert, haben die Forscher das System nach eigenen Angaben mit Daten trainiert, die Kombinationen aus Wörtern und entsprechenden Bildern enthielten. So habe die KI schrittweise gelernt, anhand der Beschreibung "Ein Vogel mit gelbem Körper, schwarzen Flügeln und kurzem Schnabel" ein Bild zu erstellen.

So kommt die KI laut Microsoft vom Text zum Bild. (Source: blogs.microsoft.com)

Wenn ein Text nicht vorgebe, wo sich der Vogel befinde, füge das System ausserdem selbständig einen Ast hinzu. Es habe gelernt, dass Vögel meist auf Ästen sitzen, schreiben die Forscher. Dieses Ergänzen von Bildern aus eigener Erfahrung sei der Grund, weshalb das Microsoft-Team seiner KI eine "künstliche Vorstellungskraft" zuschreibt.

KI-Nonsens

Mit solchen realistischen Beschreibungen hätte das System auch realistische Bilder gemalt. Sinnfreie-Texte produzierten dagegen entsprechend bizarre Resultate, heisst es weiter. Der Satz: "Ein roter Doppeldecker-Bus, der auf einem See schwimmt" habe etwa eine Art Kreuzung aus Boot und Bus ergeben. Das System habe vermutlich Probleme gehabt, das Strassen-Gefährt "Bus" auf das eigentlich für Boote vorbehaltene Wasser zu setzen.

Obwohl die Bilder bei näherer Betrachtung noch viele Ungereimtheiten aufwiesen, erhoffen sich die Forscher von der Technologie einiges Potenzial. So sei etwa ein Einsatz bei der automatischen Erstellung von Entwurfszeichnungen oder Animationsfilmen denkbar.

Webcode
DPF8_76787