Microsoft-Forscher bringen KI das Malen bei
Ein Team von Microsoft hat ein System entwickelt, das anhand von Beschreibungen Bilder malt. Es entwirft und beurteilt die virtuellen Kunstwerke so lange selbst, bis ein zufriedenstellendes Resultat vorliegt.

Forscher von Microsoft haben eine künstliche Intelligenz (KI) entwickelt, die aus Texteingaben Bilder fabriziert. Wie das US-Unternehmen auf seinem KI-Blog schreibt, hätten Xiaodong He und sein Team mit dem sogenannten "Generative Adversarial Network" einen Ansatz gewählt, bei dem ein Machine-Learning-System ein Bild anhand eines Textes erstellt. Anschliessend beurteile ein zweites Modul die Glaubwürdigkeit der Darstellung. Das erste System verfeinere den Entwurf dann so oft, bis das zweite mit dem Ergebnis einverstanden sei.
Virtueller Piepmatz
Damit das funktioniert, haben die Forscher das System nach eigenen Angaben mit Daten trainiert, die Kombinationen aus Wörtern und entsprechenden Bildern enthielten. So habe die KI schrittweise gelernt, anhand der Beschreibung "Ein Vogel mit gelbem Körper, schwarzen Flügeln und kurzem Schnabel" ein Bild zu erstellen.
So kommt die KI laut Microsoft vom Text zum Bild. (Source: blogs.microsoft.com)
Wenn ein Text nicht vorgebe, wo sich der Vogel befinde, füge das System ausserdem selbständig einen Ast hinzu. Es habe gelernt, dass Vögel meist auf Ästen sitzen, schreiben die Forscher. Dieses Ergänzen von Bildern aus eigener Erfahrung sei der Grund, weshalb das Microsoft-Team seiner KI eine "künstliche Vorstellungskraft" zuschreibt.
KI-Nonsens
Mit solchen realistischen Beschreibungen hätte das System auch realistische Bilder gemalt. Sinnfreie-Texte produzierten dagegen entsprechend bizarre Resultate, heisst es weiter. Der Satz: "Ein roter Doppeldecker-Bus, der auf einem See schwimmt" habe etwa eine Art Kreuzung aus Boot und Bus ergeben. Das System habe vermutlich Probleme gehabt, das Strassen-Gefährt "Bus" auf das eigentlich für Boote vorbehaltene Wasser zu setzen.
Obwohl die Bilder bei näherer Betrachtung noch viele Ungereimtheiten aufwiesen, erhoffen sich die Forscher von der Technologie einiges Potenzial. So sei etwa ein Einsatz bei der automatischen Erstellung von Entwurfszeichnungen oder Animationsfilmen denkbar.

Warum erfundene Programmbibliotheken die Softwarelieferkette bedrohen

KI in der Schweiz: sicher, souverän – und pragmatisch nutzbar

So geht Zeitsparen mit KI

KI-Integration in KMU: Mit lokaler Intelligenz zu mehr Prozesseffizienz

Zahl behördlicher Überwachungsmassnahmen in der Schweiz verdoppelt sich

KI-Trend im ITSM – ein Balance-Akt zwischen Effizienz und Datenschutz

Zukunftssichere Unternehmenskommunikation durch innovative KI

Krebsbekämpfung in der Cloud

MMTS und Media Solutions bringen Pro-AV zur Home & Professional
