Suchergebnisse, Social Media und Präsentationen

Microsoft lanciert neue Bildbeschriftungs-KI in Azure

Uhr

Microsoft hat ein neues KI-System für Bildbeschriftungen lanciert. Damit sollen automatische Beschriftungen etwa von Inhalten in Präsentationen präziser werden als mit bisherigen Programmen. Noch dieses Jahr wird das neue System in Word und Powerpoint integriert.

(Source: Arcyd / Fotolia.com)
(Source: Arcyd / Fotolia.com)

Microsoft-Forscher haben eine neues System entwickelt, das Inhalte von Bildern automatisch beschreiben soll. Es wird von einer künstlichen Intelligenz (KI) betrieben und ist gemäss Microsoft in vielen Fällen genauer als bisherige Bildbeschriftungssysteme. Das neue Modell stehe Kunden bereits über das Angebot von Azure Cognitive Services Computer Vision zur Verfügung. Noch dieses Jahr werde Microsoft das System in "Seeing AI", Microsoft Word, Outlook und Powerpoint integrieren.

Die automatische Bildbeschriftung helfe Nutzern, auf Inhalte von Bildern etwa aus Suchergebnissen, Social Media und Präsentationen zuzugreifen. Solche Funktionen seien besonders für Blinde und Menschen mit Sehschwäche von Bedeutung.

Microsofts Video zu ihrer neuen Bildbeschrifungs-KI. (Source: Youtube)

Die KI soll auch Objekte erkennen, die sie zuvor noch nie gesehen hat. Um das zu erreichen, trainierte ein Microsoft-Team die KI mit Bildern, die das Team mit Wort-Tags versah. Diese Tags wurden je einem bestimmten Objekt im Bild zugeordnet. Neu sei daran gewesen, dass das Team Wort-Tags anstelle von vollständigen Bildunterschriften verwendete. Das sei effizienter und habe dazu geführt, dass das Forschungsteam viel mehr Daten in das System einspeisen konnte. So habe Microsoft das Modell mit einem "visuellen Vokabular" ausgestattet. Nach diesem Vortraining lernte das Modell, Sätze zu verfassen.

Wie genau solche Modelle zur maschinellen Verarbeitung natürlicher Sprache funktionieren - und warum sogenannte Schreib-KIs nicht wirklich schreiben können, erklärte der 16-jährige Machine-Learning-Experte Tanmay Bakshi an der jüngsten Entwicklerkonferenz von WeAreDevelopers.

Webcode
DPF8_194473