Jurypräsident Stefano Mallè im Interview

Worauf es in der Sonderkategorie "Conversational UI" ankommt

Uhr | Aktualisiert

Sprachassistenten und Chatbots erfreuen sich wachsender Beliebtheit. Wo der Einsatz Sinn ergibt und welche Herausforderungen die Entwicklung der smarten Helfer mit sich bringt, erklärt Stefano Mallè, Head of Technology bei Amazon Web Services (AWS) Switzerland und Jurypräsident der Kategorie "Conversational UI" bei Best of Swiss Apps.

Stefano Mallè, Head of Technology bei AWS Schweiz und Jurypräsident für die Kategorie "Conversational UI" bei Best of Swiss Apps. (Source: zVg)
Stefano Mallè, Head of Technology bei AWS Schweiz und Jurypräsident für die Kategorie "Conversational UI" bei Best of Swiss Apps. (Source: zVg)

Was erhoffen Sie sich, beziehungsweise AWS, vom Engagement in der neuen Kategorie "Conversational UI" von Best of Swiss Apps?

Stefano Mallè: Sprachassistenten bieten Endnutzern nützliche Funktionen für den Alltag. Sie eröffnen Unternehmen neue Möglichkeiten, ihre Kunden zu erreichen. Und sie bieten Entwicklern von Skills eine weitere Einkommensquelle. Ausser Sprachassistenten deckt die neue Kategorie auch Lösungen ab, die textbasierte Dialoge anbieten. Diese werden häufig in Unternehmen verwendet, um wiederkehrende Anfragen zu beantworten. Mit der neuen Kategorie "Conversational UI" möchten wir die Visibilität von Sprach-Bots und Text-to-Speech-Technologien erhöhen und Interesse für Sprachassistenten und Bots wecken. Bei Amazon Web Services bieten wir schon seit vielen Jahren mit Amazon Lex und Amazon Polly cloudbasierte Dienste für diese Bereiche an. Mit Amazon Lex stehen Entwicklern dieselben Deep-Learning-Technologien zur Verfügung, die auch den Kern von Amazon Alexa bilden. Dabei handelt es sich um einen Service zur Erstellung von Konversationsschnittstellen für Sprache und Text oder Sprach-Bots (Chatbots). Das Ziel ist, ein äusserst gutes Benutzererlebnis sowie realistische Gesprächsinteraktionen anbieten zu können. Mit Amazon Polly kann Text in sprachgesteuerte Anwendungen umgewandelt werden mit dutzenden lebensechten Stimmen in einer Vielzahl von Sprachen.

Welche Eigenschaften erhoffen Sie sich von Apps, die sich um den Preis bewerben?

Abgesehen von Funktionalität, Innovation und User Engagement hat die Jury grossen Wert auf sprachspezifische Aspekte gelegt, wie die Natürlichkeit der Interaktion und überzeugende Use Cases für eine dialogbasierte Schnittstelle. Wir reden hier von Technologien, die erst dann erfolgreich sind, wenn wir nicht mehr merken, dass wir mit einer künstlichen Intelligenz interagieren.

Inwiefern konnten die eingegebenen Projekte diese ­Anforderungen erfüllen?

Es ist toll, zu sehen, dass Projekte eingereicht wurden, die wegweisend für diese neue Kategorie sind und exzellente Voice Use Cases darstellen, da sie auf natürlichen Dia­logen basieren, in einem Fall sogar auf Mundart. Wie beispielsweise die Möglichkeit, eine Restaurantreservierung per Voice zu tätigen, indem man den Sprachassistenten bittet: "Könntest du mir bitte zwei Plätze in einem top japanischen Restaurant in Zürich am Samstag um 20:00 Uhr reservieren". Wir alle wissen, wie mühselig es manchmal mit den heutigen webbasierten Alternativen in solchen Fällen sein kann.

Welche Anwendungsgebiete sehen Sie für Conversational UIs?

Der grösste Vorteil von Sprachassistenten ist die handfreie, natürliche sprachliche Interaktion mit der Maschine. Gemäss einer Studie der Stanford University ist die Sprachsteuerung drei Mal schneller als die Eingabe über eine Telefontastatur. Sie erlaubt den spontanen Zugriff auf Informationen und Dienste. Smart Speaker und Home Automation werden zunehmend beliebter. Auch bei uns zuhause im Wohnzimmer, wo eigentlich eine "No Device Zone" herrscht, ist Alexa immer zur Stelle, um eine Schulfrage zu beantworten, ein Rezept vorzuschlagen, die Lichter zu dimmen oder Milch auf unsere Einkaufsliste zu setzen. Textbasierte Dialogsysteme hingegen helfen hauptsächlich bei der Automatisierung von Kundenanfragen, wie etwa in Callcentern. Sie können die allgemeinen Arbeitstätigkeiten optimieren und die betriebliche Effizienz steigern.

Apples Siri machte 2011 den Sprachassistenten zur Commodity. Was hat sich in den vergangenen zehn Jahren verändert?

Es gab bedeutende technologische Fortschritte, die zu einer verbesserten Spracherkennung und -verarbeitung geführt haben. Zudem gab es eine grössere Verbreitung von Geräten mit Sprachassistentenfunktion und in diesem Zusammenhang ging ein rasantes Wachstum von Skills einher, das wiederum neue Benutzererlebnisse erlaubt. Alexa zum Beispiel bietet heute mehr als hunderttausend Skills und Kunden haben bereits milliardenfach mit Skills von Drittanbietern interagiert.

Rund die Hälfte der Schweizer Bevölkerung nutzt mittlerweile Sprachfunktionen oder -assistenten. Früher vornehmlich auf dem Smartphone oder im Auto, heute eher am TV oder auf dem Smart Speaker. Wie erklären Sie sich den Wandel?

Laut der Website voicebot.ai entstehen die höheren Nutzungsraten von Sprachassistenten durch die Zunahme von Smarthomes und Smart-Speaker-Geräten. Es scheint, dass wir Sprachsteuerung gerne dann nutzen, wenn wir uns in einer ruhigen Umgebung befinden. Dann kommen die Smart Speaker in unseren Wohnzimmern optimal zum Einsatz und vielleicht mittlerweile auch in unseren Homeoffices. Ich glaube aber, dass wir uns mit der zunehmenden Vielfalt an sprachgesteuerten Interaktionen in jeder Lebenssituation, vom (virtuellen) Schalter bis zum Arbeitswerkzeug, immer stärker an Sprachassistenten gewöhnen werden.

Unternehmen setzen immer häufiger Chatbots ein. Worin liegt der Nutzen für Unternehmen beim Einsatz dieser Technologie?

Chatbots etwa erlauben es, wiederkehrende Anfragen zu automatisieren, beispielsweise im IT-Support. Gut trainierte Chatbots können bis zu 80 Prozent der Abfragen abwickeln, bevor sie zu einem Operator delegiert werden müssen. Sie bringen daher viele Vorteile für Unternehmen: Sie haben Zugriff auf die gesamte Wissensdatenbank und können die richtige Antwort schnell liefern. Zudem skalieren sie sehr schnell und kostengünstig, sie lernen stetig dazu und können somit zunehmend mehr Fragen beantworten. Ausserdem arbeiten sie rund um die Uhr an 365 Tagen im Jahr und verlassen nie das Unternehmen. Darüber hinaus lassen sich in den meisten Fällen auch mehrere Sprachen günstig implementieren. Die Einsparungen durch den Einsatz von Chatbots können Unternehmen wiederum investieren und somit den Kundendienst noch besser machen.

Wo liegt der Nutzen für die Kunden?

Mit der richtigen Infrastruktur und Implementierung können Chatbots sofort und jederzeit antworten, ohne Wartezeiten, und sie liefern konsistente, qualitativ hochwertige Antworten. Chatbots haben ausserdem nie einen schlechten Tag und treffen deshalb immer den richtigen Ton in der Interaktion mit dem Kunden.

Stand heute sind Chatbots für Nutzende oft ein enttäuschendes oder gar frustrierendes Erlebnis. Was muss passieren, damit sich das ändert?

In vielen Fällen ist die Interaktion zu mechanisch und entspricht nicht der erwarteten natürlichen Konversation. Statt workflowähnliche Dialoge mit Multiple-Choice-Antworten zu führen, sollte der Benutzer natürliche Sprache anwenden können, die wiederum mithilfe von Natural Language Processing interpretiert wird. Zusätzlich sollten Chatbots ständig trainiert werden, um immer mehr Fragen interpretieren und beantworten zu können. Dazu braucht es sowohl KI- als auch Linguistikspezialisten.

Welches sind Ihrer Ansicht nach die grössten Stolpersteine in der Umsetzung solcher Projekte?

Weil die Technologie dank der Cloud allen zugänglich ist, unterschätzen viele Unternehmen, dass auch Fachexpertise benötigt wird, wie zum Beispiel im Bereich Linguistik. Mein Tipp ist daher, zusammen mit Experten zu starten. Das spart mittelfristig viel Ärger und Geld.

Wie steht es in der Schweiz um das Ökosystem für Chatbots, Voice Apps und virtuelle Assistenten?

Die Schweiz hat schon eine hohe Penetration von Sprachassistenten, aber die Schweizer benutzen bis heute deutlich weniger Smart Speaker als Nutzerinnen und Nutzer in anderen Ländern. Deshalb ist jetzt die richtige Zeit, lokale Skills in der Schweiz zu entwickeln. Sie lassen sich einfach programmieren, machen Spass und sind sehr nützlich im Alltag. Zudem bieten sie Unternehmen und Entwicklern neue Geschäftsmöglichkeiten.

Webcode
DPF8_235721