SPONSORED-POST Automatisierung

Hausmittel Mensch

Uhr
von Dr. Andreas Becks, Head of Business Analytics, SAS DACH

Machine Learning und künstliche Intelligenz (KI) sind und bleiben auch 2018 absolute Hype-Themen und versprechen den nächsten Schritt der intelligenten Automatisierung. Ein Irrglaube ist jedoch, dass mit der Technologie alles von selbst geht.

Ob prädiktive Wartung in der Fertigungsindustrie, automatisierte Beratung in der Finanzwelt oder das Einkaufserlebnis im Supermarkt der Zukunft: Maschinelles Lernen gilt als Schlüssel für moderne analytische Anwendungen. Unter Datenwissenschaftlern tobt der Wettbewerb um die modernsten Lernverfahren, die das Beste aus den Daten holen sollen.

Machine Learning ist jedoch kein Wundermittel. Oft herrscht die Vorstellung: Man muss seine Daten nur an eine Maschine geben und "dann kommt schon irgendwas hinten raus". So einfach funktioniert es nicht. Im Wesent­lichen steckt klassische Analytics-Technologie dahinter, die Muster lernt und diese anwenden kann. Solche analytischen Modelle werden anhand von Beispieldaten trainiert.

Anders ausgedrückt: Ein System lernt aus Beispielen und kann diese nach Abschluss der Lernphase verallgemeinern. So kann das System auch unbekannte Daten beurteilen. Es erfolgt demnach ein Lerntransfer.

Ohne Menschen geht es nicht

Machine Learning hilft somit, gute Modelle zu entwickeln. Entscheidend ist aber, dass und wie diese zum produktiven Einsatz kommen. Selbstlernend heisst selbstverständlich nicht, dass es für den Menschen nichts mehr zu tun gibt. Der Data Scientist muss immer noch Daten richtig aufbereiten, algorithmische Parameter optimieren, verschiedene Verfahren miteinander vergleichen, gegebenenfalls kombinieren und am Schluss eines präsentieren, das valide Vorhersagen ermöglicht.

Paradise Found – ausgerechnet ins Paradies

Was die Technologie leisten kann, hat SAS anschaulich an einem B2C-Projekt gezeigt. Es galt, mit Machine Learning und Analytics den besten Ort der Welt zu finden. Und der Gewinner ist: West Perth! Zumindest analytisch gesehen ist der Stadtteil der Boomtown im Westen Aus­traliens der beste Ort zum Leben weltweit.

Das haben nicht Befragungen oder ein festgelegter Fragenkatalog ergeben, sondern allein die Daten. SAS hat für das Projekt "Paradise Found" nicht weniger als 148'233 Orte in 193 Ländern betrachtet.

Und das ohne vorgefertigte Fragestellung oder Hypothese. Stattdessen hat man die Daten sprechen lassen. "Zu Wort" kamen mehr als fünf Millionen Datenpunkte aus 1124 Datenquellen, und zwar strukturierte ebenso wie unstrukturierte Daten (etwa in Form von Texten statistischer Dienste). Summa summarum flossen 1060 internationale Datenservices, 3 Online-Geodaten-Services, 4 Social-Media-Dienste und 57 City-Studien in die Erhebung ein. Mit Data Wrangling und performanter Data-Management-Software von SAS wurden die Daten gereinigt, strukturiert und aufbereitet.

Nächster Schritt: Mit Machine Learning der leistungsstarken, flexiblen und offenen Analytics-Plattform SAS Viya wurden die fehlenden Werte zu den einzelnen Orten ermittelt und ersetzt und ein Prognosemodell entwickelt, das die Bewertung von Orten als lebenswert vorhersagt. Acht Cluster von Merkmalen, die einen Ort attraktiv zum Leben machen, haben sich dabei he­rauskristallisiert: Bildung und Karriere, Familie, Kultur, Natur, Sicherheit und Infrastruktur, Lebenshaltungskosten, Restaurants und Shopping sowie Gesundheit. Zum Einsatz kamen für die Auswertung und visuelle Aufbereitung unter anderem SAS Visual Data Mining and Machine Learning und SAS Visual Analytics.

Fazit

Das Projekt zeigt nicht zuletzt auch: Machine Learning ist keine Hexerei, passiert aber auch nicht von selbst durch eine magische, selbstlernende Maschine. Es handelt sich dabei um eine Menge an Algorithmen, die aus den Daten lernt, anstatt von einer Modellannahme auszugehen. Das funktioniert aber nur, wenn Visualisierung, Datenmanagement und Analytik optimal zusammenspielen.

Und es macht die Vielfalt der potenziellen Anwendungsfälle für Machine Learning und Analytics deutlich. Egal, ob es um den besten Ort, den besten Kunden, das Identifizieren potenziell betrügerischer Finanztransaktionen oder Optimierungsmöglichkeiten bei Produktionsprozessen geht: Machine Learning kennt keine Branchen- und Fachbereichsgrenzen. In dieser Hinsicht ist der Hype absolut gerechtfertigt.

Wo ist der "beste Ort der Welt" für mich persönlich? Die Antwort auf diese Frage kann jetzt jeder ganz individuell beantworten lassen: mit dem Paradies-Konfigurator.

Webcode
DPF8_70854