Grosse Datenmengen, grosses Risiko?

Wenn Big Data zum Zaubertrank wird

Uhr | Aktualisiert
von Simon Zaugg

Datenberge anzuhäufen und auszuwerten, ist verlockend. Doch zu Beginn eines Big-Data-Projekts ist häufig nicht klar, was am Ende herauskommt. Dennoch raten Pioniere den knallhart kalkulierenden Managern zu mehr Mut zum Risiko.

Mit Big Data ist es fast ein wenig wie mit dem Zaubertrank in der Comic-Serie Asterix: Beide versprechen ihren Konsumenten, zu nahezu magischen Kräften zu kommen. Während das Gebräu des Druiden Miraculix dem Titelhelden und den übrigen Bewohnern des gallischen Dorfes im Kampf gegen die übermächtige römische Armee übermenschliche Kräfte verleiht, soll Big Data den Entscheidern in Unternehmen die Augen für bisher ungeahnte Geschäftsmöglichkeiten öffnen. Die Auswertung der Datenberge wird die Unternehmen in einen regelrechten Goldrausch versetzen, so das Versprechen. Ausserdem sind die "Rezepte" bei Zaubertrank und Big-Data-Techniken nur einem erlauchten Kreis bekannt – ersterer dem Druiden Miraculix, letzterer den eingeweihten Analytics-Profis.

Georg Polzer, Mitgründer des ETH-Spin-offs Teralytics, ist so einer. Er empfiehlt den Unternehmen: Heute speichern, morgen analysieren – auch Daten, für die es noch keine adäquaten Auswertungswerkzeuge gibt. Denn für Polzer besteht kein Zweifel, dass entsprechende Lösungen kommen werden. Glaubt man jedoch der IT-Trend-Studie 2013 von Capgemini, dann nehmen die CIOs den Big-Data-Pionieren das Versprechen noch nicht so richtig ab: Nur 29,2 Prozent der befragten IT-Manager aus der Schweiz, Deutschland und Österreich wollen 2013 Big-Data-Projekte aufsetzen. Damit landet das Thema im hinteren Mittelfeld. Dagegen wollen die CIOs ihre Anstrengungen bei Master Data und Data Quality Management verdoppeln. Sie setzten somit lieber auf die bewährte Auswertung strukturierter Daten, schlussfolgern die Studienautoren.

Ergebnisse innerhalb weniger Wochen

ETH-Professor Donald Kossmann sieht in Big-Data-Projekten dagegen viele Vorzüge: "Im Vergleich zu einem konventionellen Data Warehouse ist ein Big-Data-Projekt einfacher zu stemmen", sagte er anlässlich eines Roundtables mit Polzer von Teralytics und Marco Kündig von Cisco. Ein Data Warehouse baue man mit der Perspektive auf, dass es über viele Jahre hinweg einen Mehrwert bieten müsse. "Bei einem Big-Data-Projekt hat man innerhalb weniger Wochen Ergebnisse. Da ist man sehr flexibel. Die Investitionen halten sich dabei im Rahmen." Das gelte heute auch für die Hardware, wie Kündig anfügt. Je mehr Rechenleistung zur Verfügung stehe, desto komplexere Berechnungen seien möglich, womit umso mehr Businessvorteile herauszuholen seien.

Zentrales Thema des Roundtables war ein konkretes Pilotprojekt von Teralytics, der ETH und Cisco für einen der weltweit grössten Flugbuchungsdienstleister (Anmerkung der Redaktion: Der Name des Unternehmens ist der Redaktion bekannt. Die ETH hat uns jedoch nachträglich untersagt, ihn zu nennen.) Das Unternehmen beschloss vor rund fünf Jahren, alle verfügbaren Daten aus Preisberechnungen zu sammeln und aufzubewahren. Daraus entstand ein rund 10 Terabyte schwerer Datensatz. Beim Dienstleister werden täglich rund 600 Millionen Datensätze mit mehreren 100 Variablen neu berechnet. Darunter etwa Abflugort, Zielort, Tag, Zeit, Klasse und Status des Passagiers.

Das Ziel des Datenprojekts war es, die Zahl der Neuberechnungen zu reduzieren, um Rechenaufwand und Kosten zu sparen. Dazu lieferte der Dienstleister die Datensätze an die Forscher. Drei Monate analysierten sie diese mittels Machine-Learning-Algorithmen auf Hadoop. Cisco stellte dazu die Hardware, eine mobile UCS-Serverplattform, als Leihgabe zur Verfügung. "Die Hardware hat permanent geglüht. Da ging es richtig zur Sache", schildert Kossmann rückblickend.

Und wieder das Kostenargument

Das Projekt sei nun abgeschlossen und die Erkenntnisse würden jetzt beim Flugbuchungsdienstleister genutzt, führt er weiter aus. Über konkrete Resultate des Forschungsprojekts hüllt er sich indes in Schweigen. Sie waren aber offenbar derart befriedigend, dass man nun Lust auf mehr bekommen hat. "Es wird ein Folgeprojekt geben", sagt Kossmann. Die Gespräche dazu seien im Gang.

Etwas mehr Details sind über ein Projekt bekannt, das in einem Artikel der Oktoberausgabe des "Harvard Business Review" besprochen wurde: 2001 entschied sich eine der grossen amerikanischen Fluggesellschaften dafür, die Schätzung der Ankunftszeit nicht mehr gänzlich den Piloten zu überlassen, sondern gezielt Daten zu sammeln und auszuwerten. Kommt ein Flugzeug früher oder später als erwartet an, betrifft das sowohl die Passagiere wie auch das Personal. Laut einer internen Untersuchung hatten 10 Prozent der Flüge eine Verspätung von bis zu 10 Minuten, 30 Prozent der Flüge landeten bis zu 5 Minuten später. Diese Rate wollte man genauer voraussagen können.

Datengetrieben gleich erfolgreich?

Dafür wandte sie sich an Passur Aerospace, einen auf die Flugbranche spezialisierten Business-Intelligence-Anbieter. Dieser berechnete dann aus verschiedenen Datenquellen deutlich genauere Ankunftszeiten. Dazu gehörten öffentlich verfügbare Meteodaten, Flugpläne sowie Daten von passiven Radarstationen in der Nähe der Flughäfen (letztere senden im Gegensatz zum herkömmlichen Radar keine elektromagnetische Energie aktiv aus, die Red.) Eine Fluggesellschaft könne dadurch pro Jahr und Flughafen durch einen gezielteren Einsatz von Personal und Material "mehrere Millionen" Dollar sparen, behauptet Passur.

Beispiele wie dieses zeigen laut dem Artikel, dass es sich lohnt, ein "datengetriebenes" Unternehmen zu werden. Die Annahme: Es werden sich jene Unternehmen durchsetzen, die die besten Informationen zur richtigen Zeit, am richtigen Ort und möglichst in komplettem Umfang zur Verfügung haben. Diesen Fakt hat eine im Artikel zitierte Studie bereits bestätigt, in der 330 Geschäftsleitungsmitglieder nordamerikanischer Unternehmen befragt wurden. Die bezüglich der Datennutzung im ersten Drittel klassierten Unternehmen waren im Durchschnitt 5 Prozent produktiver und 6 Prozent profitabler.

Noch wenig qualifiziertes Personal

Wer den Weg hin zu einem datengetriebenen Unternehmen einschlagen will, dem raten die Autoren des Artikels in der "Harvard Business Review", Andres McAfee und Erik Brynjolfsson, sich erst einmal folgende Fragen zu stellen: Was sagen die Daten, die man auswerten will, genau aus? Woher stammen sie? Mit welchen Methoden wurden sie erhoben? Wie zuverlässig sind die Resultate? Zudem listen sie die wichtigsten Herausforderungen für das Management auf: Nebst ganz grundsätzlichen Managementqualitäten werde das Talentmanagement wichtiger. Es geht also darum, für die raren Data Scientists ein attraktiver Arbeitgeber zu sein.

Der Mangel an qualifiziertem Fachpersonal, so sagt auch Polzer, sei definitiv ein limitierender Faktor. "Das macht es vor allem für kleinere Unternehmen schwierig." Er ist insgesamt jedoch überzeugt, dass die Big-Data-Welle bald stärker nach Europa überschwappen wird. Vorerst würden vor allem grosse Unternehmen Big-Data-Projekte umsetzen, die bereits grosse Mengen von Kundendaten gesammelt hätten.

Zu guter Letzt – so eine Schlussfolgerung von Brynjolfsson und McAfee – gehe es um eine ganz grundsätzliche Frage der Unternehmenskultur: Anstatt zu fragen "Was denken wir?", solle man fragen: "Was wissen wir?" Bevor dieses Denken vermehrt in die Managementetagen Einzug halten wird, haben die Big-Data-Pioniere indes noch einige Aufklärungsarbeit zu leisten. Nur selten plumpst ein Entscheidungsträger – wie seinerzeit Obelix in den Zaubertrank – in ein Big-Data-Projekt. Und obwohl es verlockend ist, vom Zaubertrank zu kosten, wüssten die bevorzugt nach harten Zahlen und rationalen Kriterien entscheidenden Manager doch gerne noch mehr über Zutaten und Mixturen Bescheid.

 

Flugpreisberechnung

Das Geschäftsfeld der Flugpreisberechnung wird im Economist-Artikel The ineluctable middleman beschrieben.  Amadeus ist derzeit der grösste Player in diesem Markt. Weitere Dienstleister sind Sabre und Travelport. Letzterem gehören die Preisberechnungssysteme Galileo und Worldspan. Weitere Informationen zum Thema gibt es in diesem Wikipedia-Artikel.