Data Literacy: Daten wirksam nutzen - Teil 3

Gute Daten als Kompass nutzen

Uhr
von Georges-Simon Ulrich, Direktor des Bundesamtes für Statistik (BFS)

Daten entfalten ihre volle Wirkung erst im konkreten Einsatz. Wenn wir sie clever nutzen, schaffen sie echten Mehrwert für Politik, Wirtschaft, Forschung und Gesellschaft. Indem sie uns die Orientierung erleichtern, schärfen sie unsere Entscheidungen und treiben Innovationen voran.

Gute Daten allein genügen nicht. Ihr Potenzial entfalten sie erst durch ihre verantwortungsvolle Nutzung, etwa für bessere Entscheidungen, gezieltere Politik und neue Erkenntnisse in Forschung und Gesellschaft. Sind Daten einmal erhoben, aufbereitet und zugänglich (wie in den Netzwoche-Ausgaben 13/25 und 2/26 gezeigt), ist zwar ein wichtiger Teil der Arbeit getan. Der eigentliche Mehrwert entsteht jedoch erst im nächsten Schritt, wenn Daten in Analysen einfliessen, Entscheidungen unterstützen oder als Grundlage für neue Anwendungen dienen. Dann werden sie in vielen Bereichen des Lebens zu unserem Kompass.

Bessere Entscheide dank kluger Datennutzung

Die öffentliche Statistik spielt in diesem Kontext eine zentrale Rolle. Sie hat den Auftrag, verlässliche und nutzergerechte Informationen über zentrale Lebensbereiche bereitzustellen. Diese Informationen bilden eine wesentliche Grundlage für Planung, politische Entscheidungsfindung und gesellschaftliche Orientierung. Dank technologischer Fortschritte werden statistische Systeme immer leistungsfähiger, agiler und bedarfsorientierter. Sie reagieren schneller auf neue Fragestellungen und liefern insbesondere in Krisen zeitnah relevante Informationen. 

Die Erfahrungen während der Covid-19-Pandemie haben gezeigt, wie entscheidend solche Fähigkeiten sind: Schon ab April 2020, kurz nach dem Ausbruch, wurde das nationale Mortalitätsmonitoring ("Momo") regional erweitert. Das statistische Modell zeigte seither laufend die Übersterblichkeit in der Schweiz und in den Kantonen. Das BFS nutzte dafür Daten aus dem Zivilstandsregister, betrieb also Mehrfachnutzung. So bot es Forschenden, Behörden und der Öffentlichkeit eine zeitnahe Orientierung.
Des Weiteren bilden Stammdatenregister in vielen Bereichen eine zentrale Grundlage für die effiziente Mehrfachnutzung von Daten. Sie stellen verlässliche, eindeutig zuordenbare und mehrfach nutzbare Datengrundlagen bereit, etwa über Personen oder Unternehmen. 

Verknüpfen und mehrfach nutzen

Durch das Verknüpfen von Daten aus unterschiedlichen Quellen lassen sich Zusammenhänge erkennen, die bisher verborgen blieben. So können etwa Gesundheitsdaten mit Umwelt- oder Mobilitätsdaten kombiniert werden, um Einflüsse auf Krankheitsverläufe besser zu verstehen. Ein Beispiel: Um Krebsursachen zu untersuchen, reicht es nicht, nur die Daten von Erkrankten zu berücksichtigen. Es braucht repräsentative Daten auch von gesunden Menschen. Das BFS verfügt hierfür über Basisdaten, etwa zu Bevölkerung, Erwerbstätigkeit und Einkommen. Solche Daten lassen sich sekundär nutzen – natürlich anonymisiert und geschützt. Sekundärnutzung bedeutet, dass wir die Daten nicht nur zu dem Zweck verwenden, für den sie ursprünglich erhoben wurden. Durch anonymisierte Sekundärnutzung lassen sich diese Daten kombinieren, neue Erkenntnisse gewinnen und Politik sowie Bevölkerung fundiert informieren.

Neue Erkenntnisse durch Datenwissenschaft und KI

Ein weiterer Hebel für die Wertschöpfung liegt im Einsatz von Datenwissenschaft und künstlicher Intelligenz. Das Kompetenzzentrum für Datenwissenschaft des Bundes (DSCC) unterstützt die Verwaltung dabei, neue Methoden gezielt einzusetzen und weiterzuentwickeln. 

Ein Beispiel für die Anwendung solcher Methoden ist das Projekt "Machine Learning Soziale Sicherheit", kurz ML_SoSi: Das BFS hat einen anonymisierten, verknüpften Datensatz auf neue Weise analysiert, um die Auswirkung von Arbeitslosigkeit in der Schweiz besser zu verstehen. Denn die Statistik hatte bis vor einigen Jahren ein Problem: Sie konnte zwar aufzeigen, wie viele Arbeitslose es gibt und wie viele Arbeitslose wieder eine Stelle gefunden haben. In den alten Daten lassen sich aber, wenn man sie geschickt verknüpft, auch typische Muster erkennen: Wie oft erhalten Arbeitslose später im Leben Sozialhilfe? Wie oft ziehen sich Arbeitslose ganz aus dem Berufsleben zurück? Wie viele wandern aus der Schweiz aus? Diese Daten existierten, aber sie konnten so erst jetzt ausgewertet werden. 

Was die künstliche Intelligenz betrifft, so ist es wichtig, diese nicht nur als Arbeitsmittel, sondern auch als Kundin für die Datenarbeit zu begreifen und zu behandeln. Denn viele datengetriebene Anwendungen greifen heute auf die richtigen Daten zu, wenn man ihnen dies erleichtert. Dazu gehört, Daten nicht nur in hoher Qualität und Konsistenz bereitzustellen, sondern sie auch strukturell und semantisch so aufzubereiten, dass sie von KI-Systemen effizient verarbeitet werden können. Dies verlangt standardisierte Formate, klar definierte Metadaten sowie eine durchgängige Dokumentation der Datenerhebung und -verarbeitung. 

Innovation dank Datenschutz und Zusammenarbeit

Da Wertschöpfung aus Daten kein rein technisches Thema ist, lebt sie von der engen Zusammenarbeit der beteiligten Akteure. Nur eines von vielen möglichen Beispielen: Schon heute gibt das BFS Forschenden pro Jahr über 700 Mal Zugang zu Einzeldaten, jeweils mit Datenschutzvertrag, und verknüpft rund 100 Mal jährlich gezielt Daten für aussagekräftige Analysen. So können etwa die an einer Gruppe von Menschen gemachten Beobachtungen von Forschenden gezielt mit Bevölkerungsdaten verknüpft werden, um die Repräsentativität der Forschungsergebnisse besser einzuschätzen.

In den nächsten Monaten und Jahren will das BFS seine Zusammenarbeit mit der Forschung und vielen weiteren Nutzenden auf ein neues Level heben. Ein aktuelles Beispiel von grosser schweizweiter Bedeutung ist Digisanté, das gemeinsame Programm des BAG und des BFS zur Förderung der digitalen Transformation im Gesundheitswesen.  Dazu gehört das Projekt Spiges, das die Mehrfachnutzung von wichtigen Daten im spitalstationären Bereich umsetzt. Im Rahmen von Digisanté läuft auch der Aufbau eines Microdata-Centers für die Nutzung und Verknüpfung interner sowie externer Mikrodaten in einer sicheren Umgebung. Als Kernstück des Microdata-Centers baut das BFS aktuell einen Analytics-Workspace auf. Dabei handelt es sich um eine virtuelle Umgebung mit gängigen Tools zur Datenanalyse, in der das BFS pseudonymisierte Daten bereitstellt. Wenn mehrere Datensätze verknüpft werden sollen, erstellen die Forschenden diese Verknüpfungen selbst direkt im Workspace. Sämtliche Analysen werden innerhalb dieser Umgebung durchgeführt, und auch die Resultate werden dort gespeichert. Erst nach Abschluss der Forschungsarbeiten werden ausschliesslich die Ergebnisse heruntergeladen. Für jedes Projekt wird ein separater Workspace eingerichtet, der nach Projektende wieder gelöscht wird. 

Daneben kommt bei Digisanté erstmals die Plattform "LOMAS" zum Einsatz. "LOMAS" ermöglicht es autorisierten Nutzenden, Daten remote auszuwerten, ohne direkten Zugriff auf die zugrunde liegenden Datensätze zu erhalten. Man spricht dabei auch vom Eyes-off-Ansatz, weil Nutzende keinen Einblick in die Rohdaten erhalten. Stattdessen werden Algorithmen zur Plattform geschickt und dort ausgeführt. Die Resultate werden so aufbereitet, dass keine Rückschlüsse auf einzelne Personen möglich sind. Dies gelingt unter anderem durch den Einsatz von Methoden wie der sogenannten Differential Privacy, bei der gezielt "statistisches Rauschen" hinzugefügt wird. 

Alles basiert auf Vertrauen

Klar ist: Datenanbieter wie das BFS arbeiten in einem sensiblen Bereich. Natürlich müssen sie stets sicherstellen, dass Datenschutzaspekte gewährleistet bleiben. Der Schutz der Privatsphäre hat oberste Priorität. Eine verantwortungsvolle Nutzung setzt deshalb klare Regeln, transparente Verfahren und technische Schutzmechanismen voraus. Sind diese Voraussetzungen erfüllt, ist dem Erkenntnisgewinn kaum mehr eine Grenze gesetzt, denn viele der im öffentlichen Sektor erhobenen Daten könnten auch für Forschungs-, Planungs- oder Innovationszwecke genutzt werden.

Letztlich basiert das alles auch auf einer grundsätz­lichen gesellschaftlichen Entscheidung: Sollen Daten bewusst genutzt werden, um Fortschritt zu ermöglichen? Diese Entscheidung fällt nur dann positiv aus, wenn sie von Vertrauen getragen ist: Vertrauen in die Qualität der Daten, Vertrauen in die Institutionen, die sie bereitstellen, und Vertrauen in die Regeln, die ihre Nutzung steuern.

Gelingt dies, können Daten weit mehr sein als eine abstrakte Ressource. Sie werden zu einem wirksamen Ins­trument, um Herausforderungen besser zu verstehen, fundierte Entscheidungen zu treffen und Innovation gezielt voranzutreiben. Sie werden zu unserem Kompass.

 

Dieser Beitrag ist der dritte Teil der Artikelserie "Data Literacy: Daten wirksam nutzen" des Bundesamtes für Statistik. Hier geht's zum ersten Teil. Den zweiten Teil der Serie finden Sie hier

Webcode
BMm9mzCw