Gute Daten fallen nicht vom Himmel
Wenn wir Daten analysieren, verknüpfen oder für neue Datenprodukte und Anwendungen verwenden, entsteht daraus Nutzen und neues Wissen. Doch bevor das möglich ist, müssen die Daten auf die richtige Weise entstehen. Ein guter Input ist der Beginn jeder Datennutzung – Qualität beginnt an der Quelle.
Daten sind heute überall, aber sie erschaffen sich nicht selbst. Sie stammen aus Beobachtungen, Messungen, Befragungen oder Administrativprozessen – und sie tragen immer den Stempel ihres Ursprungs. Wer Daten erhebt, entscheidet über die Fragestellung, Methode und den Zeitpunkt. Diese Entscheidungen prägen schon ganz zu Beginn, welche Schlüsse später möglich sind und ob die Daten später auch für andere Zwecke nutzbar sein werden – also zur Mehrfachnutzung geeignet sind. Darum ist der erste Schritt in der Datenwelt entscheidend: der Input.
Viele Daten sind unbrauchbar
In einer digitalisierten Welt ist die Versuchung gross, beim Sammeln von Daten nur an die eigenen Zwecke zu denken. Doch das ist kurzsichtig. Denn der echte Wert von Daten liegt darin, dass sie oft über den ursprünglichen Zweck hinaus verwendbar sind. Dafür braucht es Standards und Regeln. In der Schweiz hat das Bundesamt für Statistik (BFS) den Auftrag, diese Arbeiten der verschiedenen Bundesbehörden zu koordinieren: Die Digitalisierungsverordnung legt fest, dass das BFS die Instrumente schafft, um Daten zu harmonisieren. Wichtige Partner sind die Bundeskanzlei (Bereich DTI) wie auch die Digitale Verwaltung Schweiz, eine Zusammenarbeitsorganisation von Bund und Kantonen. Eines der gemeinsamen Ziele: Daten, die dieselbe Bedeutung haben, sollen gleich beschrieben werden. Diese Harmonisierung "an der Quelle" ist zentral: Wenn alle dieselben Begriffe, Formate und Klassifikationen verwenden, lassen sich Daten später einfacher zusammenführen und – natürlich im Einklang mit dem Datenschutz – für andere Zwecke nutzen, beispielsweise in der Planung und Forschung.
Das ist der Kern des Programms Nationale Datenbewirtschaftung (NaDB), das der Bundesrat 2019 gestartet hat. Es soll die Mehrfachnutzung von Daten in der Bundesverwaltung ermöglichen und Prozesse vereinfachen. Ein Ziel ist, doppelte Arbeit in der Verwaltung zu verhindern. Ein anderes, die Bevölkerung zu entlasten, etwa bei statistischen Erhebungen oder im Kontakt mit Behörden. Nach dem Once-Only-Prinzip sollen Daten nur einmal erhoben, aber mehrfach genutzt werden können.
Die Grundlage muss "FAIR" sein
Damit das funktioniert, müssen die Daten "FAIR" sein, nämlich findable (auffindbar), accessible (zugänglich), interoperable (miteinander kompatibel) und reusable (wiederverwendbar). Auffindbarkeit heisst, dass sie über eindeutige Identifikatoren und Metadaten leicht zu finden sind. Zugänglichkeit stellt sicher, dass die Daten unter klaren Bedingungen verfügbar sind. Interoperabilität sorgt dafür, dass Daten aus verschiedenen Quellen zusammengeführt werden können – auf juristischer, organisatorischer, technischer und semantischer Ebene. Man muss sie also zusammenführen dürfen und können. Wiederverwendbarkeit heisst, dass die Daten ausreichend dokumentiert sind, um auch später noch für neue Fragestellungen nutzbar zu sein. Zunehmend orientiert man sich auch am erweiterten FAIR2-Prinzip, das zusätzlich vertrauenswürdige (trustworthy) und nachvollziehbare (traceable) Daten verlangt. Auch das gelingt nur, wenn Daten von Beginn an einheitlich beschrieben, sauber dokumentiert und maschinenlesbar sind.
Natürlich braucht es, damit Daten interoperabel sind, gemeinsame Referenzen. Stammdaten und Register – etwa die Unternehmens-Identifikationsnummer (UID) – schaffen dieses Fundament. Sie stellen sicher, dass Personen, Unternehmen oder Orte über verschiedene Datensysteme hinweg eindeutig identifiziert werden. Das BFS betreibt oder koordiniert zentrale Register dieser Art und sorgt für einheitliche Pflege und Dokumentation.
Den Beipackzettel nicht vergessen
All das zu erfüllen, ist anspruchsvoll. Denn Daten sind – wie eingangs erwähnt – nie neutral: Jede Erhebung folgt einem bestimmten Zweck und einer Methode. Diese Faktoren prägen, welche Informationen enthalten sind und welche fehlen. Wer Daten erhebt, muss sicherstellen, dass spätere Nutzer sie korrekt interpretieren können, um Missverständnisse und Fehlinterpretationen zu vermeiden.
Hier helfen Metadaten: Sie beschreiben Herkunft, Erhebungsmethode und Grenzen eines Datensatzes. Ohne sie sind Daten schwer einzuordnen, mit hohem Risiko falscher Schlüsse. Stellen Sie sich Einkommensdaten vor: Ohne Metadaten wissen Sie nicht, ob es sich um Brutto-, Netto- oder steuerbares Einkommen handelt. Mit guten Metadaten – auch diese sind idealerweise standardisiert – wissen Sie genau, welche Definitionen und Kategorien genutzt wurden. Ähnlich wie die Zutatenliste auf einer Lebensmittelverpackung.
Pflegen und betreuen
Als "Data Steward" der Schweiz koordiniert das BFS die gemeinsame Datenbewirtschaftung in der Schweiz. Das bedeutet: Es achtet darauf, dass die Daten schon beim Entstehen den Anforderungen entsprechen, die sie später für vielfältige Nutzungszwecke erfüllen müssen. Dazu gehört auch die Verantwortung, dass Daten ethisch, gesetzeskonform und transparent genutzt werden. Kurz: Es geht um die verantwortungsvolle Betreuung und Pflege von Daten über ihren gesamten Lebenszyklus hinweg.
Hinzu kommt die Frage der Qualität. Qualität bedeutet dabei nicht Perfektion, sondern Eignung für unterschiedliche Zwecke. Sie umfasst Dimensionen wie Genauigkeit, Vollständigkeit, Konsistenz, Aktualität und Verfügbarkeit. Schon im Moment der Datenentstehung muss geprüft werden, ob die generierten Daten diese Anforderungen erfüllen.
Wer hat die Kontrolle?
Bei all dem Aufwand für gute Daten darf eines nicht vergessen werden: Daten gehören Menschen, Unternehmen oder Institutionen. Die Schweiz legt grossen Wert auf Datensouveränität und auf digitale Selbstbestimmung – das Recht, die Kontrolle über eigene Daten zu behalten. Gleichzeitig gibt es gesetzliche Grundlagen, die bestimmte Ausnahmen im öffentlichen Interesse erlauben. So darf das BFS Personendaten für statistische Zwecke verwenden, sofern der Datenschutz gewährleistet ist. Die Daten werden so verarbeitet, dass keine Rückschlüsse auf Einzelpersonen möglich sind – allein die statistische Wissensgewinnung zählt. Anders ausgedrückt: Wer Bettina Zimmermann ist, wo sie wohnt, wie viel sie verdient oder wie es um ihre Gesundheit steht, interessiert die Statistik nicht. Wichtig ist, wie viele Menschen wie Bettina Zimmermann es gibt, wie sie sich unterscheiden und wie sich ihre Lebensumstände im Lauf der Zeit verändern. Nur so lassen sich gesellschaftliche Entwicklungen erkennen und fundierte Entscheidungen treffen. Entscheidungen, von denen im Idealfall auch Bettina Zimmermann profitiert.
Gute Daten für die KI-Ära
In Zeiten von generativer KI bekommt Datenqualität eine neue Bedeutung. KI-Modelle lernen aus den Daten, die man ihnen gibt. Sind Daten und ihre Metadaten für die Maschine nicht auffindbar, nicht lesbar oder missverständlich, spiegelt der Output der KI-Modelle genau diese Probleme wider. Das kann dann zu falschen Schlüssen oder Fehlinformationen führen. Agentische KI-Systeme, wie sie aktuell in Unternehmen und Verwaltungen getestet werden, verlangen einen permanent verfügbaren und gut beschriebenen Datenhintergrund – sonst liefern sie widersprüchliche oder falsche Resultate. Gute, "FAIR-e" und beobachtbare Daten sind daher die beste Sicherheitsbarriere gegen KI-Fehlschlüsse. Nur mit hochwertigen Daten lassen sich intelligente Systeme entwickeln, die dem Menschen wirklich helfen.
Die Währung der Wirklichkeit
Wenn KI droht, mit falschen oder fehlenden Daten eine eigene Realität zu erzeugen, werden gute Daten zur Währung der Wirklichkeit. Sie schaffen Vertrauen, Stabilität und gemeinsame Orientierung. Das BFS und seine Partner sorgen dafür, dass Daten interoperabel, transparent, vergleichbar und ethisch genutzt werden – damit die Schweiz auf einer faktenbasierten Grundlage handeln kann.
Gute Daten fallen auch in Zukunft nicht vom Himmel. Dass Daten von Anfang an zuverlässig und nutzbar sind, dafür müssen wir selbst sorgen.
Quantenresilienz ist kein Zukunftsthema mehr
Nutanix bestimmt neuen Sales Director für die Schweiz
Die neue Netzwoche und das Cloud & Managed Services sind da
"KI wirkt wie ein Katalysator für das Thema Souveränität"
Das Ende des Bottom-up – warum CIOs jetzt radikal umdenken müssen
Wie können IT-Dienstleister das Lock-in-Szenario vermeiden?
Schweizer Antwort auf «Hyperscaler-Angst»
V wie VUCA
Technologie, die entlastet: Ganzheitliche Lösungen für Produktivität und Zusammenarbeit