Gute Daten helfen Mensch und Maschine

News

Künstliche Intelligenz verändert, wie Informationen entstehen und Entscheidungen getroffen werden. Doch die Leistungsfähigkeit der KI hängt entscheidend von einer oft übersehenen Grundlage ab: der AI-Readiness unserer Daten. Sie entscheidet darüber, ob aus Daten verlässliches Wissen für uns Menschen entsteht – oder nur scheinbare Gewissheit.

‹ ›

(Source: mayur - stock.adobe.com)

Georges-Simon Ulrich Direktor des Bundesamtes für Statistik (BFS). (Source: zVg)

Wir gewöhnen uns gerade daran, dass Maschinen schreiben, bewerten und Entscheidungen vorbereiten. Doch hinter dieser neuen Selbstverständlichkeit liegt eine stillere Voraussetzung, über die in der breiten Bevölkerung kaum gesprochen wird: das Vertrauen darauf, dass moderne KI sich auf verlässliche Daten stützt. Denn einerseits ist bekannt, dass generative KI gerne Inhalte "hinzuerfindet", wenn Daten fehlen. Das gehört zu ihrer generativen Funktionsweise, auch wenn dafür oft abwertend der Begriff des Halluzinierens verwendet wird. Andererseits werden diese Systeme aber immer besser darin, sich an vorhandenen Daten zu orientieren.

Hier stellen sich grundlegende Fragen: Was geschieht, wenn KI nicht die richtigen oder nicht genügend verlässliche Daten findet? Oder wenn sie die gefundenen Daten einfach nicht richtig versteht? Wenn ihr nur Bruchstücke, Widersprüche, Unschärfen zur Verfügung stehen? Dann wird sie Lücken weiterhin mit Inhalt füllen – und uns Resultate liefern, die nicht lückenhaft, sondern plausibel wirken.

Für uns wird das dort folgenreich, wo aus Plausibilität Entscheidung wird. Denn sobald Systeme Lücken nicht mehr anzeigen, sondern durch künstlich erzeugte Eindeutigkeit kaschieren, verschiebt sich der Begriff dessen, was wir als Wissen verstehen. In Demokratien zeigt sich das besonders deutlich: Politische Entscheidungen stützen sich zunehmend auf datenbasierte Analysen und KI-gestützte Bewertungen. Wenn diese auf unvollständigen oder verzerrten Grundlagen beruhen, können dennoch klar wirkende Empfehlungen resultieren.

Noch tiefer greift das Problem dort, wo verschiedene Datenwelten auseinanderdriften. Wenn unterschiedliche Akteure mit jeweils eigenen Daten und Modellen arbeiten, entstehen nicht nur abweichende Perspektiven, sondern abweichende Wirklichkeiten. Was als Fakt gilt, hängt dann davon ab, durch welches System er erzeugt und interpretiert wurde. So kommt der Gesellschaft die gemeinsame Grundlage abhanden. Nicht abrupt, sondern schleichend, über die wachsende Differenz dessen, was als gegeben erscheint.

Daten sind in diesem Kontext längst mehr als ein Material für Statistiken oder eine Grundlage für Politik und Verwaltung. Sie werden zum gemeinsamen Bezugspunkt von Mensch und Maschine. Ihre technische und semantische Anschlussfähigkeit entscheidet darüber, ob ein gemeinsamer Orientierungsrahmen erhalten bleibt.

Das beste Futter für die KI

Gerade deshalb rückt eine Frage in den Vordergrund: Wie anschlussfähig sind unsere Daten? Lange wurde diese Frage vor allem technisch betrachtet, obwohl Institutionen wie das BFS schon seit Längerem betonen, dass sie stets auch eine semantische Dimension hat. Wenn Daten zum Ausgangspunkt maschinell erzeugter Einschätzungen werden, reicht es nicht mehr, dass sie korrekt erhoben sind. Sie müssen auch "AI-ready" sein. Das sind sie, wenn sie in digitalen und KI-gestützten Systemen direkt nutzbar sind: weil sie klar strukturiert, konsistent beschrieben und semantisch eindeutig vorliegen. Es geht also nicht nur um technische Formate, sondern bildhaft gesprochen darum, dass die KI unsere Daten als das beste verfügbare Futter erkennt und bevorzugt daraus zehrt.

Für eine öffentliche Dateninfrastruktur wie jene des BFS bedeutet das eine Erweiterung der Perspektive: weg von der reinen Datensammlung, -analyse und -publikation hin zu einer aktiven Gestaltung von Interoperabilität als Infrastrukturaufgabe. Daten werden so gestaltet, dass sie in unterschiedlichen Kontexten zuverlässig weiterverwendet werden können – neben Verwaltung, Forschung, Politik und Gesellschaft eben zunehmend auch in KI-Systemen.

Das setzt neue Standards voraus: klare Metadaten, verbindliche Datenmodelle, einheitliche Begriffsdefinitionen und Prozesse, die sicherstellen, dass Daten nicht nur korrekt erhoben, sondern auch konsistent beschrieben und langfristig anschlussfähig bleiben.

Neue Infrastruktur der Wissensgewinnung

AI-Readiness von Daten herzustellen und aufrechtzuerhalten, ist eine gemeinsame Aufgabe, die sich schrittweise weiterentwickeln wird. Das aktuell entstehende Datenökosystem Schweiz unter Führung der Bundeskanzlei und in enger Zusammenarbeit mit den Departementen, Kantonen und Gemeinden – sowie zunehmend auch mit dem Privatsektor und der Forschung – ist für diese Aspekte sensibilisiert. Das BFS übernimmt dabei als "Swiss Data Steward" eine koordinierende Rolle: Es unterstützt andere Akteure dabei, dass Daten bereits nach ihrem Entstehen interoperabel, dokumentiert und langfristig nutzbar sind. Diese Funktion ist auch hinsichtlich AI-Readiness zentral.

Entscheidend sind dabei, wie erwähnt, nicht die Daten allein. Es ist das gesamte Gefüge, das ihre Nutzbarkeit trägt: qualitativ hochwertige Daten, klar beschriebene Metadaten, gemeinsame Standards, definierte Verantwortlichkeiten und verlässliche Prozesse. Zusammen bilden sie ein "epistemisches Rückgrat", also ein Gefüge, das gesellschaftliche Wissensgewinnung und Orientierung trägt und ihnen die dringend nötige Stabilität gibt.

Die Bedeutung dieses Rückgrats zeigt sich konkret in der täglichen Datenbewirtschaftung: Metadaten sorgen dafür, dass Daten eindeutig beschrieben und interpretierbar werden. Harmonisierung und Standardisierung stellen sicher, dass Informationen über Systeme und Verwaltungsgrenzen hinweg vergleichbar und konsistent nutzbar sind. Verlässliche Register und gepflegte Stammdaten schaffen gemeinsame Referenzpunkte und reduzieren Inkonsistenzen in der Datenverwendung. Ergänzt wird dies durch klare Verantwortlichkeiten, verbindliche Standards und Prozesse, die gewährleisten, dass Daten über ihren gesamten Lebenszyklus hinweg konsistent geführt werden.

Eine neue Sprache lernen

In dieser Artikelserie haben wir es gesehen: Daten entfalten ihren Wert nur dann vollständig, wenn ihre gesamte Kette funktioniert, von der Entstehung über die Bereitstellung bis zur Nutzung und Inwertsetzung. Jede dieser Phasen muss konsequent auf die Anschlussfähigkeit für Mensch und Maschine ausgerichtet sein.
Dazu braucht es mehr als Technik. Wir brauchen eine gemeinsame Sprache über Daten: einen geteilten Wortschatz, klare Begriffe, verbindliche Strukturen und ein gemeinsames Verständnis dessen, was Daten leisten können und sollen.

Auch in einer zunehmend daten- und KI-gestützten Welt bleibt die Verantwortung für Entscheidungen beim Menschen. Daten können Orientierung geben, Modelle Zusammenhänge sichtbar machen und Systeme Einschätzungen vorbereiten. Doch ob und wie diese in Entscheidungen einfliessen sollen und dürfen, ist keine technische, sondern insbesondere im staatlichen und behördlichen Kontext eine gesellschaftlich-demokratisch zu klärende Frage.

Damit diese Aushandlung überhaupt sinnvoll geführt werden kann, braucht es Datenkompetenz aufseiten der beteiligten Akteure. Die sogenannte Data Literacy muss deshalb gestärkt und in der Gesellschaft breiter verankert werden. Nur wer versteht, wie Daten entstehen, verarbeitet und interpretiert werden, kann die Funktionsweise und Grenzen datengetriebener Systeme wirklich einordnen und den Umgang damit im demokratischen Prozess fundiert mitgestalten. Dies wiederum ist eine Grundvoraussetzung für die souveräne Selbstbestimmung der Schweiz über ihre eigenen Daten ebenso wie für die informierte Kontrolle des Einzelnen über die Verwendung seiner Daten.

Hier tritt etwas Grundsätzliches hervor: Vielleicht besteht die grösste Gefahr des KI-Zeitalters nicht darin, dass Maschinen zu mächtig werden. Vielleicht besteht sie vielmehr darin, dass demokratische Gesellschaften ihre Fähigkeit verlieren, eine gemeinsame und vertrauenswürdige Wirklichkeit zu organisieren. Gerade deshalb ist die Zukunft öffentlicher Statistik keine technische Randfrage. Sie betrifft die Grundlagen demokratischer Orientierung und damit auch die digitale Souveränität moderner Gesellschaften.

Die Rolle des BFS liegt darin, zur Stabilität gemeinsamer Bezugspunkte beizutragen, für Menschen ebenso wie für Maschinen. Das Bundesamt kann hier aufgrund seiner langen Erfahrung im Umgang mit Daten – im Kern seit seiner Gründung im Jahr 1860 – eine zentrale Kompetenz einbringen. Denn Verständigung ist nichts Selbstverständliches. Sie muss technisch, institutionell und gesellschaftlich immer wieder neu ermöglicht werden.

Erst wenn dies gelingt, kann aus Datenfragmenten ein gemeinsamer Raum des Wissens entstehen. Der Weg dahin ist anstrengend, aber auch verheissungsvoll. Wenn wir diese Datensprache gut lernen, kann ein riesiger Schatz an verlässlichen Daten – manchmal via Maschinen – uns Menschen zugutekommen.

Dieser Beitrag ist der vierteTeil der Artikelserie "Data Literacy: Daten wirksam nutzen" des Bundesamtes für Statistik. Hier geht's zum ersten Teil. Den zweiten Teil der Serie finden Sie hier und den dritten Teil lesen Sie hier.

Artikel teilen: