Thomas Schulthess im Interview

Wie das CSCS und Apertus die KI-Zukunft der Schweiz sichern

Uhr

Mit Alps betreibt das Swiss National Supercomputing Centre (CSCS) einen der mächtigsten Supercomputer Europas. Zu seinen ersten Erfolgen gehört das KI-Modell Apertus, wie CSCS-Direktor Thomas Schulthess sagt. Im Interview ­erklärt er, warum er Apertus nicht als Schweizer KI-Modell sieht und warum man zwar digital souverän, aber nicht ­autonom sein kann.

Thomas Schulthess, Direktor, Swiss National Supercomputing Centre. (Source: zVg)
Thomas Schulthess, Direktor, Swiss National Supercomputing Centre. (Source: zVg)

Alps wurde vor eineinhalb Jahren eingeweiht. Wie hat sich der Supercomputer seither bewährt?

Thomas Schulthess: Sehr gut. Es ist eine sehr anspruchsvolle Maschine – grösser als alles, was wir vorher hatten. Wir mussten uns mit neuen Gebieten wie der künstlichen Intelligenz auseinandersetzen. Das hat viel von uns abverlangt, bescherte uns aber auch Erfolge in vielen Bereichen. Inzwischen ist die Maschine in voller Produktion und leistet, was wir erwarten.

Wie sieht es mit der Auslastung aus? Gibt es ­Leerlaufzeiten?

Nein, die gab es schon von Anfang an nicht. Das lief anders als üblich. Normalerweise hat man bei einer neuen Maschine anfangs einen geringeren Kapazitätsbedarf, der dann mit der Zeit steigt, bis die Maschine zur Mitte des Lifecycles die volle Auslastung erreicht. Doch Alps war von Beginn an praktisch auf einen Schlag voll ausgelastet. Das hängt mit der KI-Welle zusammen und speziell mit dem Pre-Training von Apertus. Die Nachfrage ist nach wie vor gross – die Maschine ist voll ausgelastet und kann das auch aushalten.

Welche Anwendungsfälle faszinieren Sie ­besonders?

Wir machen ja schon seit Jahrzehnten traditionelle Simulationen in verschiedensten Bereichen – von der Wettervorhersage über die Materialwissenschaft und Chemie bis zur Astrophysik. In den vergangenen zwei Jahren kam künstliche Intelligenz dazu, also maschinelles Lernen mit tiefen neuronalen Netzwerken. Mit Alps verbreitert sich unser Spektrum weiter, mit bedeutenden Resultaten in vielen Bereichen. Positiv überraschte mich, wie schnell Meteoschweiz und die europäischen Wetterdienste das Thema KI aufgenommen haben. Sie entwickelten in kurzer Zeit operative Produkte mit erstaunlichen Verbesserungen in der Vorhersagekraft und völlig neuen Anwendungsmöglichkeiten. Und Ähnliches passiert aktuell in vielen weiteren Bereichen.

Das KI-Modell Apertus wurde auf Alps trainiert. Was prädestinierte Alps für diesen Zweck?

Wir entwickeln Apertus im Rahmen der schweizerischen KI-Ini­tiative und in enger Zusammenarbeit mit Teams an den KI-Zentren der ETH Zürich und der EPFL. Apertus entstand praktisch auf und dank Alps. Es gibt zwei Aspekte, die Alps dafür prädestinieren. Erstens ist Alps mit Abstand die grösste Computer-Ressource in der Schweiz. Das Training von Apertus brauchte über drei bis vier Monate etwa 40 Prozent der Leistung von Alps. Auf keiner anderen Infrastruktur in der Schweiz hätte man das Training durchführen können. Zweitens steht hinter Alps ein ausgezeichnetes Team. Wir haben sehr viel Zeit in die Software und den langfristigen Betrieb investiert. Normalerweise läuft ein Supercomputer wie ein Formel-1-Wagen für ein Rennen von ein paar Stunden. Apertus zu trainieren, war dagegen wie das Langstreckenrennen Paris–Dakar – mehrmals hin und her – mit einem Formel-1-Wagen. Parallel zum KI-Training liefen noch Wettervorhersagen, Klimasimulationen und andere Anwendungen. Dass das Team es schaffte, die Infrastruktur nachhaltig auf Trab zu halten, ist alles andere als trivial.

Inzwischen ist Apertus verfügbar. Für welche Anwendungsfälle eignet sich das Modell?

Tatsächlich veröffentlichten wir im September 2025 eine erste Version, um Erfahrungen zu sammeln. Wir trainieren aber bereits Version 1.5, die voraussichtlich im Sommer erscheint; und wir bereiten auch schon Version 2.0 vor, die wir für Ende 2026 oder Anfang 2027 erwarten. Die erste Version hat zwar ihre Stärken, ist aber noch kein fertiges Produkt und diente primär dazu, die statistischen Eigenschaften von Apertus zu studieren. Eine Tessiner Firma hat jedoch bereits einen auf dem Modell basierenden Sprachübersetzer entwickelt. An der EPFL trainiert eine Kollegin Apertus weiter mit medizinischen Daten. Darauf basierend entsteht Meditron, eine komplett transparente KI-Anwendung für Ärztinnen und Ärzte. Die kommende Apertus-Version 1.5 wird hoffentlich auch in vielen kommerziellen Produkten verwendet – übrigens nicht nur in der Schweiz. Wir wissen, dass sich auch andere Länder für Apertus interessieren, wie Singapur oder Schweden.

Gibt es ähnliche Projekte wie Apertus in anderen Ländern?

Ja, bekannt ist etwa das vom Allen Institute for Artificial Intelligence trainierte Modell OLMO, dessen Zukunft allerdings aktuell ungewiss scheint. In Singapur arbeitet AI Singapore an "SEALION" mit Fokus auf südostasiatische Sprachen. Mit Singapur arbeiten wir explizit zusammen und erhalten von ihnen sehr wertvolles Feedback. Es gibt auch europäische Projekte wie "OpenEuroLLM".

Warum braucht die Schweiz dann ein eigenes ­Modell?

Ich sehe Apertus als globales Modell, nicht als Schweizer Modell. Meine Hoffnung ist, dass verschiedene Länder zusammenkommen und ihre Ressourcen in einem Modell konzentrieren. Mir schwebt eine gemeinsame Initiative mit lokalem Post-Training vor – ein Swiss Finish, ein katalanischer Finish oder ein finnischer Finish. Das Post-Training bringt die Kultur hinein und definiert auch, was das Modell nicht sagen soll. Diese kulturellen Aspekte sollten die einzelnen Länder für sich berücksichtigen. Für grosse Modelle braucht es viele Ressourcen und bessere Daten von Sprachen, die im digitalen Raum unterrepräsentiert sind. Solche Daten kann die Schweiz nicht allein beitragen, sondern sie müssen von den jeweiligen Sprachgruppen selbst kommen. Und es gibt schon erste erfreuliche Entwicklungen in diese Richtung.

Welche Rolle sollten Staaten und öffentliche ­Institutionen beim Aufbau der KI-Infrastruktur spielen?

Für die Naturwissenschaften brauchen wir Modelle, die qualitativ hochwertig, aber völlig offen und reproduzierbar sind. Letzteres fehlt zurzeit bei kommerziellen Modellen. Gerade in der Wissenschaft und Medizin ist es wichtig, dass wir nachvollziehbare Systeme haben. Öffentliche Institutionen müssen ihre konkrete Rolle noch definieren. Bei Strassen und Eisenbahnen verhält es sich so: Öffentliche Institutionen bauen die Infrastruktur, private Transportunternehmen nutzen sie und tragen mit Leistungsabgaben zur Finanzierung bei. Ähnlich könnten öffentliche Institutionen prätrainierte KI-Modelle mitfinanzieren. Aufgrund der immensen Kosten müsste dies allerdings in Zusammenarbeit mit privaten Investoren geschehen. Diese Modelle bilden dann die Basisinfrastruktur für kommerzielle Anwendungen. Damit wiederum können private Firmen Geld verdienen, wobei ein Teil der Einnahmen zur Finanzierung der Infrastruktur genutzt würde.

Wo stehen wir bei der Verwirklichung dieser ­Vision?

Wir stehen erst am Anfang. Gleichzeitig ging in jüngster Zeit alles sehr schnell. Vor einem Jahr wussten wir noch nichts von Apertus. Inzwischen ist Version 1.0 seit einem halben Jahr verfügbar und Version 1.5 steht vor der Tür. Nun hoffe ich auf eine möglichst konstruktive Diskussion. Gleichzeitig wünsche ich mir mehr Interesse und vor allem mehr Mut aus der Schweizer Privatwirtschaft. Fest steht: Die Diskussion wird geführt werden, wenn nicht in der Schweiz, dann anderswo auf der Welt.

Wo liegt Ihrer Meinung nach die Macht in der KI-Entwicklung – bei den Modellanbietern oder der Infrastruktur?

Die Infrastruktur ist notwendig – es gibt kein Modell ohne Infrastruktur. Das umfasst nicht nur Rechenanlagen, sondern auch Strom sowie Wasser zur Kühlung. Aber das reicht nicht. Man braucht auch die Modelle, das Know-how und die Daten zum Training. Die Infrastruktur ist eine notwendige Voraussetzung, aber die Wertschöpfung entsteht durch die Modelle und Produkte.

In jüngster Zeit ist digitale Souveränität in aller Munde. Wie digital souverän ist das CSCS auf­gestellt?

Das CSCS und auch die ETH Zürich sind diesbezüglich sehr gut unterwegs. Alps ist ja nicht einfach ein Computer, den wir von Nvidia gekauft haben und jetzt betreiben. Es ist eine Forschungsinfrastruktur, die wir über acht Jahre lang aufgebaut haben. Dabei investierten wir sehr viel in Software, Betrieb und andere Aspekte der digitalen Souveränität. So betreiben wir die Systeme innerhalb unserer Landesgrenzen, haben die Software komplett im Griff, arbeiten mit Open Source und in globalen Kollaborationen. Apertus ist für mich ein Musterbeispiel. Wir haben es geschafft, in so kurzer Zeit ein Team von über 100 Personen aufzubauen, die das Modell von Grund auf trainierten, Daten aufbereiteten und alles dokumentierten. Wenn man etwas selbst kann, versteht man es, kann es ­erklären und anderen helfen. Das sind alles Beiträge zur digitalen Souveränität der Schweiz. Wichtig ist aber auch dies: Souveränität ist erreichbar, Autonomie nicht.

Was meinen Sie damit?

Die Prozessoren und Maschinen müssen wir importieren. Wir verstehen sie zwar und können auf Augenhöhe mit den Herstellern diskutieren. Aber die Investitionen für die Entwicklung der Prozessoren kosten schon Hunderte von Millionen bis Milliarden Franken, und die Entwicklung beziehungsweise der Bau der Fabrikationsanlagen mehrere 10 Milliarden. Das braucht eine funktionierende Weltwirtschaft. Im Rahmen der globalen Lieferketten erkennen wir Abhängigkeiten erst recht. Es ist unmöglich, alles selbst zu machen – und das gilt für alle Länder.

Wie stärkt umgekehrt das CSCS die digitale ­Souveränität der Schweiz?

Mit Projekten wie Apertus gehen wir über die reinen Wissenschaften hinaus. Wir unterstützen die Lehre und die Entwicklung von Know-how in der Schweiz. Das Beispiel mit den Wetterdiensten zeigt: Sie haben sich dank unserer Unterstützung schnell im KI-Bereich entwickelt und ein hohes Mass an Souveränität erreicht. Darum bin ich grundsätzlich zuversichtlich. Wir müssen jetzt den Mut haben, anzuerkennen, wo wir stehen und wo wir weitergehen müssen. Das wird Investitionen brauchen.

Wen sehen Sie in der Pflicht?

In der Schweiz wird extrem wenig in digitale Souveränität investiert. Hier muss jetzt die Wirtschaft etwas leisten. Der Staat kann und darf nicht alles selbst finanzieren. Und wenn die Schweizer Privatwirtschaft nicht investiert, werden wir von ausländischen Geldgebern abhängig und geben damit auch die digitale Souveränität auf.

Mit zunehmender Rechenleistung steigt auch der Energiebedarf. Wie nachhaltig betreibt das CSCS seine Infrastruktur?

Am CSCS haben wir von Anfang an darauf geachtet. Wir nutzen Strom aus Wasserkraft und erneuerbaren Quellen, kühlen mit Wasser aus dem Luganersee, das wir zurückführen, sodass unser Wasserverbrauch null ist. Die Abwärme stellen wir dem lokalen Fernwärmenetz zur Verfügung. Unser Jahresverbrauch an Strom steigt zwar, und mit jedem neuen System wie Alps steigt er sprunghaft. Aber wir waren darauf vorbereitet, weil wir schon 2008 unsere Infrastruktur entsprechend planten.

Was braucht es, um den steigenden Energie­bedarf und Nachhaltigkeit künftig zu vereinen?

Steigt der Bedarf weiter, müssen wir überlegen, wo wir künftig Rechenzentren bauen, um eine nachhaltige Energie- und Kühlungsinfrastruktur sicherzustellen. Wir werden mehr Strom brauchen – das hat mit Souveränität zu tun. Wenn wir die Hausaufgaben nicht machen, verlieren wir Souveränität. Die Schweiz muss ihre Stromproduktion unbedingt erhöhen, und zwar nachhaltig mit CO2-armen Methoden, nicht mit Gas, Kohle oder Erdöl. 

Wer ist dafür gefordert?

Dieses Ziel muss die Gesellschaft als Ganzes mittragen und planen, pragmatisch und konstruktiv engagiert. Was wir nicht brauchen können, sind Nein-Sager, die sich dem Energie- und Infrastrukturausbau in den Weg stellen, nur weil sie die Leute dahinter nicht mögen. Ich wünsche mir einen offenen Diskurs. Wir brauchen vor allem auch Lösungen, die kurzfristig – binnen fünf Jahren – bereit sind.

Müssen KI-Infrastrukturen stärker verteilt ­werden?

Sicher. Es wird dereinst viel grössere Rechenzentren brauchen als das CSCS – wir reden von Faktor 10 oder sogar 100. Das werden wir nicht alles in der Schweiz bauen können. Wir müssen mit anderen Staaten zusammenarbeiten, die eine ähnliche Innovationskultur haben. Die ganz grosse Infrastruktur müssen wir dort bauen, wo es nachhaltig am besten möglich ist. Für Rechenzentren mit einigen hundert Megawatt oder Gigawatt Leistung müssen wir mit Ländern in Nordeuropa kooperieren. Zum Beispiel gibt es in Finnland, 600 Kilometer nördlich von Helsinki, eine Anlage in einer alten Papierfabrik mit 250 Megawatt Leistung. Dort haben sie günstige Wasserkraft und Kühlung.

Wo sehen Sie das CSCS in zehn Jahren?

Ich sehe die Zukunft grundsätzlich positiv. Die Veränderung durch KI könnte vergleichbar sein mit der Erfindung des Buchdrucks. Nehmen wir an, wir schaffen die Veränderungen in der Schweiz konstruktiv und positiv – und ohne Kriege wie seinerzeit nach der Reformation. Rechenzentren werden um den Faktor 10 bis 100 skaliert werden müssen – aber nicht am CSCS. Es wird als Teil der ETH weiterhin technologisch an der Spitze sein. Wir werden nicht mehr die grössten, aber immer noch die innovativsten Anlagen haben. Wir werden die innovativsten Pilotanlagen entwickeln und betreiben, die als Vorbild für grössere Anlagen in der Industrie und an anderen Standorten dienen und an denen wir weiterhin die besten Ingenieurinnen und Ingenieure ausbilden werden. Vor zehn Jahren waren wir eines der führenden Rechenzentren im wissenschaftlich-öffentlichen Bereich – wir sind es heute und werden es auch in zehn Jahren sein.


Zur Person
Seit 2008 leitet Thomas Schulthess das Swiss National Supercomputing Center (CSCS) in Lugano. Das CSCS ist Teil der ETH Zürich, wo Schulthess als Professor für Computational Physics tätig ist. In seiner Vergangenheit forschte er unter anderem am Oak Ridge National Laboratory (ORNL) in Tennessee. In seiner Doktorarbeit, die er 1994 an der ETH Zürich einreichte, befasste er sich sowohl experimentell wie auch mittels Computersimulationen mit Legierungen. Seither veröffentlichte er eine Vielzahl an Forschungsarbeiten, unter anderem zu den magnetischen Eigenschaften metallischer Nanopartikeln (Nanomagnetismus).
 

Webcode
kjgNjhAz