UZH News

Neues KI-Programm übersetzt in fünf rätoromanische Idiome

Uhr
von UZH News / dwi

"Alas" ist ein neues Übersetzungsprogramm für Deutsch ins Rätoromanische und wurde gemeinsam von der Universität Zürich und der Lia Rumantscha entwickelt. Es generiert auf Knopfdruck gratis Übersetzungen in jedes der fünf Idiome des Rätoromanischen sowie in die Schriftsprache Rumantsch Grischun.

(Source: Mohamed_hassan / pixabay.com)
(Source: Mohamed_hassan / pixabay.com)

Rätoromanisch hat fünf verschiedene Sprachvarianten – Sursilvan, Sutsilvan, Surmiran, Puter und Vallader –, die insgesamt von rund 100'000 Menschen gesprochen werden. Die Diversität dieser Idiome ist eine Herausforderung, wenn KI-Programme auch Rätoromanisch unterstützen sollen.

Das Bild zeigt die verschiedenen Regionen, wo die fünf Sprachvarianten gesprochen werden

Die fünf verschiedene Sprachvarianten – Sursilvan, Sutsilvan, Surmiran, Puter und Vallader – werden von insgesamt rund 100'000 Menschen gesprochen. (Source: Lia Rumantscha)

Um den Stand der Technik zu verbessern, kontaktierte die Lia Rumantscha, der Dachverband aller romanischen Sprachvereine, ein KI-Forschungsteam an der Universität Zürich. Gemeinsam haben sie nun das erste Übersetzungsprogramm entwickelt, das die fünf Idiome unterstützt. Es heisst "Alas" (rätoromanisch für "Flügel") und kann Texte automatisch von Deutsch in die rätoromanischen Idiome übersetzen und zurück. Zusätzlich zu den Idiomen wird auch die Schriftsprache Rumantsch Grischun unterstützt.

Erstes Übersetzungsprogramm dieser Art

KI-Assistenten wie ChatGPT beherrschen zwar bereits heute zu einem gewissen Grad Rumantsch Grischun. So hat das UZH-Spin-off "Supertext" bereits vor vier Jahren ein Übersetzungsprogramm für die Schriftsprache auf den Markt gebracht. Doch die fünf Idiome des Rätoromanischen waren bis jetzt zu schwierig für die KI.

"Alas" wurde nun gezielt auf Tausenden von Beispieltexten trainiert. "Am Anfang brachte das KI-Modell die Idiome noch durcheinander", sagt Jannis Vamvas, Computerlinguist an der Universität Zürich, "doch im Lauf des Trainings wurde es immer besser darin, sie auseinanderzuhalten." Zu Trainingszwecken übersetzte "Alas" Berichte von RTR und Zeitungsartikel, aber auch literarische Werke, Schulbücher, sowie Texte von Gemeinden und dem Kanton Graubünden.

Vielversprechender Blindtest

Nach dem Training von "Alas" lud das Forschungsteam Muttersprachlerinnen und Muttersprachler der fünf Idiome zu einem Blindvergleich ein. Der Test wurde für Übersetzungen vom Deutschen ins Rätoromanisch durchgeführt, weil dort die meisten Schwierigkeiten bestehen. "Der Blindvergleich hat uns bestätigt, dass 'Alas' deutlich bessere Übersetzungen produziert als bestehende KI-Assistenten", sagt Jannis Vamvas von der Universität Zürich. "Die Übersetzungen sind inhaltlich genauer und werden für idiomatischer befunden." Noch besser schnitten nur von Menschen gemachte Übersetzungen ab.

Das Bild zeigt eine Grafik: Ein Vergleich von "Atlas" zu Gemini und zu menschlichen Experten

Inhaltliche Genauigkeit und Grammatik von "Atlas" im Vergleich zu Gemini und menschlichen Experten. (Source: UZH)

Benutzen kann man das Übersetzungsprogramm "Alas" gratis über die Website alas.liarumantscha.ch. Für Technikprofis ist das zugrundeliegende KI-Modell zudem als Open-Source-Software zugänglich – sie können es unter die Lupe nehmen und gegebenenfalls weiterentwickeln.

 

Dieser Beitrag ist zuerst auf der Website von "UZH-News" erschienen. 

Webcode
r4gUQLBK