Metas neues Speech-to-Text-Modell versteht über 1600 Sprachen
Meta hat mit Omnilingual ASR ein neues Spracherkennungsmodell vorgestellt. Die Open-Source-Technologie unterstützt über 1600 Sprachen. Zwar versteht sie bislang kein Schweizerdeutsch, dafür gehört Rätoromanisch bereits zu ihrem Repertoire.
Meta hat mit Omnilingual ASR (Automatic Speech Recognition) ein neues mehrsprachiges Spracherkennungssystem vorgestellt. Die Open-Source-Technologie soll über 1600 Sprachen unterstützen, wie Meta in einem Blogbeitrag mitteilt. Damit deckt der Social-Media-Riese mehr Sprachen ab als alle bisher veröffentlichten Modelle und hängt beispielsweise auch das Modell Whisper von OpenAI ab, das laut "Venturebeat" lediglich 99 Sprachen beherrscht.
Omnilingual ASR lässt sich gemäss Meta auch auf neue Sprachen erweitern: Über eine Lernfunktion namens Zero-Shot-In-Context-Learning könne das System theoretisch auf bis zu 5400 Sprachen ausgeweitet werden. Laut Blogbeitrag können Entwicklerinnen und Entwickler das Speech-to-Text-Modell frei nutzen und an eigene Bedürfnisse anpassen - die Modelle stehen unter der offenen Apache-2.0-Lizenz auf Github bereit.
Durch die Zusammenarbeit mit lokalen Gemeinschaften soll die Technologie zugleich kulturell sensibel bleiben und den Zugang zu digitalen Diensten erweitern. Meta will demnach mit der Veröffentlichung "Sprachbarrieren abbauen und die Kommunikation zwischen Menschen unterschiedlicher sprachlicher und kultureller Herkunft ermöglichen", wie es im Blogbeitrag heisst. Schweizerdeutsch kann die KI bislang zwar noch nicht, dafür gehört jedoch Rätoromanisch zum sprachlichen Repertoire des Systems.

Metas Spracherkennung soll bereits die vierte (und seltenste) Landessprache der Schweiz beherrschen. (Source: Screenshot / Omnilingual ASR)
Spracherkennungssysteme machen generell grosse Fortschritte. In einer Studie Anfang Jahr hat die UZH-Computerlinguistin Eleanor Chodroff gemeinsam mit Chloe Patman von der Cambridge University untersucht, wie gut moderne ASR-Systeme mit herausfordernden Hörbedingungen umgehen. Lesen Sie hier mehr dazu.
SwissICT und Swico aktualisieren ICT-Modellverträge
Digisanté, E-GD und die Realität der Digitalisierung im Schweizer Gesundheitswesen
Augmented HR: Technologie trifft Organisation
IBM treibt Chipfertigung unter 1 Nanometer voran
Apple erhöht Preise von Macbooks und iPads
Update: OpenAI präsentiert ersten Inferenz-Chip für KI-Modelle
MTF Solutions übernimmt IT-Dienstleister Insysta
Xebia ordnet Regionen neu und verliert DACH-Chef
Das Zeitalter der physischen Archive ist vorbei