Zuhörer sind mässig begeistert

Hörfilme für Blinde: Wenn die Computerstimme den Film beschreibt

Uhr
von René Jaun und jor

Filme mit Bildbeschreibungen für blinde Menschen gibt es schon länger. Um die Produktionskosten zu senken, ersetzen erste Anbieter die realen Sprecher nun durch synthetische Stimmen. Eine Entwicklung, die nicht bei allen gut ankommt.

(Source: geralt / Pixabay.de)
(Source: geralt / Pixabay.de)

"Das Augenpaar eines Mannes. Er sieht nach links – nach rechts – geradeaus. Um das rechte Auge schliesst sich ein Fadenkreuz." Mit diesen Worten beginnt jeden Sonntagabend der "Tatort" – oder zumindest die Hörfilmfassung der Krimiserie. Sie ist jeweils auf dem zweiten Tonkanal von "SRF", "ARD" und "ORF" zu hören und richtet sich vor allem an blinde und stark sehbehinderte Menschen.

Bei einem Hörfilm wird dem normalen Filmton eine Audiodeskription hinzugefügt. "Das heisst, dass der Film in Ergänzung zu den Dialogen, mit Bildbeschreibungen versehen wird", erklärt der bei SRF für Hörfilme verantwortliche Stefan Hoffmann in einem Beitrag auf "SRG Insider". Hörfilme sollen demnach blinden und sehbehinderten Menschen ein barrierefreies Filmerlebnis ermöglichen, welches wiederum so gut wie möglich dem Erlebnis des sehenden Publikums entsprechen soll.

Dieses Erklär-Video von "hörfilm.info" zeigt, wie Audiodeskriptionen funktionieren.

Wachsendes Angebot

Das Angebot an Filmen mit Audiodeskription wächst. Seit Ende der 1990er-Jahre produziert etwa das öffentlich rechtliche Fernsehen in Deutschland regelmässig Hörfilme, wie es auf der Website der "ARD" heisst. 2015 lancierte der US-amerikanische Streaming-Anbieter Netflix erstmals Filme mit Bildbeschreibungen, wie "CNN" berichtet. Ein Jahr später sprang gar das Erwachsenen-Filmportal Pornhub auf den Trend auf und versah eine Auswahl seiner Filme mit Audiodeskriptionen. Das erklärte Ziel ist es, auf die Bedürfnisse aller Nutzer einzugehen, begründete das Unternehmen den Schritt gemäss einem Bericht von "The Guardian".

Auch die SRG baute in puncto Hörfilmen aus. Im Jahr 2020 habe man 1074 Stunden Sendungen mit Audiodeskription angeboten, heisst es auf Anfrage. SRF habe davon 536 Stunden ausgestrahlt und via Webplayer angeboten.

So klingt die Audiodeskription eines "Tatorts", eingesprochen von der professionellen Sprecherin Diana Gaul.

Kosten sparen mit synthetischen Stimmen

Die Produktion eines Hörfilms hat ihren Preis. Bei Spielfilmen belaufen sich die Kosten, je nach Teamzusammensetzung, auf zwischen 70 und 130 Franken pro Minute, sagt Urs Lüscher, Geschäftsleiter von Hörfilm Schweiz, auf Anfrage. Gemäss dem SRG-Insider-Artikel sind in der Regel ein bis zu dreiköpfiges Autorenteam, ein Redaktor und ein professioneller Sprecher involviert.

Um die Kosten für Hörfilme zu senken, haben erste Anbieter angefangen, auf professionelle Sprecher zu verzichten. In ihren Produktionen lesen stattdessen synthetische Computerstimmen die Bildbeschreibungen vor.

So klingt eine Audiodeskription mit einer synthetischen Stimme.

Gemäss dem "Standard" testet etwa der ORF das Verfahren, um künftig sein Angebot im Bereich der Audiodeskription ausbauen zu können. Und auch bei der deutschen ARD sprechen manchmal künstliche Stimmen die Bildbeschreibung, so etwa bei der Web-Serie "How to Tatort".

Nutzerskepsis und Zukunftspotenzial

Nach dem Testhören einer derart produzierten Episode ist Netzwoche-Redaktor René Jaun zwiegespalten: Einerseits klingt die synthetische Stimme gut und freundlich – weitaus weniger roboterartig als man erwarten könnte. Doch spätestens während eines fremdsprachigen Dialogs, dessen Untertitel in der Hörfilm-Variante von verschiedenen Sprachsynthesen gelesen werden, legt sich die Begeisterung. "Bitte setzen Sie Ihre Profisprecher nicht vor die Tür – vor allem nicht bei längeren Spielfilmen", möchte der Autor den Geldgebern zurufen. Doch was halten andere Zuhörer von synthetisch gesprochenen Audiodeskriptionen?

Susanne Jekat ist Professorin für Sprachtechnologie und mehrsprachige Kommunikation am Institut für Übersetzen und Dolmetschen der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW). Auf Anfrage verweist sie auf die Forschungsergebnisse im Schweizer Zentrum für Barrierefreie Kommunikation  und die in diesem Kontext entstandene Masterarbeit von Marina Gerster, in der sie unter anderem den Einsatz synthetischer Stimmen für Hörfilme untersuchte. Die Ergebnisse seien zwar nicht repräsentativ, deuteten jedoch schon einiges an.

Susanne Jekat (l.) forscht und lehrt an der ZHAW zu Sprachtechnologien. (Source: blog.zhaw.ch)

So seien die synthetischen Stimmen, die im Rahmen der Untersuchung genutzt wurden, schon so natürlich, dass einige der Testpersonen gar nicht erkannten, dass es sich um eine synthetische Stimme handelte. Und: "Mit zunehmender Verwendung von Big Data und intelligenten Algorithmen werden diese synthetischen Stimmen noch besser werden." Trotzdem seien viele Menschen mit Sehbehinderung gegen die künstlichen Stimmen.

Zudem sei nicht bekannt, ob Text-to-Speech die gesamte Bandbreite der menschlichen Stimme eines Tages abbilden könne. "Bei der Verarbeitung menschlicher Sprache erkennt ein Mensch oft bereits am ersten Wort eines Satzes, was es für ein Satz werden wird." Das liege an der Intonation und an der sogenannten Prosodie einer menschlichen Stimme. Als Prosodie bezeichnet man - vereinfacht gesagt - die Melodie und den Rhythmus von Sätzen. "Hier sind sehr grosse Forschungslücken", schreibt Jekat.

SRF bleibt bei professionellen Sprechern

Jekat schreibt weiter, sie überzeuge aber das Kosten-Argument, zumindest immer dann, wenn eine Audiodeskription dringend erforderlich sei, aber Geld oder Zeit für das Tonstudio mit professionellen Sprechern fehlten.

Das Schweizer Fernsehen experimentierte ebenfalls mit Computerstimmen: "SRF hat bereits 2017 einen Test mit synthetischer Stimme bei der Audiodeskription eines DOK-Films gemacht", schreibt Natacha Rickenbacher, Fachspezialistin barrierefreies Angebot, auf Anfrage."Das Feedback der Zielgruppe und der Sehbehinderten-Verbände war aber nicht sehr positiv, da die Stimme damals noch sehr computergesteuert klang."

Inzwischen hätten sich die Stimmen zwar verbessert, schreibt Rickenbacher weiter. Auf die Frage, ob "SRF" solche Produktionen regulär ausstrahlen wolle, antwortet sie jedoch: "Nein, zurzeit bestehen bei SRF keine Pläne für synthetische Stimmen. Selbstverständlich behält SRF die technologische Entwicklung im Auge und ist offen für neue Technologien, um mehr Programme barrierefrei anbieten zu können."

Auch TV-Hersteller machen ihre Geräte für blinde und sehbehinderte Menschen barrierefrei – zumindest manchmal. Zuletzt stellte der koreanische Hersteller Samsung an der CES 2021 neue Funktionen im Bereich der Accessibility vor. Weitere Unternehmen bieten KI-getriebene Tools an, die Fotos für blinde beschreiben sollen. Lesen Sie hier, welche Erfahrungen Netzwoche-Redaktor René Jaun damit schon gemacht hat.

 

Webcode
DPF8_208082