20 Jahre Netzwoche

Warum die SRG nicht alle Speichertrends mitmacht

Uhr

1931 startet die Schweizerische Rundspruchgesellschaft – die heutige SRG – erste Radioprogramme. Seither speichert sie Ton- und später auch Bilddokumente. Rund eine Million Stunden an Tondokumenten umfasst das Archiv mittlerweile. Christian Vogg, Leiter Dokumentation und Archive bei SRF, verrät, auf welche Storagetechnologie das SRF-Archiv setzt und wie sich neue Trends auswirken.

(Source: SRF/Oscar Alessio)
(Source: SRF/Oscar Alessio)

Wenn ich das Stichwort Radioarchiv höre, denke ich an einen mit Platten und Tonbändern gefüllten Keller. Wie sieht es tatsächlich in Ihrem Archiv aus?

Christian Vogg: Teilweise immer noch genauso! Daneben gibt es aber wesentlich kleinere Keller, welche die Gerätschaften der digitalen Archivsysteme beherbergen. Diese sehen nicht so nostalgisch aus, sind aber äusserst effizient in der Nutzung.

Wie gross ist die Datenmenge Ihres digitalen Archivs?

Video- und Audio-Archivsystem zusammen umfassen rund 5,3 Petabyte, also 5,3 Millionen Gigabyte.

Und wie viel ist das in Zeiteinheiten?

In digitaler Form haben wir derzeit rund 190 000 Stunden Video und etwa ein Million Stunden Audio (Wort); unsere digitale Musik-Datenbank umfasst etwa 300 000 Stunden Musik und Geräusche. Wir haben auch noch etwa 12 000 Stunden Film im Keller, wovon aber nur ein kleiner Teil als Files vorliegen.

Wie viele Personen und Systeme greifen auf die Daten zu?

Insgesamt hat das SRF-Archiv rund 3000 registrierte Nutzerinnen und Nutzer, der Grossteil sind Mitarbeitende von SRF und der SRG, zudem greifen etwa zwei Dutzend Produktions- und Transfersysteme darauf zu.

Welche Storagetechnologien verwenden Sie derzeit?

Die Vorschauvideos und -audios, die beim Recherchieren in unserem Archivsystem FARO abgespielt werden, liegen auf einem Diskspeicher, damit sie unmittelbar gestartet werden können. Für die Langzeitarchivierung verwenden wir einen Tapestorage, aus dem auch die von Redaktoren und Dokumentalisten bestellten Files kommen, genauer gesagt ihre jeweilige Kopie. Dieser Storage umfasst momentan rund 1000 Tapes von IBM Jaguar 3592 Typ JD. Für den Filetransfer ab Tape stehen neun Laufwerke parallel zur Verfügung. Auf einem Tape sind knapp 400 Stunden Video in Broadcast-Qualität (30 GB/Std) gespeichert oder 60 000 Stunden Audio, ebenfalls in Broadcast-Qualität (170 MB/Std).

Wie schnell ist dieses Storagesystem?

Archivierte Files liegen zusätzlich – nach ihrem Import in den Storage – während mehrerer Tage bis Monate (abhängig vom Versionstyp) zusätzlich auf einem Diskspeicher. Der Export eines Files ab diesem Diskspeicher dauert je nach Grösse nur eine bis ein paar wenige Minuten. Liegt ein benötigtes File dagegen nicht mehr auf dem Diskspeicher, wird es automatisch aus dem Tapespeicher auf den Diskspeicher ausgelesen und von dort exportiert. Beim Transferprozess vom Tape zur Disk ist vor allem zeitaufwändig, das benötigte Tape ins Laufwerk einzuspannen und es dort korrekt zu positionieren. Der reine Datentransfer dagegen geht rasch vor sich. Der Exportprozess ab Tape dauert daher in der Regel 3 bis 5 Minuten länger, abhängig davon, wie viele Files gleichzeitig bestellt werden, wie gross die bestellten Files sind und wo auf dem Tape das File positioniert ist; das Tape selbst ist über einen Kilometer lang. Bei sehr grossen Bestellungen kann der Export deswegen auch wesentlich länger dauern.

Festplatten sind in den letzten Jahren schneller, günstiger und ­robuster geworden. Warum setzt SRF noch immer auf Tapes?

Weil unser Bestand mit gut 5 Petabyte so gross ist, dass die Langzeitarchivierung auf Tapes noch immer günstiger ist. Und als Service-Public-Unternehmen sind wir verpflichtet, mit dem Geld unserer Beitragszahler wirtschaftlich zu haushalten.

Wenn Sie einen Mangel Ihres momentanen Systems beheben könnten, welcher wäre das?

Da unser System keine gravierenden Mängel hat, deren Behebung es wesentlich verbessern würden, wäre diese Frage hiermit schon beantwortet. Es ist aber richtig: FARO ist – IT-technisch gesehen – mit einem Alter von elf Jahren schon deutlich in die Jahre gekommen. Aber da wir das System laufend weiterentwickeln, fällt dies nicht ins Gewicht. So passen wir uns kontinuierlich den sich ständig ändernden Anforderungen unserer Nutzerinnen und Nutzer an. Beispielsweise wurden neue Funktionen hinzugefügt wie etwa automatische Importprozesse für Files und ihre begleitenden Metadaten. Die GUI ändert sich gelegentlich; neulich haben wir einen technisch komplett neuen Webplayer eingebaut – aufgrund des End-of-Life von Silverlight. Und aktuell wird die Suchfunktionalität – erneut – verbessert und so weiter.

Die Netzwoche wird dieses Jahr 20 Jahre alt. Wie sah Ihre ­Storagelösung vor 20 Jahren aus?

Wir hatten damals bereits eine Datenbanklösung für die Metadaten. Der Archivcontent wurde jedoch nicht filebasiert aufbewahrt, sondern noch auf Kassetten und Tonbändern.

Welche Herausforderung gab es in den letzten 20 Jahren in Bezug auf die Storagetechnologie?

Das war der Umstieg von der kassetten- auf die filebasierte Archivierung und die damit verbundene qualitativ hohe und sichere Digitalisierung von etwa 100 000 Stunden Video- und Audiomaterial.

In den vergangenen Jahren hat sich der Storage-Markt verändert. Welchen Einfluss hatten diese Veränderungen auf die Technologie, die Sie beim SRF-Archiv verwenden?

Da unsere Systeme langfristig ausgelegt sind, machen wir nicht alle Storagetrends mit. Bei Lifecycle-Ersatz wird aber jeweils in Betracht gezogen, ob sich eine neue Storagetechnologie besser eignet, als die aktuell verwendete.

Gewandelt haben sich auch die Ansprüche an ein System, etwa an den Energieverbrauch. Inwiefern ist Energieeffizienz im SRF-Archiv ein Thema?

Die Hardware des Archivsystems wird nach Ablauf ihres Lifecycles durch neue Elemente ersetzt. Neue Server und Speicher der gleichen Klasse sind energieeffizienter. Zudem wird bei der Beschaffung darauf geachtet, dass die Leistungsstärke der Geräte nur so hoch wie nötig ist.

Ausser der Storagetechnologie verändern sich auch Audio- und Videoformate. Wie oft stellen Sie die verwendeten Dateiformate um?

Wir haben bislang noch nie Files konvertiert. Unser Grundsatz ist, dass wir die Files direkt im jeweiligen Format archivieren, in dem sie produziert worden sind. Seit Bestehen des aktuellen Archivsystems FARO – seit 2009 – sind jedoch zusätzliche Formate für HD und UHD hinzugekommen.

In Ihrem Archiv gibt es eine grosse Menge analoger Dokumente, die jetzt digitalisiert werden. Wie weit sind Sie in diesem Prozess?

Dieser Prozess ist sehr weit fortgeschritten, in den letzten gut 15 Jahren wurde der überwiegende Teil der analogen audiovisuellen Dokumente digitalisiert. Dies betrifft die grossen Archive in den Radiostudios Bern, Zürich und Basel sowie das Fernseharchiv am Leutschenbach. Diese grossen Projekte befinden sich in der Endphase, geschätzt sind heute bereits über 90 Prozent unserer Eigenproduktionen digital verfügbar. Einige wenige Kleinprojekte werden noch zwei, drei weitere Jahre laufen.

Gab es hinsichtlich Storage oder Digitalisierung eine Entscheidung, die Sie heute anders treffen würden?

Nicht wirklich. Bei gewissen Digitalisierungsprojekten waren wir sehr früh unterwegs, auch im europäischen Vergleich. Das führte etwa bei der robotergestützten automatischen Digitalisierung zu einer Eigenentwicklung mit entsprechenden Kinderkrankheiten. Der Vorteil aber ist: Wir sind heute schon sehr weit mit der Digitalisierung und sehen, dass das Archiv dadurch äusserst intensiv genutzt wird, weil digitaler Content einfacher und schneller gefunden und im medialen Produktionsalltag genutzt werden kann.

Wann wird die Digitalisierung des Archivs abgeschlossen sein?

Das Gros der Digitalisierungsarbeiten von physischen Trägern auf Files wird schätzungsweise Ende 2021 abgeschlossen sein. Dann folgen noch kleinere Projekte für Spezialbestände. Was auch immer mal wieder vorkommt: Früher erfolgte Digitalisierungen von SD-Material werden in höherer Auflösung nochmals vorgenommen.

Welche Wünsche haben Sie an Hersteller von Storagelösungen?

Sie sollten hochperformant, verlässlich, skalierbar und preiswert sein.

Webcode
DPF8_183335