Success Story

Swisscom setzt auf Application Performance Monitoring von Brocade

Uhr

Große Banken, Eisenbahnunternehmen und andere Firmenkunden vertrauen auf Swisscom, um unternehmenskritische Applikationen zu hosten. Wenn das Swisscom-Netzwerk zusammenbricht, können Unternehmen ihre Kunden nicht mehr zufriedenstellend bedienen und damit auch keine Gewinne erwirtschaften. Wenn es zum Beispiel bei der Ticket-Applikation der Bahn zu Verzögerungen kommt, wirkt sich das auf alle Fahrkartenautomaten im gesamten Bahnnetz aus. Das führt im schlimmsten Fall dazu, dass tausende Bahnkunden ihre Züge verpassen. Swisscom muss den Geschäftsbetrieb also stets aufrechterhalten und zugleich ausgezeichneten Kundenservice liefern. Um diese beiden Anforderungen zu erfüllen, musste das Unternehmen seine Storage-Networking-Umgebung ausbauen.

(Quelle: Swisscom)
(Quelle: Swisscom)

Swisscom AG

Swisscom ist der größte Telekommunikationsdienstleister der Schweiz. Swisscom bietet Privatkunden, kleinen und großen Unternehmen sowie dem Großhandel eine große Bandbreite an Produkten und Services. Zudem ist das Unternehmen Wegbereiter für neue Technologien wie Cloud und Internet of Things.

Unternehmenskritische Application Performance verbessern

Swisscom unterstützt den unternehmenskritischen Geschäftsbetrieb seiner Kunden durch eine komplexe Storage-Umgebung. Mit der Zeit wuchs die Infrastruktur auf tausende physische und virtuelle Server sowie über 11.000 virtuelle Instanzen, 27.000 Storage Networking Ports und 20 Fabrics an, die sieben Standorte umspannen. Mit mehr als 9 Millionen Gigabytes an bereitgestelltem Speicher wurden die Größe des Netzwerks und die veraltete Storage-Architektur bald zum Problem, denn es war schwierig, mit großen Mengen von On-Demand Application Traffic zurechtzukommen. Das Storage-Team wusste, dass einige Applikationen zu Stoßzeiten hohe Latenzen aufwiesen – bis zu 10 Sekunden für große Datenbankverarbeitungsabfragen. Lange Reaktionszeiten wirkten sich negativ auf die Application Performance aus, erhöhten die Latenz und machten eine wiederholte Übertragung der Daten nötig.

Oft kostete es Tage oder sogar Wochen, bis Swisscom zusammen mit Netzwerk-, Server- und Storageanbietern die Ursache des Problems identifiziert und behoben hatte. Das Swisscom-Team hatte zudem Ziele für die Service Level Agreements (SLA) festgelegt, die nicht immer erreicht wurden. Ohne einen genauen Überblick über alle Pfade und Geräte, durch die Daten fließen, würde sich eine Performance-Verbesserung allerdings schwierig gestalten. Swisscom benötigte deshalb aussagekräftige Erkenntnisse und eine schnelle “Time-to-Insight”, um die SAN Performance für Kundenapplikationen zu verbessern.

Flows analysieren für maximale Performance

Swisscom entschied sich für die Brocade Analytics Monitoring Plattform, um bessere Einsicht in das End-to-End Applikationsverhalten zu erhalten – vom Server bis zum Storage. Die Brocade Analytics Monitoring Platform ist eine speziell angefertigte Storage-Network-Anwendung, die Applications- und Device Level I/O Performance misst und Traffic Behaviour im gesamten Storage Fabric analysiert. Die Plattform operiert in Swisscoms Brocade Gen 5 und Gen 6 DCX 8510 Backbones und Brocade X6 Direktoren mit Brocade Fabric Vision Technologie. Wenn Swisscom soweit ist, auf 32 Gbps/128 Gbps Storage Networking zu migrieren, profitiert das Unternehmen dank der Brocade X6 Direktoren von einer NVM Express (NVMe)-over-Fabrics-Architektur und bahnbrechender VMware-Technologie. Zudem kann Swisscom die Brocade Analytics Monitoring Platform für tiefgreifende Einsicht in die gesamte Infrastruktur nutzen.

Swisscom stellte die Anwendungen der Brocade Analytics Monitoring Plattform zur Verfügung, indem es sie über Analytics Switch Links mit mehreren Brocade DCX 8510 Backbones verknüpfte. Nicht-invasive virtuelle Taps am Rand des Storage- und Serverpfads senden Daten an die Anwendungen für das Application Performance Monitoring. Diese Architektur bietet Flexibilität und Skalierbarkeit, was es Swisscom ermöglicht, das Echtzeit-Monitoring von 60.000 Flows zu intensivieren.

Mit der Brocade Fabric Vision Technology Monitoring and Alerting Policy Suite (MAPS) hat Swisscom für das Storage-Netzwerk Richtlinien für proaktives Application Performance Monitoring erstellt. Das Fabric Performance Impact Monitoring der Fabric-Vision-Technologie erkennt langsame Geräte und alarmiert das Team, sobald Überlastung oder Latenz die kritische Schwelle überschreiten. Die Slow Drain Device Quarantine (SDDQ) der Fabric-Vision-Technologie isoliert langsame Geräte aus dem Netzwerk und beseitigt den Einfluss von Latenz auf andere Traffic Flows. Informationen der Fabric-Vision-Technologie werden verständlich und übersichtlich in den Brocade Network Advisor Dashboards dargestellt, um dem Team einen lückenlosen Überblick über alle Vorgänge im Storage-Netzwerk zu ermöglichen.

 

 

Sofortige Erkenntnisse

Nach nur 10 Minuten wies die Brocade Analytics Monitoring Plattform auf eine große Menge ausstehender I/Os in Storage Ports hin. Zudem erkannte die Plattform, dass viele dieser Ports erheblich überbelastet waren. Diese Erkenntnis lieferte Swisscom die Lösung für das Problem, da Überbelastungen für wesentliche Latenzprobleme verantwortlich sind.

Mit den durch das Application Performance Monitoring erhaltenen Daten konnte das Data-Center-Team Server-to-Storage-Traffic umleiten, um die Performance zu maximieren. Durch das Bewegen und Umlegen von Traffic sind die verschiedenen Storage Arrays besser in der Lage, Daten zu verarbeiten und Workloads zu teilen.

"Die Verbesserungen waren erheblich,“ sagt Jean-Luc Tarik Aslan, Datacenter Architect bei Swisscom. "Wir konnten die Latenz zu Stoßzeiten von 10 Sekunden auf gerade einmal 250 Millisekunden reduzieren. Die Brocade Analytics-Monitoring-Plattform hilft uns dabei, eine lückenlose Application Performance für kritische Anwendungen sicherzustellen und zugleich die Fehlerbehebung zu vereinfachen.“

Früher dauerte es bis zu 30 Tage, um den Ursprung eines Problems zu identifizieren und zu beheben. Durch Brocade Application Performance Monitoring konnte Swisscom die Zeit bis zur Fehlerbehebung um 90 Prozent reduzieren. Zusätzlich wurde das Team auf Probleme aufmerksam, von deren Existenz es zuvor gar nichts wusste. Diese Probleme waren tief in der Infrastruktur versteckt und erhöhten die Latenz oder verkomplizierten die Traffic Flows. Nachdem auch diese Fehler behoben waren, konnte das Swisscom Team seine SLA-Performance-Reporting-Ziele erreichen, was zuvor unmöglich schien.

Bessere Reporting Visibilität

Dank der tiefgreifenden Visibilität der Analytics Monitoring Plattform kann Swisscom das Netzwerk proaktiver als jemals zuvor verwalten. Application Performance Monitoring liefert z. B. die Daten, die das Data-Center-Team benötigt, um Trends auszumachen, Baselines festzulegen und Threshold Settings zu bestimmen.

"Unsere Server- und Storage-Teams wollen ihre Latenz-Reports täglich sehen,“ sagt Herr Aslan. "Wenn das Netzwerk-Team die Reports nicht pünktlich schickt, erhält es kurz darauf eine Menge Anrufe, wo denn die Berichte bleiben. Diese Reports sind unabdingbar, um unsere Service Performance aufrechtzuerhalten.“

Die Reports sind kundenspezifisch und zeigen granulare Latenz- und Performancedaten. Jetzt kann Swisscom regelmäßig an seine Kunden berichten und einen Nachweis für die SLA-Compliance liefern, was die Kundenzufriedenheit erheblich steigert.

Existierende Investments erhalten

Swisscoms Application Performance Monitoring hilft dem Unternehmen, die Kundenzufriedenheit zu verbessern, ohne Server oder Storagesysteme auszutauschen. So konnte das Unternehmen nicht nur sein SAN-Investment bewahren, sondern auch wertvolle Daten für die Geschäftsplanung und Entscheidungsfindung erhalten. Dadurch ist Swisscom auch in der Lage, Ort und Ursache von Latenzen weiterhin genau zu bestimmen. Auch Netzwerk-, Server- und Storageanbieter können Probleme nun schneller lösen, um Swisscom zufriedenzustellen.

Nächste Schritte

Swisscom plant den derzeitigen Einsatz der Brocade Lösung auszuweiten und weitere Brocade Analytics-Monitoring-Platform-Anwendungen in seinen anderen SAN-Umgebungen einzusetzen. Durch unerreichte End-to-End Visibility in seine Storage-Umgebung hat Swisscom mehr Möglichkeiten als je zuvor, um seinen Kunden transparente hochleistungsfähige Services und kompromisslose Zuverlässigkeit zu bieten.

Weitere Informationen erhalten Sie unter http://www.brocade.ch und hier im speziellen zu Application Performance Monitoring: http://www.brocade.com/de/products-services/storage-networking/fibre-channel/analytics-monitoring-platform.html

Webcode
DPF8_24534