Systemadministration auf dem nächsten Level

AIOps – Artificial Intelligence für IT-Operations

Uhr

Die modernen IT-Technologieumgebungen sind zu komplex geworden, um sie noch mit traditionellen Methoden zu überwachen und zu steuern. Die schleichende Umstellung auf Multi-Cloud-Umgebungen, Microservices, Docker, Kubernetes und das rasche Wachstum der Datenmengen erzeugen eine Komplexität, der die Systemadministratoren in IT-Abteilungen immer seltener gewachsen sind.

Die Verfügbarkeit, Performance und Sicherheit ist in einem digitalen Unternehmen eine existenzielle Notwendigkeit. Ohne einen völlig neuen Ansatz reagieren IT-Teams nur noch, anstatt proaktiv den zunehmenden Innovationsdruck zu unterstützen. Artificial Intelligence for IT-Operations (AIOps) ist so ein Ansatz, den gemäss Gartner bis 2022 40 Prozent aller grossen Firmen verwenden werden, um gros­se Daten- und maschinelle Lernfunktionen zu kombinieren und um damit Überwachungs-, Service-Desk- und Automatisierungsprozesse zu unterstützen und teilweise zu ersetzen. Heute beschäftigen sich gerade mal 5 Prozent damit.

Was ist AIOps?

Der Begriff AIOps wurde von Gartner bereits im Jahr 2014 geprägt. Die offizielle Definition lautet: «AIOps platforms utilize big data, modern machine learning and other advanced analytics technologies to directly and indirectly enhance IT-Operations (monitoring, automation and service desk) functions with proactive, personal and dynamic insight. AIOps platforms enable the concurrent use of multiple data sources, data collection methods, analytical (real-time and deep) technologies, and presentation technologies.»

AIOps hat sich aus der Notwendigkeit entwickelt, die hoch anspruchsvollen Big-Data und Advanced-Analytics-Lösungen mit adäquaten Mitteln zu überwachen und zu steuern, weil die klassischen Ampelsysteme sowie die vielen manuellen Interventionen im Betrieb nicht mehr genügen. AIOps kann mit intelligenter Datenkorrelation und dynamischen Trendanalysen die gesuchten Informationen für schnelle und sichere Entscheidungen herausfiltern, was mit klassischen Methoden allein nicht mehr möglich ist.

Was ändert sich für IT-Operations?

In traditionellen IT-Betriebsmodellen basiert alles auf einer alle Daten umfassenden Konfigurationsdatenbank, einer CMDB als zentrale Informationsdrehscheibe. Diese CMDB ist jedoch nicht mehr an die Komplexität heutiger dynamischer und sich ständig wandelnder IT-Umgebungen angepasst. In dieser neuen Welt wird das Bereitstellen eines CMDB-zentrierten Betriebsmodells zu einer schier unlösbaren Aufgabe. Nicht nur hinsichtlich der Kosten, sondern auch der Zeit und Ressourcen, um die wichtigen Daten abzugleichen und zu aktualisieren. Es gibt zwar Data-Discovery-Lösungen, die sich integrieren lassen. Diese sind jedoch in der Regel eher statische Plattformen in dem Sinne, dass es in ihrer Existenz nur um das Erkennen von Assets geht und keine zusätzlichen Funktionen verfügbar sind.

Mit AIOps steht nun ein neuer Ansatz für das IT Operation Management bereit, der die CMDB nicht mehr ins ­Zentrum, sondern an die Peripherie stellt. Algorithmen, maschinelles Lernen und Echtzeitanalyse stehen neu im Mittelpunkt. AIOps verwendet eine Kombination verschiedener AI-Strategien, einschliesslich Datenausgabe, Aggregation, Analyse, Algorithmen, Automatisierung und Orches­trierung, maschinelles Lernen und Visualisierung. Die meisten dieser Technologien sind heute einigermassen klar definiert und ausgereift.

Um AIOps drehte sich auch der Frühlingsevent von Eurocloud Swiss. Lesen Sie hier, was die Besucher sonst noch erfuhren.

In einer AIOps-Umgebung benötigen die Mitarbeiter von IT-Operations andere Fähigkeiten, um die Arbeiten der Maschinen zu überwachen und nicht mehr bloss, die Arbeit selbst durchzuführen. IT-Operations-Mitarbeiter müssen ein ausreichendes Verständnis dafür haben, wie maschinelle Lernanalysen funktionieren. Wenn sie die Kontrolle an die Maschine übergeben, können sie prüfen, wie sich diese automatisierte Steuerung entwickelt und ihre Aufgabe erfüllt. Mit AIOps wechselt IT-Operations von einem manuellen Prozess zu einem Auditing- und Anpassungsprozess, bei dem das System entsprechend den Änderungen in der Umgebung optimiert wird, die die Algorithmen der Maschinen lernen müssen.

IT-Operations-Teams übernehmen bei anwendungszentrierten Infrastrukturen, DevOps und agiler Softwareentwicklung zunehmend die Verantwortung für die Lösung von Applikationsproblemen, mit denen Softwareentwickler zuvor beschäftigt waren. IT-Operations müssen jetzt auch die Sprache der Entwickler sprechen lernen und Anwendungstechnologien wie Microservices, Container und CI/CD verstehen, um die richtige Methode zur Messung ihrer Auswirkungen auf das Service-Ökosystem zu bestimmen.

Welche Einsatzgebiete eröffnen sich?

Gerade im Bereich Verfügbarkeit und Performance bietet AIOps wertvolle Unterstützung, indem Nutzer- und Systemverhalten besser und schneller analysiert und mit entsprechenden Workload-Anpassungen reagiert werden kann. Heute bestehen Überwachungslösungen oft aus fragmentierten Monitoring-Tools in den Bereichen Netzwerk, Infrastruktur oder Applikationen. Manchmal gibt es sogar Korrelationslösungen mit automatisierten Empfehlungen, jedoch selten aus einer integrierten IT-Servicesicht. Der zunehmenden Dynamik und Modularität moderner IT-Umgebungen genügen diese Lösungen nicht mehr.

Sicherheit ist zudem ein weiterer Aspekt im IT-Operations-Umfeld von digitalen Unternehmen. Es ist wichtig zu verstehen, was ein Sicherheitsereignis im operativen Kontext ist und wie darauf reagiert werden muss. Mit dem Einsatz von AIOps wird ein solches Ereignis wie eine Denial-of-Service-Attacke oder Ransomware-Angriffe wahrscheinlich schneller durch Machine Learning erkannt. Zu wissen, wie man sie als Sicherheitsfehler und nicht als einfacher Betriebsfehler identifiziert und entsprechend darauf reagiert, ist eine kritische Fähigkeit moderner IT-Organisationen.

Wie geht man bei der Implementierung von AIOps vor?

Wichtig ist, dass sämtliche Daten aus den Bereichen IT-Service-Management, IT-Operations-Management und IT-Automation als der Big-Data-Datentopf für AIOps betrachtet werden kann. Möglichst sämtliche Daten müssen bekannt und in Betracht gezogen werden können, um das Verhalten eines Systems überwachen zu können. Eine Übersicht über all diese Daten ist daher in der Regel ein erster wichtiger Schritt, um zu verstehen, wo welche Informationen gefunden werden können.

Es geht bei der Implementierung von AIOps nicht da­rum, die bestehenden Werkzeuge und Tools abzulösen. Letztlich muss AIOps ein System bilden, in dem Datenströme frei von mehreren IT-Datenquellen in eine grosse Datenplattform fliessen können, dass Daten bei der Aufnahme analysiert und mit Daten aus anderen Quellen und Typen laufend nachbearbeitet werden können. Es kann aber davon ausgegangen werden, dass in den nächsten Jahren AIOps-Lösungen auf dem Markt kommen, die integrierte Funktionalitäten bereits beinhalten und nicht mehr auf die herkömmlichen Tools zurückgegriffen werden muss.

Eigenständiges Machine Learning wird verwendet, um die Analysen und Algorithmen zu verwenden und zu modifizieren und auf Basis der Erkenntnisse automatisierte Workflows auszulösen. Das AIOps-System muss sich anpassen und reagieren können, wenn sich Datenmengen, -typen und -quellen ändern.

Folgende Schritte empfehlen sich für eine erfolgreiche Implementierung von AIOps:

  1. Trennen von Hype und Realität: Lernen und verstehen, was AI und Machine Learning ist und wie dies im IT-Operations-Umfeld helfen kann.

  2. Einführung der Technologie in kleinen, sorgfältig abgestimmten Phasen, um den Wert der AIOps-Bereitstellung zu demonstrieren und Risiken zu mindern.

  3. Inventar über alle vorhandenen Daten, Logs und Systeme erstellen. Es muss eine richtige Einstellung hinsichtlich Wichtigkeit und Kritikalität der vorhandenen Daten im IT-Operations-Team erreicht werden, die später in die Algorithmen der AIOps-Plattform eingelesen werden.

  4. Konkrete Use Cases erstellen für heute bekannte Frage- und Problemstellungen (z. B. lange Ursachenanalyse, grosses Störungsaufkommen, Performance-Probleme).

  5. Verständnis und Klarheit über das «System of Record» gewinnen.

  6. Evaluation und Auswahl einer AIOps-Plattform. Die Plattformen müssen Informationen aus unterschiedlichen Quellen und herstellerneutral verarbeiten können. Sie müssen in der Lage sein, aktuelle wie auch historische Daten mit verschiedenen Echtzeit-Monitoring-Systemen zu kombinieren und mittels Machine Learning zu analysieren.

  7. Erstellen eines praktischen, stufenweisen Umsetzungsplans auf Basis einer klaren Strategie.

  8. Learning by doing. Der Weg ist das Ziel. Wichtig ist, dass die Datenmodelle und Datenquellen, die im AIOps-Lösungsansatz verwendet werden, immer wieder neu bewertet werden.

Jeder Einzelne in der Organisation, sei es der IT-Operations-Manager, der Systemadministrator oder Service-Desk-Mitarbeiter – alle müssen sich mit der Veränderung vertraut machen. Es bieten sich auch enorme Möglichkeiten für all jene, die Veränderung als Chance erkennen. Die Zukunft klopft nicht an. Sie tritt ein.

Die in den Swico integrierte IG Eurocloud Swiss bezweckt die Förderung von Cloud Computing in Theorie und Anwendung und den ­Einsatz von Technologien, Konzepten und Methoden und verwandten Themen in der Schweiz. Sie vertritt die ­Interessen der Cloud-Computing-Community in der Schweiz und fördert den Austausch mit anderen Personen sowie ­nationalen und internationalen Organisationen. Sie bietet den Mitgliedern eine umfassende Schweizer Plattform für den nationalen und internationalen Wissens- und Erfahrungsaustausch.

Webcode
DPF8_126147