May 09, 2024
Pager Duty CPO: Ausgereifter (automatisierter) digitaler Betrieb verhindert Vorfälle
Die neuesten Trends in der Softwareentwicklung vom Computer Weekly Application Developer Network. Dies ist ein Gastbeitrag für das Computer Weekly Developer Network, der von Sean Scott in seiner Eigenschaft verfasst wurde
Die neuesten Trends in der Softwareentwicklung vom Computer Weekly Application Developer Network.
Dies ist ein Gastbeitrag für das Computer Weekly Developer Network, verfasst von Sean Scott in seiner Funktion als Chief Product Officer (CPO) bei PagerDuty – das Unternehmen ist bekannt für seine Real-Time Operations-Plattform, die Maschinendaten und menschliche Intelligenz integriert, um die Sichtbarkeit zu verbessern und Agilität in allen Organisationen.
KI-gestützte Automatisierung spielt in defensiveren IT-Umgebungen mit Blick auf Risiken, Arbeitskräftemangel, Unterbrechungen der Lieferkette und Sicherheit eine entscheidende Rolle – sie hilft, indem sie eine effiziente Ereignisweiterleitung vorantreibt, Prozesse sichert, arbeitsintensive manuelle Aufgaben reduziert und die Sicherheit verbessert und das Kundenerlebnis.
Um jedoch eine KI-gestützte Automatisierung zu ermöglichen, benötigen Unternehmen digital ausgereifte Abläufe, um die Automatisierung von Vorfällen zu implementieren, um isolierte Sicherheits- und IT-Abteilungen zu verbinden und gleichzeitig für verbesserte Unternehmenssicherheit und optimierte Arbeitsabläufe zu sorgen. Wie schaffen wir das also und erreichen eine bessere Zukunft?
Scott schreibt vollständig wie folgt…
Durch die Automatisierung des Vorfallmanagements, beispielsweise der Erkennung und Priorisierung, verkürzt die Automatisierung die Zeit, die für die Reaktion und Lösung von Vorfällen benötigt wird, reduziert menschliche Fehler und sorgt für eine höhere Genauigkeit beim Vorfallmanagement.
Die Automatisierung von Vorfällen verschafft den IT-Teams außerdem mehr Zeit, reduziert den Zeit- und Stressaufwand für manuelle Aufgaben und verringert so das Burnout und die Fluktuation der Mitarbeiter. Dadurch können sich IT-Teams auf wichtige Innovationen konzentrieren, was besonders in Zeiten, in denen weniger Unternehmensbudget zur Verfügung steht, von entscheidender Bedeutung ist.
Trotz des Nutzens eines automatisierten Vorfallmanagements sind manuelle Aufgaben in vielen Organisationen nach wie vor üblich. Eine von Forrester durchgeführte Studie ergab, dass Fachleute für Anwendungsbereitstellung und -bereitstellung „immer noch ständig mit der Anzahl manueller Aufgaben und dem Arbeitsvolumen überfordert sind“.
In unserem neuesten State of Digital Operations Report stuften 14 % der Befragten ihre Teams als „manuell“ oder „reaktiv“ ein, und neun von zehn leitenden IT- und Entwicklungsleitern lehnten aktuelle ITOps-Ansätze ab und stellten fest, dass Teams fast die Hälfte ihrer Zeit mit der Bearbeitung verbringen mit Vorfällen statt mit Innovationen, was einem finanziellen Schaden von über 3 Millionen US-Dollar pro Unternehmen und Jahr entspricht.
Arbeiter nutzen eine Vielzahl von Überwachungstools, was einen hohen Verwaltungsaufwand mit sich bringt. Regelkonfigurationen müssen beibehalten werden, was den Aufwand für die Verarbeitung von Ereignisdaten erhöht und die Daten über mehrere isolierte Systeme hinweg organisiert werden müssen.
Betroffen sind vor allem die mittlere Zeit bis zur Lösung (MTTR) und die mittlere Zeit zwischen Vorfällen (MTBI), da isolierte Incident-Response-Systeme und manuelle Prozesse die Digital-Ops-Teams belasten. Dies führt zu einem Teufelskreis aus hoher Arbeitsbelastung, Mitarbeiterabwanderung und schlechter Leistung. Die Umfrageteilnehmer im Bericht „Our State of Digital Operations“ erläuterten einige der qualitativen Auswirkungen, die die höhere Fluktuation auf sie und ihre Teams hatte. Zu ihren Antworten gehörten „mehr Bereitschaftsdienste“, „höhere Arbeitsbelastung“ und „höhere MTTR“.
Eine große Bedrohung für die Sicherheit eines Unternehmens ist der Burnout von Mitarbeitern, der auftritt, wenn Incident-Response-Teams manuell reagieren, um Bedrohungen zu bewältigen. Laut dem Global Incident Response Threats-Bericht von VMWare leiden 69 % der Befragten unter Burnout-Symptomen und haben darüber nachgedacht, ihren Arbeitsplatz aufzugeben, und wir sehen dies in unseren Daten. Zunehmende nächtliche Benachrichtigungen für Bereitschaftsdienstmitarbeiter werden dazu führen, dass Mitarbeiter kündigen.
Ebenso kommt der PagerDuty-Bericht zu dem Schluss, dass den Befragten zwischen den Bereitschaftsdiensten und der zunehmenden beruflichen Verantwortung weniger Zeit zum Ausruhen eingeräumt wird. Es wurde außerdem festgestellt, dass überlastete und ausgebrannte Einsatzkräfte in allen Branchen und Umsatzsegmenten die Last von Unterbrechungen außerhalb der Geschäftszeiten tragen.
Die Studie ergab außerdem, dass Unternehmen jeder Größe und aller Branchen schlecht auf Vorfälle reagieren, ein Problem, das durch manuelle Prozesse noch verschärft wird. Alarmgeräusche sind in vielen Unternehmen eine weitere Konstante und lenken die Einsatzkräfte ab, die ihre Zeit produktiver verbringen könnten. Diese Reibung führt unweigerlich zu einem schlechteren Kundenerlebnis, einer schwächeren Architektur und weniger Zeit für Innovation.
Sean Scott, CPO von Pager Duty: Auf dem Höhepunkt seiner Arbeit
Die Pandemie verstärkte die Digitalisierung und machte die Automatisierung unerlässlich, da Unternehmen Kosten kontrollieren und senken, Remote-Mitarbeiter unterstützen und daran arbeiten, die Widerstandsfähigkeit der Lieferkette zu erhöhen. Die Krise brachte auch den Aufschwung der massenhaften Fernarbeit mit sich, was zu parameterlosen Netzwerken und einer weiten Verbreitung persönlicher Geräte führte, was zu Risiken und Komplexität für IT-Teams führte.
Verteilte Arbeitskräfte und freiberufliche Entwickler haben ebenfalls zu erhöhten Sicherheitsbedenken geführt. Chris Gardner, Vizepräsident und Forschungsdirektor von Forrester, prognostiziert, dass das Wachstum von Low-Code und Bürgerentwicklung im Jahr 2023 zu mindestens einer gravierenden Sicherheitsverletzung führen wird, da viele Unternehmen keine Governance-Richtlinien für die Bürgerentwicklung festgelegt haben.
Nach Corona sind Investitionen in KI der nächsten Generation von entscheidender Bedeutung, um die Sicherheit zu erhöhen und Aufgaben zu automatisieren. Laut einer von Forrester durchgeführten UiPath-Studie werden fast 50 % der Unternehmen weltweit die Einführung von Robotic Process Automation aufgrund des COVID-19-Drucks verstärken und RPA zur Unterstützung sowohl des Backoffice als auch der Remote-Mitarbeiter einsetzen. In der Post-Covid-Ära verteilter Arbeitskräfte sind Lösungen zur Automatisierung von Vorfällen, die Zusammenarbeit und Sicherheit unterstützen, von entscheidender Bedeutung geworden.
Die Automatisierung von Vorfallreaktionsprozessen ermöglicht Effizienz, Genauigkeit und schnellere Reaktionszeiten, was zu einem besseren Schutz vor sich entwickelnden Cyber-Bedrohungen und geringeren Kosten führt. Laut der neuesten IBM-Studie „Cost of a Data Breach Study“ sparen Unternehmen, die Sicherheits-KI und -Automatisierung vollständig eingeführt haben, 65,2 % der Gesamtkosten für Datenschutzverletzungen ein.
Das liegt daran, dass die Automatisierung die Erkennung und Reaktion auf Sicherheitsverletzungen beschleunigt und Sicherheitsteams bei der Behebung von Vorfällen unterstützt. Dabei verwaltet die Automatisierung eine Vielzahl von Sicherheitsaufgaben, darunter:
Maschinelles Lernen, das zusammen mit der Automatisierung eingesetzt wird, ist von entscheidender Bedeutung, da es durch die Analyse von Daten ständig dazulernt, um verdächtige Software- und Informationsmuster zu identifizieren, zum Beispiel Malware in verschlüsseltem Datenverkehr, fragwürdige Online-Ressourcen oder sogar Insider-Bedrohungen, die auf ungewöhnlichem Verhalten basieren. Cyber-Bedrohungen erfordern eine kontinuierliche Analyse von Millionen von Datenpunkten und die Geschwindigkeit des maschinellen Lernens ermöglicht automatisierte Reaktionen, die sich in Echtzeit an eine dynamische Bedrohungslandschaft anpassen.
AIOps-Lösungen liefern Informationen, automatisieren und zentralisieren die Orchestrierung von Ereignissen und die Lärmunterdrückung und können Unternehmen dabei helfen, 44 % weniger Vorfälle zu verursachen. Dies spart Zeit und ermöglicht es den Teams, sich auf neue Produkte zu konzentrieren, die dem Unternehmen einen Wettbewerbsvorteil verschaffen. Intelligente Automatisierungstechnologien sind daher wirtschaftlich sinnvoll. Laut einem Analystenbericht von Futurum Research haben mehr als die Hälfte der Unternehmen intelligente Automatisierung eingeführt, da Robotic Process Automation (RPA) und KI zu Mainstream-Geschäftslösungen werden.
Die Lösung liegt nicht nur in der neuesten Technologie, sondern auch in einer Kultur der Investition in DevOps. Der State of Digital Operations Report ergab, dass Investitionen in DevOps es Teams ermöglichen, das Wachstum ihrer betrieblichen Reife zu beschleunigen. Im Gegenzug werden die Arbeitszeiten konsistenter und die Burnout-Raten steigen. Diese betriebliche Reife korreliert mit einer gleichmäßigeren Arbeitsverteilung im Team und einer effizienteren Reaktion auf Vorfälle.
In einem Markt, in dem Investitionen schwanken können, müssen wir uns kontinuierlich konzentrieren und kontinuierlich verbessern, um mit der wachsenden Organisations- und Systemkomplexität Schritt zu halten. Automatisierung hilft Sicherheitsteams dabei, ihre Reaktionsprozesse anzupassen, um schneller auf die sich entwickelnde Bedrohungslandschaft zu reagieren, indem Bedrohungsinformationen in Echtzeit bereitgestellt werden . Dies reduziert Reaktionszeiten und Arbeitsaufwand und verbessert gleichzeitig die Effizienz der Incident-Response-Teams.
Durch die Automatisierung der Triage und Untersuchung von Vorfällen können Teams die Ursache von Vorfällen schnell identifizieren. Dies bedeutet weniger Zeitaufwand für manuelle Aufgaben, weniger Burnout und Mitarbeiterabwanderung und mehr Zeit für die Entwicklung wirksamer Reaktionsstrategien. Darüber hinaus unterstützen automatisierte Incident-Response-Workflows die Konsistenz des Incident-Response-Prozesses, reduzieren menschliches Versagen und unterstützen das Kundenerlebnis.
Obwohl neue und automatisierte Prozesse spannend sein können, ist es wichtig, den menschlichen Faktor nicht zu vernachlässigen. Fachwissen und Urteilsvermögen sind ein wertvolles Werkzeug im Incident-Response-Toolkit und es ist wichtig, in DevOps- und Sicherheitsschulungen zu investieren.
Nach Corona können wir mit den richtigen internen Supportstrukturen ein perfektes Gleichgewicht zwischen menschlichem Fachwissen und Automatisierung erreichen, wobei Ersteres einen entscheidenden Unterschied für die Kunden darstellt.