Der CrowdStrike-Computerausfall 2024 – Teil 3: Lehren und Veränderungen bei CrowdStrike
Der CrowdStrike-Computerausfall 2024 war ein Wendepunkt für das Unternehmen und die gesamte IT-Sicherheitsbranche. Der Vorfall zeigte, dass selbst führende Anbieter durch mangelnde Sicherheitskontrollen und unzureichende Prozesse erhebliche Schäden verursachen können. CrowdStrike stand vor der Herausforderung, interne Abläufe grundlegend zu überarbeiten, während andere Anbieter – wie Microsoft – Maßnahmen einleiteten, um ähnliche Risiken bei eigenen Produkten und Partnern zu minimieren. Dieser Beitrag beleuchtet die Lehren, die CrowdStrike und die Branche aus diesem Vorfall gezogen haben.
CrowdStrikes Reaktion auf den Vorfall
-
Umfassende interne Analysen
- CrowdStrike richtete ein unabhängiges Expertenteam ein, das die Ursachen des fehlerhaften Updates detailliert untersuchte.
- Der Bericht zeigte, dass der Vorfall durch unzureichende Testverfahren und eine fehlende mehrstufige Prüfung der Updates verursacht wurde.
-
Sofortige Verbesserungen
- Einführung eines neuen Release-Management-Prozesses: Updates durchlaufen nun mehrere Stufen automatisierter und manueller Tests.
- Rollout-Strategie: Updates werden zunächst nur an eine kleine Gruppe von Testkunden ausgeliefert, bevor sie weltweit ausgerollt werden.
-
Kommunikation und Transparenz
- CrowdStrike versprach, zukünftige Probleme frühzeitig und offen zu kommunizieren.
- Neue Kommunikationskanäle wurden geschaffen, um Kunden über geplante Updates und potenzielle Risiken besser zu informieren.
Langfristige Änderungen und strategische Neuausrichtung
-
Stärkere Investitionen in Qualitätssicherung
- CrowdStrike verdoppelte das Budget für Testing und Simulationen in realistischen Umgebungen.
- KI-gestützte Testsysteme wurden eingeführt, um komplexe Wechselwirkungen in Unternehmensnetzwerken besser zu simulieren.
-
Kundenorientierung stärken
- Einführung eines Customer Advisory Boards, um Kundenbedürfnisse und potenzielle Risiken besser zu verstehen.
- Aufbau eines erweiterten Support-Teams mit dedizierten Ansprechpartnern für Großkunden.
-
Partnerschaften und Benchmarks
- CrowdStrike begann, sich stärker an Best Practices anderer Anbieter zu orientieren.
- Benchmarks und Vergleichsstudien wurden eingeführt, um die Qualität der eigenen Prozesse kontinuierlich zu messen.
Der Vergleich mit Sophos: Was macht einen Unterschied?
-
Qualitätskontrolle bei Updates
- Während CrowdStrike bis 2024 alle Updates global und gleichzeitig ausrollte, bietet Sophos seit langem eine flexible Update-Strategie mit staged Rollouts und der Möglichkeit für Kunden, Updates zu verzögern oder in Testumgebungen zu prüfen.
- Sophos führt umfassende Tests vor jedem Update durch, um Wechselwirkungen in komplexen Netzwerken frühzeitig zu erkennen und zu beheben.
-
Kundenauswahl und Kontrollmechanismen
- CrowdStrike-Kunden hatten vor dem Vorfall keine Kontrolle über den Update-Prozess – ein entscheidender Unterschied zu Sophos. Sophos bietet Kunden die Möglichkeit, Updates individuell zu planen, in Testumgebungen zu prüfen und nach Bedarf zu verzögern.
-
Proaktive Services und Überwachung
- Sophos kombiniert Sicherheitslösungen mit Managed Services wie Sophos MDR (Managed Detection and Response). Diese Services erkennen Sicherheitsvorfälle nicht nur, sondern reagieren aktiv darauf, bevor kritische Schäden entstehen.
- Ein vergleichbarer Ansatz fehlte bei CrowdStrike, was das Risiko für Kunden erhöhte.
-
Ganzheitliche Sicherheitsstrategie und Erfahrung
- Sophos bringt jahrzehntelange Erfahrung und etablierte Best Practices mit, die in jedem Aspekt der IT-Sicherheit integriert sind.
- CrowdStrike hat sich auf technologische Innovation fokussiert, doch der Vorfall zeigte, dass Innovation ohne erprobte Prozesse zu erheblichen Problemen führen kann.
Ein weiterer Blick: Lehren für die Branche und Microsofts Ansatz
Microsoft und andere Anbieter in der Branche zogen ebenfalls Lehren aus diesem Vorfall. Der CrowdStrike-Computerausfall verdeutlichte, dass technische Fehler bei einem Anbieter globale Auswirkungen haben können, wenn Sicherheits- und Kontrollmechanismen unzureichend sind.
-
Vermeidung zentralisierter Risiken
- Microsoft begann, Richtlinien für Partner zu entwickeln, die sicherstellen, dass Anbieter strenge Sicherheits- und Teststandards einhalten.
- Neue Tools wie Quick Machine Recovery wurden eingeführt, um die Wiederherstellung nach Systemausfällen zu beschleunigen.
-
Erhöhte Standards bei Partnerlösungen
- Als Anbieter von Plattformen wie Azure und M365 überprüft Microsoft die Sicherheitsstrategien von Drittanbietern genauer und fordert klar definierte Notfallprozesse.
-
Best Practices für die Branche
- Der Vorfall hat die Notwendigkeit einer stärkeren Zusammenarbeit zwischen IT-Sicherheitsanbietern verdeutlicht, um Best Practices zu etablieren und Schwachstellen zu minimieren.
Fazit: Ein globaler Weckruf
Der CrowdStrike-Computerausfall 2024 war nicht nur eine Zäsur für CrowdStrike, sondern für die gesamte IT-Sicherheitsbranche. Er zeigte, dass technologische Innovation allein nicht ausreicht – bewährte Prozesse, transparente Kommunikation und eine starke Kundenorientierung sind entscheidend. Während CrowdStrike und Microsoft ihre Lehren ziehen, bleibt eines klar: Kunden sollten Anbieter wählen, die nicht nur technologisch, sondern auch prozessual führend sind.
Im nächsten Beitrag dieser Reihe werfen wir einen detaillierten Blick auf Microsofts Maßnahmen und Tools, die sie entwickelt haben, um solche Vorfälle künftig zu vermeiden.
Kontaktieren Sie uns
Möchten Sie Ihre IT-Sicherheitsstrategie optimieren oder mehr über unsere Lösungen erfahren? Unsere Experten stehen Ihnen zur Seite. Rufen Sie uns an unter +49 6103 9707-500 oder schreiben Sie uns an Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein..