Microsoft-Cloud torpediert sich selbst
Die Gründe für den großflächigen Ausfall von Microsoft-Cloud-Diensten stehen fest. Offenbar sollte eine externe DDoS-Attacke abgewehrt werden. Die Maßnahmen verstärkten das Problem aber sogar noch.
Inhaltsverzeichnis
Am 30. Juli 2024 hatten einige Kunden weltweit Probleme beim Zugriff auf bestimmte Microsoft-Dienste. Betroffen waren unter anderem Azure App Services, Application Insights, Azure IoT Central, Azure Log Search Alerts, Azure Policy sowie das Azure-Portal selbst und einige Dienste von Microsoft 365 und Microsoft Purview. Ein unerwarteter Anstieg der Nutzungsintensität führte dazu, dass die Komponenten Azure Front Door (AFD) und Azure Content Delivery Network (CDN) an Auslastungsgrenzen stießen. Das verursachte zeitweise Fehler, Time-out-Probleme und Latenzspitzen.
Konfigurationsfehler verstärkte DDoS-Angriff auf Cloud
Der Auslöser war ein Distributed-Denial-of-Service -Angriff (DDoS), der die DDoS-Schutzmechanismen von Microsoft aktivierte. Erste interne Untersuchungen von Microsoft deuten jetzt darauf hin, dass ein Fehler in der Implementierung der Abwehrmaßnahmen die Auswirkungen des Angriffs verstärkte, anstatt sie zu mindern und sich so praktisch die Lasten weiter aufschaukelten.
Nachdem Microsoft den eigentlichen Grund für die Lastspitzen erkannt hatte, wurden Netzwerk-Konfigurationsänderungen zur Unterstützung der DDoS-Schutzmaßnahmen implementiert und ein Failover auf alternative Netzwerkpfade durchgeführt, um Entlastung zu schaffen. Die anfänglichen Netzwerkänderungen milderten dem Konzern zufolge die meisten Auswirkungen im Tagesverlauf erfolgreich ab.
BSI-Chefin Plattner: Firmen sollten 20 % des IT-Budgets für Cybersecurity vorsehen
Cloud-Fehlerbehebung: America last
Die Fehlerbehebung wurde zuerst in den Regionen Asien-Pazifik und Europa durchgeführt. Nachdem bestätigt wurde, dass dieser Ansatz die unerwünschten Nebeneffekte der ursprünglichen Maßnahmen gegen die DDoS-Attacke erfolgreich beseitigte, wurde er in Nord- und Südamerika ausgerollt. Gegen Abend normalisierte sich die Lage zusehends – nach Überwachung des Verkehrs und der Dienste, um sicherzustellen, dass das Problem vollständig behoben war, erklärte Microsoft den Vorfall danach für abgeschlossen. Einige auf der Azure Cloud aufsetzende Dienste brauchten jedoch länger, bevor sie wieder verfügbar waren.
Microsoft will jetzt die Ursachen für den Vorfall genau untersuchen und analysieren. Nach Abschluss, normalerweise innerhalb von 14 Tagen, soll ein endgültiger Bericht mit zusätzlichen Details und Erkenntnissen veröffentlicht werden.
Cloud-Ausfälle in Deutschland
Dass Cloud-Ausfälle keinesfalls selten sind, zeigt eine repräsentative Umfrage des Digitalverbands Bitkom. Demnach nutzen derzeit 81 % der Unternehmen in Deutschland Cloud-Dienste. 39 % der Firmen berichten von einzelnen Ausfällen ihres Cloud-Dienstleisters. Lukas Klingholz, Cloud-Experte beim Bitkom, rät: „Für den Fall der Fälle sollte man aber im Rahmen einer Cloud-Strategie Vorkehrungen treffen.“
Schärfere Maßnahmen gegen veränderte Cyberangriffe
So reagieren Unternehmen auf Cloud-Störungen
Genau das haben praktisch alle Unternehmen, die von Cloud-Störungen betroffen waren (99 %), getan und einen Notfallplan erstellt. 48 % der Firmen haben ihre Cloud-Verträge nachverhandelt. 37 % haben nach solchen Störungen und Ausfällen auf Multi-Cloud umgestellt, um so zusätzliche Cloud-Infrastruktur verfügbar zu machen. Dabei werden Cloud-Dienste von unterschiedlichen Anbietern bezogen. 10 % der Betroffenen haben aus Störungen bzw. Ausfällen Konsequenzen gezogen und danach den Cloud-Anbieter gewechselt.
Trotz Microsoft-Vorfall: Cloud-Dienste meist zuverlässig
Trotz gelegentlicher Störungen gelten Cloud-Dienste heute als zuverlässig. So haben 55 % der Unternehmen in der Umfrage angegeben, keinerlei Probleme zu haben. „Cloud-Anbieter können ihre Infrastruktur in aller Regel sehr viel ausfallsicherer gestalten, als dies die IT-Abteilungen einzelner Unternehmen können“, sagt Klingholz. Die Zuverlässigkeit vieler Cloud-Angebote reiche nahe an 100 % heran.