Amazon-Störung legt Teile des Internets lahm – Zeichen der Entwarnung
Großer AWS-Ausfall: Fehler in Amazon-Cloud lähmt weltweit Websites, Apps und Tools wie Snapchat, Zoom und Fortnite.
Foto: picture alliance/dpa | Matthias Balk
Eine großflächige Störung bei Amazon Web Services (AWS) hat am Montag zahlreiche Websites, Apps und Cloud-Dienste zeitweise lahmgelegt. Betroffen waren laut dem Unternehmen selbst sowohl eigene Angebote von Amazon als auch Anwendungen Dritter – darunter bekannte Plattformen wie Canva, Snapchat, Fortnite, Slack, Zoom, Duolingo und Perplexity AI.
Nach Angaben von AWS lag der Ursprung der Probleme in der zentralen US-Region US-East-1 (Nord-Virginia), wo es beim Datenbankdienst Amazon DynamoDB zu massiven Fehlerraten kam. In der Folge reagierten auch weitere 29 AWS-Dienste mit Verzögerungen oder kompletten Ausfällen. Auf der AWS-Statusseite hieß es, man habe eine „operational issue“ identifiziert und arbeite an der Behebung. Mittlerweile ist der Fehler behoben, doch noch arbeiten nicht alle Systeme wieder fehlerfrei.
Inhaltsverzeichnis
Aktualisierung 12:40 Uhr: Erste Zeichen der Entwarnung
Am Montagmittag kamen dann erste Zeichen der Entwarnung. „Wir sehen deutliche Anzeichen für eine Besserung“, hieß es auf der AWS-Statusseite. Zuvor hatte Signal-Präsidentin Meredith Whittaker darauf hingewiesen, dass ihr Messenger-Dienst durch eine Störung bei AWS in Mitleidenschaft gezogen ist. „Hey Leute, wir wissen, dass Signal bei einigen von euch gerade nicht läuft. Das scheint mit einem größeren Ausfall von AWS zusammenzuhängen. Bleibt dran“, schrieb Whittaker auf Bluesky.
Um 12:35 Uhr MEZ meldete Amazon, dass das zugrunde liegende DNS-Problem vollständig behoben sei und die meisten AWS-Dienste wieder normal funktionieren. Obwohl die meisten Vorgänge wiederhergestellt sind, kommt es jedoch immer noch zu erhöhten Fehlerraten. Eine Lösung könnte sein, den DNS-Cache zu leeren, so die Verantwortlichen.
Meldung 11:30 Uhr: Fehler bei der DNS-Auflösung als mögliche Ursache
Nach ersten Analysen kam es zu einem Problem bei der DNS-Auflösung des DynamoDB-Endpunkts, was den Datenverkehr zu den betroffenen Servern massiv beeinträchtigte. Diese Art von Fehler kann sich schnell auf zahlreiche andere Systeme auswirken – besonders dann, wenn sie auf zentrale Datenbanken oder Authentifizierungsdienste angewiesen sind.
Wie das Nachrichtenportal The Verge berichtet, führten die Störungen in den USA und Europa dazu, dass sich viele Nutzer*innen nicht mehr bei ihren Konten anmelden oder Cloud-Dienste synchronisieren konnten. Auch Amazon-eigene Dienste wie Amazon Music, Ring, Prime Video oder der Online-Shop Amazon.de reagierten vorübergehend langsamer als gewohnt.
Auf dem Störungsportal allestörungen.de schnellten die Meldungen bereits am Vormittag sprunghaft in die Höhe. Viele Nutzer meldeten Ladefehler, Verbindungsabbrüche oder leere Seiten.
Globale Auswirkungen
Wie Reuters berichtet, spürten auch Finanz-Apps, Online-Shops und Unternehmensportale die Folgen des Ausfalls. Zahlreiche Firmen in den USA, Großbritannien und Deutschland meldeten zeitweise Verbindungsprobleme. Das zeigt, wie stark viele digitale Angebote von der Cloud-Infrastruktur des US-Konzerns abhängen.
AWS gilt als größter Cloud-Anbieter der Welt. Das Tochterunternehmen von Amazon betreibt Rechenzentren in 33 geografischen Regionen und stellt Unternehmen Rechnerleistung, Speicherplatz und Software-Dienste zur Verfügung – unter anderem für Künstliche Intelligenz, Big Data und E-Commerce. Vor allem Start-ups greifen auf AWS zurück, um ihre IT-Kapazitäten flexibel zu skalieren, ohne eigene Server betreiben zu müssen.
Dieser Komfort hat jedoch seinen Preis: Fällt eine zentrale AWS-Region aus, sind schnell Tausende Websites und Anwendungen weltweit betroffen. Bereits frühere Störungen in den Jahren 2021 und 2023 zeigten, dass sich viele Anbieter zu stark auf die US-East-1-Region konzentrieren – jene Region, die auch diesmal das Epizentrum der Probleme war.
AWS arbeitet an Aufklärung
AWS teilte am Vormittag (MEZ) mit, man habe die Ursache lokalisiert und Gegenmaßnahmen eingeleitet. Gegen Abend normalisierten sich die meisten betroffenen Dienste. Eine ausführliche technische Aufarbeitung – ein sogenanntes Post Event Summary – steht bislang noch aus.
Solche Berichte veröffentlicht AWS in der Regel nur bei besonders gravierenden Störungen, wenn ein signifikanter Anteil der Kundinnen und Kunden betroffen war. Darin werden Ablauf, Ursachen und Maßnahmen zur Vermeidung künftiger Ausfälle detailliert beschrieben.
(mit dpa)
Ein Beitrag von: