De gevolgen van de stroomstoring die Amazon in de nacht van zondag op maandag trof na blikseminslag, kunnen nog 24 tot 48 uur merkbaar zijn. Nog steeds zijn niet alle sites weer online. In sommige gevallen is ook data verloren gegaan.
Hoewel Amazon direct aan de slag is gegaan met het verhelpen van de storing, blijkt dat dit aanzienlijk langer duurt dan verwacht. Hoewel de storing zondagavond rond 20.00 uur optrad, bleek dat 12 uur later nog niet alle instances van de Elastic Compute Cloud van Amazon weer in de lucht waren. Oorzaak lijkt een opeenstapeling van problemen te zijn.
De stroomstoring ontstond nadat een transformatorhuisje van het Amazon-datacenter in Dublin werd geraakt door blikseminslag. Door de inslag ontstond een explosie, gevolgd door brand. Hoewel een stroomonderbreking doorgaans wordt overgepakt door een noodgenerator, bleek dat de impact zo krachtig was geweest dat ook het controlesysteem van de stroomfases werd lamgelegd. Dit systeem zorgt ervoor dat de noodgenerator wordt gesynchroniseerd. Zonder deze fasesynchronisatie kunnen generators niet automatisch worden ingeschakeld, waardoor een handmatige actie was vereist.
Niet alleen kostte het veel tijd om alle volumes handmatig te herstellen, ook bleek de beschikbare schijfruimte een probleem. Voor het herstellen van de volumes moest Amazon een extra kopie van alle data maken, waardoor nagenoeg alle beschikbare opslagcapaciteit volliep en het herstelproces extra werd vertraagd.
Gedurende de dag heeft Amazon extra opslag toegevoegd om dit probleem te ondervangen. Hoewel de cloudaanbieder stelt dat het leeuwendeel van de volumes gedurende de dag weer wordt hersteld, schat het bedrijf dat het 24 tot 48 uur zal duren voordat het hele proces is afgerond.
Naar verwachting zal niet iedere klant de storing zonder verlies van data kunnen uitzitten. In enkele gevallen kwamen Elastic Block Storage-servers zonder stroom te zitten voordat de gegevens fatsoenlijk waren weggeschreven. In die gevallen zal Amazon een snapshot van een herstelkopie terugzetten, die dus misschien niet helemaal actueel is.