Microsoft heeft de problemen met SkyDrive, Hotmail en Outlook opgelost. De oorzaak lag bij een snelle stijging van de temperatuur in een datacenter, na een mislukte firmware-update bij een centraal onderdeel. De storing duurde uiteindelijk 16 uur.
Woensdagochtend meldde Microsoft op zijn statuspagina dat gebruikers problemen konden ervaren bij de toegang tot Outlook.com en Hotmail, terwijl ook onlineopslagdienst SkyDrive enige tijd onbruikbaar was. De problemen zijn inmiddels verholpen en Microsoft geeft op zijn Outlook Blog details over wat er mis ging.
"In de namiddag van 12 maart voerden we zoals gebruikelijk een firmware-update uit bij een core-onderdeel van een van onze datacenters", schrijft de Nederlander Arthur de Haan, die bij Microsoft de functie vice-president van de Windows Live Test and Service Engineering-afdeling bekleedt. Het zou om een update gaan die voorheen nooit tot problemen leidde, maar die nu onverwacht fout ging.
"De fout zorgde voor een snelle en substantiële stijging van de temperatur in het datacenter", aldus De Haan. Door de hittestijging werden bij veel servers in het rekencentrum automatisch beveiligingsmaatregelen in werking gezet, waarna toegang tot de Hotmail- en Outlook-postvakken niet meer mogelijk was. Ook konden andere delen van Microsofts infrastructuur de werking niet overnemen.
Een van de redenen waarom de storing zo lang duurde was dat menselijk ingrijpen noodzakelijk was, iets wat volgens De Haan 'niet de norm' bij dergelijke diensten van Microsoft is. Microsoft zegt niet hoeveel gebruikers getroffen werden door de storing, maar niet iedere gebruiker had er last van. Het was de derde grote storing in een halfjaar die Hotmail- en Outlook.com-gebruikers treft en het gebeurde op een moment dat Microsoft Hotmail-gebruikers automatisch overzet naar de Outlook-maildienst.
Microsoft zegt niet hoeveel gebruikers getroffen werden door de storing, maar niet iedere gebruiker had er last van.
[Reactie gewijzigd door Teijgetje op 14 maart 2013 11:54]
Het gaat dus om een update die eerder succesvol was uitgevoerd, maar dit keer kennelijk verkeerd liep. Je tweede punt klopt dus niet. Verder gaat het om een "core part of our physical plant", dus als antwoord op je derde en vierde vraag: waarschijnlijk is het inderdaad een onderdeel van de airco voorziening. Geen airco -> warmte. Het gaat hier dus waarschijnlijk niet om een onderdeel wat zelf de warmte genereerde.On the afternoon of the 12th, in one physical region of one of our datacenters, we performed our regular process of updating the firmware on a core part of our physical plant. This is an update that had been done successfully previously, but failed in this specific instance in an unexpected way. This failure resulted in a rapid and substantial temperature spike in the datacenter. This spike was significant enough before it was mitigated that it caused our safeguards to come in to place for a large number of servers in this part of the datacenter.
Ik zie je punt hier niet? De koeling van het complete datacentrum had problemen, en ja, in dat datacentrum hingen dan weer Hotmail servers die uit zichzelf afsloten (klaarblijkelijk). Dus ja, de koeling heeft invloed op de werking van Hotmail, net als koeling in het algemeen invloed heeft op de hele werking van het internet.[...]
En zit hun koeling ook gekoppeld aan Hotmail o.i.d.?
Zoals MS aangeeft gaat het om een firmware update die fout ging. Dit kan de hardware in een onbereikbare staat brengen en kan inderdaad een stuk lastiger zijn dan een backup terugzetten.Ik snap dat het wat lastiger kan liggen dan "git reset --hard [hash]", maar een backup terug zetten moet in een een paar uurtjes toch wel te doen zijn?
[Reactie gewijzigd door firest0rm op 14 maart 2013 13:06]
[Reactie gewijzigd door Giftcard op 14 maart 2013 11:24]
[Reactie gewijzigd door SunnieNL op 14 maart 2013 11:32]
Maar als je risico-management 101 toepast, dan hebben ze ofwel met relatief weinig schade een ontwerpfout ontdekt, danwel dat er iets op het meso-niveau verkeerd is gegaan. In het laatste geval kun je denken aan bijv uitgelopen onderhoud van een op het oog ongerelateerd subsysteem (van een redundant systeem). Hoeveel veerboten, kerncentrales, vliegtuigen, etc. zijn op die manier niet in de problemen gekomen/verongelukt?Het lijkt me vreemd te noemen dat een firmware upgrade zorgt voor het volledig opwarmen van je datacenter; de basis uitvoering van een datacenter is zo dat alles via meerdere feeds aangeleverd moet worden, zoals bijv stroom, gekoelde lucht, koel installaties, bekabeling. Microsoft zal de datacenters ook zo ingericht hebben. ...
Op dit item kan niet meer gereageerd worden.
Populair: Xbox E3 2013 Mobiele telefoons Google Sony Microsoft Apple Games Politiek en recht Consoles
© 1998 - 2013 Tweakers.net B.V. onderdeel van De Persgroep, ook uitgever van Computable.nl, Autotrack.nl en Carsom.nl • Hosting door True