Achtergrondartikel: Wat nou als alle applicaties er drie dagen uit liggen?
Disaster recovery verdubbelt de prijs
Rijdt iemand per ongeluk met zijn vorkheftruck het datacenter binnen, dan zijn de gevolgen daarvan meestal niet te overzien. De operationele processen kunnen er dagen of misschien wel weken uit liggen. Blijken de backup's niet te gebruiken, dan ben je misschien wel permanent out-of-business. Heb je je disaster recovery wel goed geregeld, dan draai je door zonder dat je klanten daar zelfs weet van hebben. Daarvoor moet je dan wel eerst in de buidel tasten.
Als je beheerders vraagt hoe lang het duurt voordat de IT-diensten weer in de lucht zijn na een ramp - denk aan een neerstortend vliegtuig, brand of waterschade - dan gaat dat meestal om dagen en vaak om weken. In veel gevallen komt het helemaal niet meer goed. Dan gaat een bedrijf failliet omdat het zijn processen niet meer kan herstellen. Uit onderzoeken van Gartner en de Universiteit van Wisconsin blijkt dat meer dan veertig procent van de ondernemingen na een ramp niet meer open gaat.
Krijg je je bedrijfsprocessen toch weer op de rit, dan zie je vaak een vertraagde reactie. Uit diezelfde onderzoeken blijkt namelijk dat een derde van de bedrijven die na een ramp door weten te starten, binnen twee jaar alsnog op de fles gaat. Zelf wat kleinere bedrijven blijken niet te overleven als ze een week zonder hun IT-diensten zitten.
Volgens Gartner heeft zestig procent van de Amerikaanse bedrijven geen idee hoe ze na een ramp verder moeten. De collega's van IDC keken naar de Europese bedrijven met een omzet van meer dan honderd miljoen Euro. Daarvan bleek negentig procent geen disaster recovery plan te hebben.
Replicatie
De belangrijkste voorwaarde om verder te kunnen, is natuurlijk dat je gegevens nog beschikbaar zijn en dat je transacties kunt verwerken. Dat betekent dat data en processen gerepliceerd moeten worden. Heb je je storage al gecentraliseerd en je servers gevirtualiseerd - veel bedrijven zijn daar op dit moment mee bezig - dan is dat relatief gemakkelijk om te doen. Ondanks dat je behoorlijk wat extra infrastructuur nodig hebt, kun je voor ruim het dubbele van wat je nu hebt betaald voor storage en servers de hele boel disaster-proof maken en voorzien van een goede backup-faciliteit.
Allereerst zul je je huidige storage natuurlijk moeten copiëren naar een tweede locatie. Dat betekent dat daar een identieke tweede systeem neergezet moet worden. Daartussenin moet een glasvezelverbinding komen te liggen. Ben je een commercieel bedrijf, dan zul je daarvoor moeten betalen. Maar bijvoorbeeld gemeenten, ministeries of grote ondernemingen hebben vaak al een eigen glasvezel-infrastructuur liggen waar gebruik van gemaakt kan worden.
Ritselen
Ook voor de locatie zelf is vaak wel wat te ritselen. Je kunt een bedrijf zoeken dat met hetzelfde probleem bezig is, en daar afspraken mee maken. Dat gebeurt vaak met gesloten beurs. Zelfs publieke en commerciële organisaties weten elkaar te vinden voor het uitwisselen van wat vierkante meters.
Op die tweede locatie kun je een aantal blade-systemen neerzetten als uitwijk. Maar misschien is het wel slimmer om die tweede locatie permanent mee te laten draaien (actief-actief). In dat geval wordt nog eens de helft van het bestaande aantal blades gekocht, en worden die verdeeld zodat op beide locaties driekwart van de initiële hoeveelheid beschikbaar is. Moet één datacenter de operatie overnemen, dan merk je dat wel aan de beschikbare capaciteit maar hoef je niet handmatig een fail-over scenario in gang te zetten.
Backup
Replicatie alleen is echter niet genoeg. Daarmee redt je het nog wel als iemand je rekken binnenrijdt, de airco leeg loopt of de inmiddels verouderde brandblus-installatie af gaat. Maar zijn je systemen besmet met een virus of heeft iemand belangrijke gegevens weggegooid, dan heb je toch echt een backup nodig. Gaat in de gegevens op de ene locatie iets mis, dan wordt dat immers gewoon naar de andere locatie gerepliceerd.
Volgens Clemens Esser, Enterprise Storage and Availability Consultant bij HP, wordt veertig procent van alle downtime veroorzaakt door de applicaties, nog eens veertig door mensen en processen, en twintig door de hardware. Die eerste tachtig procent kun je alleen repareren met een goede backup.
Een veelgebruikte configuratie is dan ook om beide replica's kruiselings te backuppen. De backup van de ene replica komt op de andere locatie terecht en andersom. Om de backup-tijd te verkleinen, wordt daarbij meestal gebruik gemaakt van een snapshot. De backup-server kan dan daarmee aan de slag terwijl de productie alweer verder draait.
Wat nou als...?
Met alle extra infrastructuur, kost een dergelijke configuratie ruim het dubbele van een enkelvoudige storage-oplossing. Voor een omgeving met in eerste instantie 10 Tbyte aan opslag en 16 blades ben je bijvoorbeeld 65 duizend Euro kwijt. Een gerepliceerde omgeving zoals zojuist beschreven, kost 180 duizend. Gaat het om een grotere configuratie, dan blijft die 50 duizend extra ongeveer gelijk.
Dat geld gaat bijvoorbeeld op aan de vijf tot tien procent extra ruimte die de storage nodig heeft voor de backup-software. Heb je bijvoorbeeld twee vierkante meter aan extra housing nodig, dan kost dat tweeduizend Euro per maand. En er zijn natuurlijk de dataverbindingen en de backup-systemen. Die extra kosten worden voor een groot deel gecompenseerd door de verdeling van de blade-servers over de twee locaties. Bovendien kun je natuurlijk meer korting bedingen als je meer koopt.
Of een dergelijke investering uiteindelijk gerechtvaardigd is, hangt af van de waarde die je op deze manier probeert te beschermen. Daarbij moeten vooral veel vragen worden gesteld in de trant van "Wat nou als...?" Wat gebeurt er bijvoorbeeld met jouw bedrijf als alle applicaties drie dagen uit de lucht zouden zijn?
Menselijke fouten
Disaster recovery stopt echter niet bij de aanschaf van extra hardware. Je hebt ook meer expertise nodig. "Als er een bom op je datacenter valt, dan is het makkelijk," aldus Esser. "Maar meestal werkt er iets niet." Hij vertelt over een beheerder die in paniek eerst de ene en daarna de andere replica opnieuw initialiseerde. "Daarvoor moet je die opdracht wel eerst minstens zes keer bevestigen. Statistisch gezien gebeurt dit bij elk bedrijf in Nederland gemiddeld eens per jaar. Dan wordt er zo'n grote fout gemaakt dat je bijvoorbeeld een dag plat ligt. Meestal gaat dat om menselijke fouten."
Reacties
Op dit item kan niet meer gereageerd worden.
