Heb je wel eens zo'n storing mogen meemaken?
Eerst wordt er voorbereidend werk gedaan zodat monitoring uitgevoerd kan worden. Bijvoorbeeld door via iDeal automatisch iedere 5 minuten een bedrag over te boeken van rekening A (van de bank) naar rekening B (eveneens van de bank). En als dat niet binnen 10 seconden lukt dan geeft hij een foutboodschap. (Maar goed, dan kan iDeal al 5 minuten down zijn")
- Foutboodschap wordt opgepakt door het monitoring systeem (die het eventlog uitleest en ook reageert als het eventlog niet beschikbaar is, m.a.w. de applicatie server is down) .
- Die stuurt het door naar het incident registratie systeem en dan gaat het (hopelijk geautomatiseerd) door naar de oplosgroep. Maar dat kan uiteraard applicatie-oplosgroep of hardware-oplosgroep zijn. Raad eens: vaak gaat het naar de verkeerde.
Als het een echte storing is dan is er tegen deze tijd al meerdere meldingen (meerdere betalingen mislukt: geen hickup maar er is iets mis).
- Meerdere meldingen dus techneut roept 'shit' naar de manager. (Die vervolgens alleen maar extra stress oplevert).
- Onderzoek wat er mis is; server down (ja = 5 minuten reboot, afdeling A, en hopelijk werkt het daarna weer / nee), applicatie down (ja = 10 minuten reboot afdeling B, en hopelijk .... / nee), contact zoeken met iDeal, down (ja = stuur melding naar website [haha, iDeal down] / nee). (Techneut roept nogmaals "shit" tegen zijn manager "snelle oplossing niet voorzien want: "Storing bij de telecom/network provider. (Met een beetje mazzel is dat deel uitbesteed, dus daar dan een incidentregistratie doen (etc) en wordt behandeld/gemonitoord door onze afdeling C). Neen, je wilt niet weten wat er moet gebeuren als het een fout IN de applicatie betreft.
Manager inmiddels in paniek, roept noodprocedure uit. Dus met zijn allen bevestigen dat het niet aan ons ligt. Daarna beslissen of we iets op de website zetten. Maar de storing kan binnen een paar minuten verholpen zijn, als alles meezit. Manager mag druk zetten bij de telecom provider (gaat absoluut geen deuk in een pakje boter slaan, maar het is wel goed voor de bühne).
Stel dat we besluiten dat de oplossing wel op zich kan laten wachten, dan gaan we praten over wat er exact op de website moet komen (iDeal down, de connectie van de bank naar iDeal down, etc).
Uiteraard herhalen we die exercitie ieder half / heel uur. Met wat mazzel haakt na een uurtje of twee / drie de 'directeur' aan. Maar dat is alleen maar extra stress voor de managers.
Bij de telecom provider werkt het ongeveer in hetzelfde tempo. Ook daar haakt op gegeven moment een manager aan (als onze manager voldoende gezeurd heeft).
Maar goed. Eens wordt de beslissing genomen om iets op de website te zetten. Uiteraard moet dat 'concept' wel via email gebeuren, want 'Marketting' wil uiteraard niet de verkeerde tekst hebben. (zie discussie over de exacte tekst). Dan moet een 'webmaster' dat in zijn tool zetten, dat moet uiteraard nog even gecontroleerd worden want een tikfaut is snel gemaakt.
En net voordat 'Marketting' de wijziging wil doorvoeren roept de telecom provider dat alles is opgelost. Ze hebben het certificaat vernieuwd. Marketting is 'not amused'. ICT is (volgens hun) gewoon een stresskip.
Directie echter vind het snel opgelost en zonder dat de klanten daar veel van gemerkt hebben. Dikke pluim voor de manager.
Lang verhaal, korte samenvatting: wil je weten of (iets van de) bank niet werkt, kijk bij allestoringen.nl en niet bij de bank.
Als het mainframe down is en het 3 / 4 uur duurt tot de bank weer on-line is, dan zou de website een juist beeld kunnen geven. (Of niet).