DigiD is weer beschikbaar na storing - update

DigiD is weer volledig beschikbaar. De dienst had vanochtend te maken met een storing, waardoor niet alle gebruikers er gebruik van konden maken. De problemen begonnen om 06.00 uur vanochtend, laat Logius weten.

De problemen worden veroorzaakt door geplande werkzaamheden bij één van de telecomproviders, vertelt een woordvoerder van DigiD-beheerder Logius aan Tweakers. "De internetontsluiting verloopt via twee providers. Vanwege gepland onderhoud bij één van de providers zijn we preventief overgeschakeld naar de andere", aldus de woordvoerder. Het gevolg is echter dat een deel van de gebruikers niet in kan loggen met DigiD. Of dat lukt, hangt af van de telecomprovider van de gebruiker. Welke telecomprovider precies problemen heeft, wil de woordvoerder niet zeggen.

Het geplande onderhoud was rond 10.00 uur afgelopen, waardoor de problemen ook werden opgelost. Logius meldt om 10.15 uur op zijn website dat de dienst weer volledig beschikbaar is. Eerder op de ochtend klaagden honderden mensen op Allestoringen.nl dat ze niet konden inloggen of de app niet konden gebruiken.

Update, 09.59 uur: Logius heeft gedeeld wat de oorzaak van de storing is en dat de problemen naar verwachting rond 10.00 uur zijn opgelost. Het artikel is daarop aangepast.

Update, 10.32 uur: De storing is verholpen. Het artikel is daarop aangepast.

Door Eveline Meijer

Nieuwsredacteur

18-07-2024 • 09:38

42

Submitter: VSB

Reacties (34)

Sorteer op:

Weergave:

Die telecom provider is Odido na hun changes van vannacht :P

[Reactie gewijzigd door spiree op 22 juli 2024 13:41]

Vanwege gepland onderhoud bij één van de providers zijn we preventief overgeschakeld naar de andere", aldus de woordvoerder. Het gevolg is echter dat een deel van de gebruikers niet in kan loggen met DigiD.
Wat is dat voor configuratie? Preventief overgeschakeld en daardoor problemen?
Ze maken zo te lezen gebruik van 2 ISP's en de routing / peering bepaald welke dat is, blijkbaar heeft 1 ISP routing problemen en daardoor kan een deel geen verbinding krijgen bij Digid.
Enige wat je Logius kan aanrekenen is dat ze de lijn niet hebben getest, maar anderzijds kom je daar vaak pas achter als het te laat is :+
Als ik het goed lees dan werkt de omschakeling aan de kant van DigID wel. Maar is er een routing probleem bij slechts 1 isp. Die routing staat nog naar een verbinding die down is te wijzen.
En daar kan DigID niets aan doen.
Nou, een DRP op zijn tijd?
Welke DRP heb jij het hier nou over dan? Want in het lijstje wat Wikipedia produceert (en Google) lijkt alleen Disaster Recovery Plan een logische match, maar dat is iets wat je hebt... niet iets wat je op zijn tijd uitvoert.

Ik denk dat je doelde op het periodiek uitvoeren van een test VAN het disaster recovery plan. Dat had hier alleen geholpen echter als een ISP precies op dat moment problemen zou hebben. En dan nog... wat zou de uitkomst geweest zijn. Ja soms kan het zijn dat de failover problemen heeft. Wat doe je? Tweede failover? In een kosten/baten analyse gaan de kosten dan altijd winnen.
Ik bedoel: Disaster Recovery Procedure, dus het draaiboek over wat je doen bij een disaster.
Dit kun/moet je regelmatig testen.
Maar als bij Logius niet het probleem zat, waarom moeten zij dit dan wel in een procedure hebben? Die link zie ik even niet.
Vanwege gepland onderhoud bij één van de providers zijn we preventief overgeschakeld naar de andere
Het gaat er niet om waar de oorzaak van het probleem ligt, maar wie het probleem ervaart. Die moet een procedure hebben en die heeft Logius ook: n.l. switchen.
Deze procedure moet je regelmatig testen, want daar kunnen ook fouten in zitten. In dit geval kwam er een fout uit, al ligt die dan (misschien?) niet bij Logius.
Dat kan, maar als je actief je foutprocedures test levert dat vaak meer downtime op dan "veiligheid" bij een incident. Dat is ook een van de redenen dat ziekenhuizen wel hun aggregaten testen maar nooit de failover.
Die tests kun je plannen en communiceren. Beter een gecontroleerde downtijd op een gecontroleerd moment dan beide ongecontroleerd, bijv. als de vertrekhal vol staat met vertrekkende vakantiegangers.
Het klinkt alsof Logius via BGP een route change had aankondigt om alle verkeer via provider B te sturen in plaats van normaal gesplitst via provider A en B. Als die route change niet wordt opgepikt door één of meerdere ISP's (door een fout bij die ISP's) dan kan je plannen schrijven tot je een ons weegt maar dat gaar je niks helpen. Het enige wat je dan kan proberen is iemand bij die ISP's te pakken te krijgen en vragen of ze hun zaakjes voor elkaar willen maken door handmatig routes aan te passen of de route tabel opnieuw in te lezen. Maar voordat dit gelukt is, is het oorspronkelijke probleem vaak ook al wel weer opgelost.
Het DRP gaat niet over als je zelf problemen hebt maar ook als toeleveranciers problemen hebben.
In mijn DRP staat bijvoorbeeld ook een stuk voor het geval Microsoft Teams wegvalt. Is niet mijn product, maar ik moet wel een plan hebben voor als het gebeurt.

Je kijkt naar de risico's voor jouw dienstverlening / product en dus ook naar externe factoren. Volgens de ISO27001 (en de BBN/BIO die daar weer boven op zit) moet je deze hebben en testen.
Een optie dat Teams eruit ligt is iets heel anders in mijn optiek. Dan moet je namelijk gaan switchen naar een ander platofrm.

Maar in dit geval was er dus slechts 1 provider met een probleem. Hoe moet Logius dat dan gaan ooplossen? Zij kunnen niet de configuratie van die provider corrigeren. Het "wisselen" zoals bij het voorbeeld met Teams is dus onmogelijk voor Logius.
Ik vraag me ook serieus af hoe je dat zou moeten testen als Logius zijnde.

[Reactie gewijzigd door Kroesss op 22 juli 2024 13:41]

Ander platform of andere provider is in dit geval hetzelfde. Beetje dat het handig is om je reserveband één keer per jaar even te checken. Als je het nodig hebt dan is het handig dat je weet hoe en wat.

Het is inderdaad niet aan Logius om het probleem op te lossen, maar als verantwoordelijke voor DigiD moet je wel weten of je backup werkt. Hiermee constateer je het probleem en kan je de provider aanspreken om het op te lossen.

Je moet als Logius beide connecties testen. Beste methode is de verbinding naar één provider gewoon dichtzetten, maar vaak wordt er een paper-based test gedaan om te checken of de juiste mensen worden ingeschakelt bij een issue (en of de telefoonnummers nog kloppen, de procedure nog te vinden is, etc).
Dat zei ik toch? :Y)
Logius kan dit niet testen. Dat zullen de isp's moeten doen.
Logius kan alleen de interne systemen testen. En die blijken wel te werken.
Jazeker kunnen ze dat, want je neemt je keten mee in je testen als ze van belang zijn. Logius heeft ook mooie testomgevingen die ze kunnen gebruiken als ze niet met productie willen spelen.
Of dat lukt, hangt af van de telecomprovider van de gebruiker.
De eindgebruiker in dit geval. Of nou ja, de ISP ván die eindgebruiker. Dus als ik op het Vodafone netwerk zit en jij bij Odido kan het zijn dat ik wél issues heb en jij niet. Staat los van de ISP die Logius gebruikt.
In het kader van nis2 zullen ze hun zaken als essentiële dienstverlener toch beter moeten gaan regelen met hun “toeleveranciers”. Hier is nis2 voor bedacht.
Je maakt wel wat aannames. Het lijkt me onwaarschijnlijk dat een ISP in Nederland routes mist naar de grote providers in Nederland. Een mogelijke oorzaak is bv dat Logius statische routes gebruikt. (Nogal onzinnig uiteraard, maar bij de overheid zou me dat niet verbazen.) Een andere optie is dat odido het verkeer tijdens de werkzaamheden nog steeds naar hun link met Logius bleef routeren ipv naar het internet, waardoor odido klanten DigiD niet konden gebruiken. Of dat een odido issue is of een Logius issue hangt er van af hoe Logius de ISP overgeschakeld heeft. Het zou bv kunnen dat Logius alleen de routering omgegooid heeft en dat verkeer wat dan via odido terug komt wordt gedropt vanwege de asymmetrische routering. Overheid en ict gaat nooit goed, dus ik gok dat het probleem bij Logius lag.
Daarvoor hebben ze de DRP uitgevonden...
Dit zijn resultaten van bijvoorbeeld bepaalde anycast-achtige configuraties bij ISPs.
Maar zonder details te kennen is er niks algemeens over te zeggen.
Toevallig net DigiD nodig om mijn rijbewijs te verlengen. Het werkt, maar wat mij opviel was dat de app geheel gereset is. Ik moest opnieuw inloggen pincode instellen en een ID-bewijs scannen. Dat ik opnieuw moet inloggen heb ik de afgelopen jaren op deze telefoon nog nooit meegemaakt.
Dit klinkt meer als de instelling op moderne OS-en waarbij na een bepaalde tijd toestemmingen worden ingetrokken en data verwijderd wordt. Ik denk niet dat DigiD daar zelf wat mee te maken heeft. Kan inderdaad flink vervelend zijn voor iets wat je maar sporadisch gebruikt.
Heb DigiD app al jaren, geactiveerd op mijn iPhone staan. (staat nog steeds hier)

Opeens (sinds een paar maanden) is die app "verdwenen", kan moeilijk inloggen (slechter zicht door mijn ziekte). Ik ben hier helemaal klaar mee, helpdesk van DigiD moet dit maar fixen.
Dat de app verdwenen is van je telefoon kan DigiD niks aan doen, die verdwijnt niet zomaar. Zou dan eerder langs de Apple Store gaan dan het probleem neerleggen bij de DigiD helpdesk. Die kunnen je dan ook meteen helpen met het opnieuw downloaden van de app zodat je deze vervolgens weer kunt activeren.
Staat erlangs!
Waar langs?
Gisteren was DigiD al enorm traag vergeleken met normaal.
Maar waarom voeren ze dit "geplande onderhoud" om 10:00 uur uit. Ik zou verwachten dat ze dat `snachts doen, als er minder trafic is..
De problemen begonnen om 06.00 uur vanochtend.
Het geplande onderhoud was rond 10:00 afgelopen.
...
Ah, de "Verkeerde PIN poging -1" melding leek me al zo apart.

Op dit item kan niet meer gereageerd worden.