De lijnen (RTT) van gistermiddag naar Prolocation laten een verhoging + packetloss zien op verschillende tijdstippen, zie diagram:
http://imgur.com/d9DARd4 Dit bevestigd in mijn ogen een DDOS aanval, of in iedergeval een HIGH CPU van routers/switches/devices binnen het traject.
Ik vermoed dat het een gerichte aanval is geweest op de routers (Core/border/edge) waardoor de CPU van de routers op 100% stonden te koken. Nu kan ik zowel argumenten bedenken om dit te ontkrachten: verkeer wordt niet verwerkt door de management module, maar door de CPU's op de blades zelf, echter de hoge RTT tijden + packetloss doen vermoeden dat dit wel het geval is.
Hoge RTT + packetloss kunnen onstaan door:
1. 100% belasting van fysieke verbindingen, ze worden volgestopt door een DDOS aanval.
Ik zie geen reden om aan optie 1 te denken, omdat een volle lijn snel kan worden opgelost. Het is een kwestie van de betroffen IP adressen blackholen bij de upstreams, of zelfs kiezen om enkel Nederlands verkeer door te laten. Transit is fijn, maar nog fijner is het als 99% van de doelgroep de dienst weer kan gebruiken.
2. Packet forwarding op de blade loopt op tot het maximum (hoge CPU load blade).
Dit kan verklaren waarom er een hoge RTT was + packetloss, de 100% packetloss tijdens de storing komen vaak voort het reloaden, of tijdelijk uitschakelen van verbindingen om de brand te lokaliseren.
3. Hoge CPU belasting management door directe aanval op de router/switch zelf.
Lastig te detecteren, helemaal op het moment dat flowdata niet meer kan worden verstuurd, of dat een device letterlijk onbereikbaar is geworden (zelfs via de console/serial). Debuggen binnen de router zelf is dan ook vaak onmogelijk zonder alle verbindingen te shutten.
Uitgesloten:
4. Fibercut (geeft 9/10 geen hoge RTT, maar direct een loss of link, 100% packetloss).
5. Defect router (ook dit is vaak direct 100% packetloss).
Shit happens en het overkomt de beste providers onder ons. Het enige wat je Prolocation kwalijk kan nemen is dat ze twitter niet eerder hadden geupdate. Dat de telefooncentrale overbelast is begrijp ik en neem ik ze ook zeker niet kwalijk.
Geen communicatie is ververlender dan een uur geen e-mail/website of online werkplek.