Hoofdcategorieën

Backupnetwerk Ams-ix had moeite met datastroom na storing

Door Dimitri Reijerman, vrijdag 30 mei 2008 17:50
Submitter: flipjevandejam, views: 20.349

De Amsterdam Internet Exchange is kort na drie uur getroffen door een kortstondige storing op het hoofdnetwerk. Omdat er op dat moment werd gesleuteld aan het backupnetwerk kon deze het verkeer maar met moeite opvangen.

Storing bij Ams-ixZoals op de pagina met verkeersstatistieken van de Ams-ix is te zien, viel de verbinding iets na drie uur terug van 300Gb/s naar ongeveer 20Gb/s. Dit duurde ongeveer een kwartier, waarna het dataverkeer weer zijn oude niveau bereikte.

Henk Steenman, technisch directeur van Ams-ix, laat aan Tweakers.net weten dat zijn technici zijn geschrokken van de omvang van de plotselinge storing. Het zou gaan om één van de grotere storingen van de laatste jaren, maar een directe verklaring voor de problemen op het hoofdnetwerk en de moeizame doorschakeling naar het backupnetwerk heeft Steenman nog niet. De beheerder zal naar eigen zeggen de zaak grondig gaan onderzoeken om vergelijkbare problemen in de toekomst te kunnen voorkomen. Volgens Steenman zal het per provider verschillen hoeveel last de eindgebruiker heeft gehad van de storing; veel isp's hebben meerdere paden waarlangs het dataverkeer kan lopen.

Volgende 18:50
Vorige 17:28

Reacties

«  1  2  »

Aha, dat verklaart de hoge packet loss deze middag. Maar goed dat ik de ISP er niet mee lastig heb gevallen.

Daar is je ISP voor. Als ze maar genoeg calls krijgen, kunnen ze het probleem doorschuiven naar AMS-IX.

Ik kan je met grote zekerheid vertellen dat naar mate er meer mensen bellen dergelijke problemen alleen maar minder snel worden opgelost.

Het zou voor een hoop isp's en waarschijnlijk ook voor ams-ix een stuk productiever zijn als niet iedereen meteen begint te mekkeren maar ze de technici daar de kans geven een probleem op te lossen en later een verklaring de deur uit te doen.

Een goede provider heeft een gescheiden team voor telefonische ondersteuning en reparatie...

En hoe komt de telefonische ondersteuning te weten hoever ze zijn :?

Juist ja, ze gaan die mensen bellen en lastig vallen. En wat gebeurd er dan; ze worden gestoord en leggen het werk even neer. Dus duurt het weer een telefoontje langer om het op te lossen.

De telefoonploeg kan dat via een monitor vast wel waarnemen. Even als monteur de status bijwerken, en hoppa.

Een goede ISP heeft ook zodanige redundantie dat ze niet afhankelijk is van AMS-IX

Dacht dat alles langs de AMS-IX moet i.v.m. de tapwetten e.d.

uuuuuh nee :>

AMS-IX = een peering platform (IX staat voor Internet Exchange).

Taps werken doormiddel van het mooie "monitor" commando op de switches, kwestie van een mirror opzetten van een gebruiker binnen het netwerk naar een tapdoos.

kwestie van een mirror opzetten
Het begint oftopic te varen, maareh. Gelukkig is het niet zo makkelijk als jij het neerzet :)

Een storing van maar een paar minuten is te weinig om alle sessies om te gooien.

Op zich mee eens, maar omdat alle grotere ISP's uit Eiropa OOK op de AMS-IX zitten merk je het vaak toch: peering schakelt als het goed is wel keurig over naar -bijvoorbeeld- DE-CIX maar de ISP routers krijgen wel een hele hoop BGP route updates, en als er wat ''klappert' dan zorgt BGP er ook nog voor dat niet alle updates worden doorgevoerd (damping). Alleen is dat niet altijd helemaal optimaal geconfigureerd, waardoor je peering bijv. keurig overstapt naar DE-CIX en vervolgens gaat het verkeer in het netwerk van de peeringpartner alsnog naar de AMS-IX voor een andere peer of eigen backbone danwel transit boer.
Als een exchange als AMS-IX problemen heeft merk je dat altijd - al is het maar door hoge latency of verhoogde packetloss (wat de hogere OSI layers moeten opvangen: niet elke packetloss geeft dataloss op app-nivo....)
1 x uitvallen en na 15 min weer terug is door goede ISP's met goede peers en transits prima op te vangen; klapperende peer-infra is een drama; hoe redundant je ISP ook is.
Als voorbeeld kan je bij noc.bit.nl mooi zien dat peering op DECIX en LINX vrijdagmiddag flink piekt: http://noc.bit.nl/newgrap...l&target=xe-0-0-0_800

[Reactie gewijzigd door tonkie67]


Leuk dan dat we zwelden klagen bij Versatel maar toch minstens eens in de week het signaal voor een uur of langer verliezen, fijn dat ze zo goed profiteren van de rust die wij ze bieden...

Ik kan je met grote zekerheid vertellen dat naar mate er meer mensen bellen dergelijke problemen alleen maar minder snel worden opgelost.

Het zou voor een hoop isp's en waarschijnlijk ook voor ams-ix een stuk productiever zijn als niet iedereen meteen begint te mekkeren maar ze de technici daar de kans geven een probleem op te lossen en later een verklaring de deur uit te doen.
Meestal heb je wel meer mensen dan alleen technici in dienst:
Eerste lijns support - Telefonischie helpdesk
Tweede lijns support - Middelmatige kennis
Derde lijns support - Technische afdeling

Als er een storing is, kan dat heus wel door iemand van de tweede lijn of de derde lijn gemeld worden naar de eerste... Om zo gebruikers / klanten te informeren dat er problemen zijn... ;)

Vandaar dat ik een tijdje via m'n ene provider wel Last.FM kon bereiken, en via m'n andere niet :)

Ik kon compleet ook niets meer met Concepts ICT. Heb m'n server eerst een schop gegeven omdat ik dacht dat er wellicht iets gaande was ermee. Zag wel dat het modem nogsteeds verbonden was, en een IP-adres gaf aan m'n router, maar daarmee hield het ook op.

Is wel geing om te zien dat het data verkeer op dat moment hard omhoog gaat op de linx in londen.

https://www.linx.net/pubtools/trafficstats.html

https://www.linx.net/pubtools/trafficstats.html?stats=day


Ok zie dat op NLIX ook het verkeer hard omhoog schiet, zie deze link:

http://www.nl-ix.net/traffic.php

Gemiddeld gaat hier zo'n 12,26 Gb door heen en met de blackout op de de AMS-IX schiet het data verkeer omhoog naar ruim 41 Gb.

[Reactie gewijzigd door NDSFREAK]


kan toeval zijn hoor: als je naar die grafiek kijkt zie je dat die donderdagavond een paar uur een dergelijke belasting had waarop hij rond 3 uur vanmiddag piekte...

en dat de traffic van tweakers.net opeens verschrikkelijk hard daalt

http://tweakers.net/stats
«  1  2  »

Op dit item kan niet meer gereageerd worden.

Volgende 18:50
Vorige 17:28
VNU Media logo Powered by True

© 1998 - 2008 Tweakers.net - Alle rechten voorbehouden

Uitgever van: