Internetbedrijf CloudFlare heeft details gepubliceerd over de omvangrijke internetproblemen die Europeanen maandag hebben ervaren. Het content delivery network legt de schuld bij Telia en noemt de storing onacceptabel. De oorzaak zou een menselijke fout zijn geweest.
Maandag hadden veel Europese internetgebruikers verbindingsproblemen met meerdere diensten, zoals Slack, WhatsApp en Reddit. Amazon AWS en CloudFlare hadden er ook last van, maar de schuld bleek bij het Zweedse Telia te liggen. Telia Carrier is een van de tier1-netwerkaanbieders en beheert een omvangrijk glasvezelnetwerk, waarmee de aanbieder verantwoordelijk is voor een belangrijk deel van de internetbackbone. CloudFlare is een content delivery network, of cdn, en moet dankzij zijn vele verbindingen met internet exchanges snelle en stabiele verbindingen bieden.
CloudFlare detecteerde afgelopen vrijdag een flinke packet loss bij Telia Carrier, maar het bedrijf loste dat probleem snel op. Maandag was het weer raak en dit keer waren de problemen omvangrijker, zo blijkt uit een grafisch overzicht dat CloudFlare heeft opgesteld. "Omdat transitproviders normaal gesproken erg betrouwbaar zijn, verhelpen ze hun problemen meestal snel. In dit geval gebeurde dat niet en moesten we onze poorten met Telia sluiten", schrijft het bedrijf.
Packet loss op 20 juni, gemeten door CloudFlare
De cdn registreerde grote hoeveelheden 522-http-foutmeldingen, als indicatie dat zijn servers die van zijn klanten niet meer konden bereiken. CloudFlare probeerde verkeer om te leiden naar andere, in de woorden van het bedrijf 'beter presterende providers', maar kon niet voorkomen dat de problemen gevolgen hadden voor klanten en internetgebruikers.
CloudFlare gebruikt het border-gatewayprotocol om de datapakketjes te routeren. "Bgp werkt goed om interconnecties stabiel te houden, maar het heeft geen mechanisme om packet loss en prestatieproblemen te detecteren." Het bedrijf zegt zelf te werken aan een mechanisme om actief packet loss te registreren en verkeer om te leiden, maar dit wordt alleen nog gebruikt bij afgelegen en kleine locaties. In de komende twee weken zou CloudFlare deze technologie naar meer locaties uitbreiden.
De directeur van CloudFlare noemt de betrouwbaarheid van Telia over de afgelopen zestig dagen 'onacceptabel'. Zijn bedrijf heeft de afhankelijkheid van Telia's netwerk verlaagd totdat de problemen opgelost zijn. Telia heeft nog niet gereageerd. Volgens The Register ging het om een menselijke fout, waarbij iemand een router verkeerd instelde. De site claimt dat een technicus bij de configuratie van een router Hongkong en Europa door elkaar haalde, waardoor het misging. Niet duidelijk is waar de site die informatie vandaan heeft en Telia heeft de informatie niet bevestigd.