Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 17 reacties

De dienstverlener voor high-performancecomputing SURFSara heeft al sinds donderdagmiddag last van omvangrijke storingen. Veel diensten zijn daardoor niet bereikbaar voor bedrijven en onderzoeksinstituten. De Cartesius-supercomputer is wel te benaderen.

SURFsara company logoDe oorzaak van de problemen ligt bij de firewall, meldt SURFSara. De dienstverlener zoekt met de hardwareleverancier van de netwerkswitches naar de oorzaak. De problemen begonnen donderdagmiddag om 14.30 uur en waren vrijdagochtend nog niet opgelost.

Veel van de systemen van de organisatie zijn door de storing niet bereikbaar, maar SURFSara benadrukt dat de 'nationale supercomputer' Cartesius wel te gebruiken is en ook de SURFDrive-dienst voor het delen van data te benaderen is.

SURFSara biedt met zijn infrastructuur diensten aan voor onder andere high-performancecomputing, waar onderzoekers van bedrijven, onderwijsinstellingen en andere instituten gebruik van kunnen maken.

Moderatie-faq Wijzig weergave

Reacties (17)

Bij een organisatie als SURFsara mag een hardware falen niet langer dan een uur bestaan lijkt me. Kwestie van de betreffende firewall uit het rek trekken en een nieuwe inschroeven. Config uit je backups trekken en gaan... Het lijkt mij daarom dat er meer aan de hand is.
Als het zo simpel is als het falen van hardware dan heb je gelijk (mits je op tijd door hebt dat het een hardware probleem is). Software of firmware-problemen kunnen veel lastiger zijn om terug te draaien. Zo ken ik een apparaat dat je wel online kan upgraden maar niet downgraden. Als je een rollback wil doen dan moet je down.

Het kan bijvoorbeeld nodig zijn om een database te converteren van het oude naar het nieuwe formaat, en weer terug, dat kan lang duren.

Personeel kan ook een beperking zijn, als je net al een dubbele dienst hebt gedraaid om een change uit te voeren terwijl je collega's bezig zijn met work-arounds voor de problemen dan kun je misschien beter eerst een dutje doen voor je verder werkt.

Het kan ook nog dat de rollback zelf mislukt, typisch is dat het minst geteste deel van zo'n procedure.

Daar komt nog bij dat een club als SurfSara hele hoge eisen heeft waardoor ze al snel aan de rand van de techniek zitten. Daar heb je nu eenmaal te maken met techniek die nieuw zijn of op de grens van z'n maximale capaciteit werkt. Daar horen ook problemen bij die nog niemand anders heeft gezien en de de fabrikant ook niet onmiddellijk kan verhelpen.


Ik heb geen idee wat er in dit geval aan de hand is, maar vooruitstrevende wetenschap heeft nu eenmaal soms last van hobbels.
Als het probleem bij de firewall ligt, waarom ga je dan met de leverancier van de netwerkswitches zoeken naar de oorzaak?
Omdat zij support leveren op hun product? Niks mis mee toch, om hulp in te roepen bij zoiets? Zou niet de eerste keer zijn dat oiets gebeurd. Firewalls kunnen voor grote omgevingen net zo complex zijn als de ongevong er achter. Dan kan het maar zo zoeken naar een speld in de hooiberg zijn, met de fabrikant zoeken is dan makkelijker, die kent zijn product door en door, waar de beheerders dat niet kunnen. ;)

[Reactie gewijzigd door CH40S op 1 juli 2016 12:13]

omdat de firewall in die switches zit ??

Ik zeg maar iets hoor. Bij ons staan er in ieder geval switches van Sophos met firewall e.d. Is bij surfsara misschien ook zo
Dit zal zeer waarschijnlijk gaan over een hardwarematige firewall, iets wat wij als thuisgebruikers niet echt kennen, maar 'in de branche' heel normaal is.
Lijkt inmiddels opgelost te zijn. Ik heb iig weer toegang tot mijn server.
Veel succes aan de mensen die hier mee bezig zijn. Het is niet leuk om zo lang een storing te hebben van deze omvang. Ik zou ook niet met hun willen ruilen.
Ben wel benieuwd naar wat er hier misloopt. Indien het een hardware falen is zou ik verwachten dat de fout snel gevonden kan worden en bij een softwarefalen op een systeem dat al lange tijd goed werkt denk ik direct aan een aanpassing in de configuratie waarna een restore van de vorige config het probleem zou moeten oplossen.

Het lijkt mij inderdaad geen pretje om zo lang met zo een grote storing te zitten.
Ik weet wat er mis is, maar mag daar logischerwijs niets over zeggen. Leuk is anders, laten we het daar op houden. :)
Dat staat toch gewoon in het artikel? :) Of is dat te generiek?
"De oorzaak van de problemen ligt bij de firewall, meldt SurfSara. De dienstverlener zoekt met de hardwareleverancier van de netwerkswitches naar de oorzaak"

Actuele status is hier in te zien: https://userinfo.surfsara.nl/systems/status
De 'nationale supercomputer' Cartesius lijkt ook beperkingen te hebben.

[Reactie gewijzigd door Torrentus op 1 juli 2016 10:47]

Dat staat toch gewoon in het artikel?
Jij gelooft ook nog in Sinterklaas? ;) Wat ze in de media melden is niet altijd de waarheid.
Actuele status is hier in te zien: https://userinfo.surfsara.nl/systems/status/
Die site werkt niet bij mij ... :D
Inderdaad niet meer, vanmorgen deed hij het nog wel.
Overbelast omdat teveel mensen kijken wat er aan de hand is of breidt de storing zich uit? :P
Als gebruiker van enkele systemen van surfsara:
Kun je wel iets zeggen over hoe lang het waarschijnlijk gaat duren? Een inschatting of het wel of niet voor het weekend is opgelost zou al helpen.
Dat kan ik ook niet. Ik zou het echt niet weten. Het is aan NOC om met de leverancier tot een oplossing te komen.
Ik ben erg benieuwd nu :P. Ik mis trouwens een deadline door deze off-time :(
Het kan ook iets zijn wat extern getriggerd wordt. Denk aan een netwerkkabel die met twee kanten op de switch geplug zit. Natuurlijk heeft een moderne switch hier bescherming voor. Maar in zo'n complexe omgeving zal er wel moderne variant van zo'n probleem bestaan. De hardware vervangen of de configuratie terug zetten gaat je dan niet helpen.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True