Rekenkracht
Met alle computerkracht waarover de gemiddelde tweaker vandaag de dag beschikt - niet alleen in desktop-pc's en laptops, maar ook in smartphones, tablets, spelconsoles en zelfs horloges - zou je bijna vergeten dat toegang tot computercapaciteit ooit zeer schaars was. Krachtige systemen waren duur en daardoor zeldzaam. Met timesharing, waarbij rekenkracht over verschillende gebruikers werd verdeeld, werd in de jaren zestig en zeventig gepoogd de hoge kosten te drukken; voor elke gebruiker een eigen krachtig systeem was simpelweg te duur.
Je zou denken dat dit probleem tegenwoordig niet meer speelt; computercapaciteit is zo sterk in prijs gedaald, dat zelfs de simpelste telefoon al over gigantisch veel meer rekenkracht beschikt dan de computers die de Apollo 11 naar de maan begeleidden. Maar schijn bedriegt; wetenschappers zitten nog steeds verlegen om rekenkracht en die is nog steeds kostbaar.
Het European Grid Initiative is opgericht om de kosten van computercapaciteit te drukken. Het project, dat 25 miljoen euro steun krijgt van de Europese Unie, biedt wetenschappers toegang tot een computing grid dat bestaat uit 320 locaties met in totaal 250.000 processorcores. Eerder meldde de Europese Commissie dat het daarbij om ongebruikte computercapaciteit van desktops ging, maar dat blijkt anders te liggen. Een groot deel van de systemen betreft high-end-servers, hoewel ongebruikte desktopcapaciteit op sommige locaties ook wordt gebruikt.
/i/1289994801.jpeg?f=imagenormal)
Het Nederlandse BigGrid is onderdeel van het EGI. Op het Science Park in Amsterdam staat een deel van het grid. Zo heeft het Nikhef, een instituut voor deeltjesfysica, 2500 cpu-cores ter beschikking van de wetenschap gesteld; het in grid computing gespecialiseerde instituut SARA heeft er 3000. Bovendien is het hoofdkantoor van het project bij het Nikhef gevestigd. Tweakers.net kreeg een rondleiding door de datacenters en nam een kijkje onder de motorkap.

Wat is een grid?
De naam 'grid' is geïnspireerd door het elektriciteitsnet, het electrical grid. Het idee van het lichtnet is dat je simpelweg een stekker in de muur kunt stoppen en dat je dan zoveel stroom krijgt als nodig. Hetzelfde zou idealiter gelden voor grids; gebruikers moeten op verzoek zoveel rekenkracht krijgen als ze nodig hebben, zonder zich te hoeven afvragen wie daarvoor zorgt of waar deze vandaan komt.
Hoewel toegang krijgen tot een grid nog lang niet zo eenvoudig is als een stekker in de muur steken, kunnen gebruikers dankzij grids wel via het internet toegang krijgen tot krachtige computersystemen. Dat is handig voor wetenschappers die complexe problemen willen oplossen. Grid computing kan van pas komen bij onderzoek naar de oerknal, naar een medicijn tegen malaria of kanker, of naar weermodellen.
"Het is een belangrijke infrastructuur", zegt Maurice Bouwhuis van het SARA-instituut. "Het maakt baanbrekend onderzoek mogelijk, zonder dat elke wetenschapper of elk instituut in zijn eigen rekencluster hoeft te investeren", stelt hij. Volgens Bouwhuis was het vroeger wel gebruikelijk dat 'iedereen een eigen cluster had'.
Grids zijn krachtig. Een berekening waarmee een huis-, tuin- en keuken-pc weken bezig zou zijn, is voor een in zware berekeningen gespecialiseerde server een stuk minder zwaar. Een paar uur ligt dan binnen de mogelijkheden. Bovendien is een grid efficiënt; de capaciteit kan zo worden verdeeld dat het een zo hoog mogelijke bezetting heeft. Daardoor worden zo weinig mogelijk processor-uren 'weggegooid' en worden de servers in een grid goedkoper; er hoeven er minder te worden aangeschaft om hetzelfde te bereiken en wordt er minder energie verbruikt.
/i/1289994895.jpeg?f=imagenormal)
Parallel computing
Hoewel het EGI net als andere computing grids is opgericht om de capaciteit van computers efficiënt over gebruikers te verdelen, wordt in tegenstelling tot in de jaren zestig en zeventig van de vorige eeuw geen timesharing of multitasking gebruikt. De meeste systemen in het grid verdelen hun taken per processorcore. Alle processorcores handelen één proces tegelijk af, gevolgd door het volgende in de wachtrij oftewel: batch processing. Verschillende processen tegelijk laten draaien kan alleen met speciale software en hardware, en gebeurt niet op de Nederlandse locaties. Dat zou ook niet efficiënt zijn: "Nu haalt elk proces het maximale uit een processorcore, zonder overboekingswaarde", aldus Oscar Koeroo, programmeur bij Nikhef.
"Een speciale scheduler zorgt ervoor dat de taken efficiënt worden verdeeld over de beschikbare processoren", vertelt Steven Newhouse, coördinator van het project. De manier van werken kan daardoor het beste worden omgeschreven als parallel computing.
De lengte van een klus varieert. Sommige duren enkele minuten, sommige een week en andere verschillende weken. Gemiddeld worden door het hele grid 1 miljoen rekentaken per dag afgewerkt. De meeste taken bestaan uit één enkele klus, waarvoor één processor wordt gebruikt.

Een deel van het rekencluster in Amsterdam
De 320 locaties in Europa, die samen circa 1 miljoen taken per dag uitvoeren, draaien verschillende besturingssystemen. De meeste systemen hebben Linux aan boord. Windows en BSD worden ook gebruikt, maar veel minder. Daarover mogen de instellingen zelf beslissen. "Wij gebruiken in Nederland CentOS", vertelt Koeroo. Dat alle locaties onafhankelijk van elkaar werken en zelf hun software beheren, maakt dat het up-to-date houden van de software een uitdaging is, stelt Steven Newhouse van EGI. Dat is in principe de verantwoordelijkheid van de locaties zelf, al adviseert het hoofdkantoor in Amsterdam wel over keuze van software en software-updates.
Virtual organisations
Gebruikers bouwen hun applicatie in een taal als C++ of Java, waarna speciale middleware met de naam gLite ervoor zorgt dat de applicatie met het systeem samenwerkt. Applicaties kunnen door wetenschappers worden geschreven, maar er zijn bij veel instituten ook fulltime-programmeurs aan boord. De programmacode kan via een web service-interface worden geüpload. "De benodigde gegevens wordt via GridFTP aangeleverd", vertelt Koeroo. "Dat is een aangepaste versie van het ftp-protocol, speciaal voor grids." GridFTP is veiliger en gaat efficiënter om met gegevens. Alle tools die door het project zijn ontwikkeld, waaronder GridFTP en gLite, zijn opensource.
Iemand krijgt niet zomaar toegang tot het grid. Toegang is in principe bedoeld voor wetenschappers, maar iedereen die data wil laten analyseren maakt kans. Toegang betekent niet dat een gebruiker op alle 320 locaties aan de slag kan. Gebruikers organiseren zich in virtual organisations, bijvoorbeeld per universiteit, waarna elke locatie zelf bepaalt welke vo's toegang hebben. "Het Nederlandse deel van het grid geeft zo'n 45 organisaties toegang", vertelt Maurice Bouwhuis van SARA. In heel Europa zijn zo'n 200 virtuele organisaties, waarvan 25 Nederlandse. Deze vo's tellen samen 100.000 gebruikers.
Een netwerk met zoveel rekenkracht trekt natuurlijk aandacht; een botnetbeheerder zou er zijn vingers bij aflikken. Elke gebruiker van het systeem heeft daarom een eigen, unieke digitale handtekening. Verbindingen worden versleuteld met sslv3/tls 1.0. "Er wordt wel eens geprobeerd om het grid aan te vallen", vertelt Arjen van Rijn, die niet wil zeggen hoe vaak dat gebeurt. "De aanvallen gebeuren op dezelfde manier als bij normale hostingproviders, meestal door het zoeken naar gaten in de beveiliging van een enkele server en niet op het hele grid gericht."
/i/1289994981.jpeg?f=imagenormal)
Onder de motorkap
De configuratie van de systemen verschilt van locatie tot locatie. Zowel Nikhef als SARA heeft een aantal generaties clusters staan. Bij Nikhef bestaat het nieuwste cluster uit HP BladeSystem C7000-servers; SARA heeft Dell PowerEdge-servers. Zowel het Nikhef als SARA werkt met Intel Xeon-cpu's die het pure rekenwerk op zich nemen, de worker nodes. "Dat is toeval", zegt Maurice Bouwhuis. "Uit de aanbestedingsprocedures kwam dezelfde cpu naar voren."
De snelste cpu in gebruik is de dual-quadcore L5520 met een kloksnelheid van 2,26GHz. Ondanks de snelheid is dit ook de meest energiezuinige cpu. Naast de L5520 worden de 5150 en de E5420 gebruikt.

De bladesystemen bevatten zestien servers per chassis; elk beschikt over 8GB, 16GB of 24GB werkgeheugen en 300GB opslag. "Die opslag wordt gebruikt voor de klus waar een cpu op dat moment mee bezig is", vertelt Koeroo. "Is deze klaar, dan worden de resultaten naar andere servers gestuurd en wordt de lokale opslag schoongeveegd." Elke blade heeft de beschikking over een 10GB-uplink naar het internet.
Voor de data-opslag worden grotendeels servers van DataDirect met 80 slots voor harde schijven gebruikt, elk met 2TB opslag. Met raid-6 worden de schijven gegroepeerd en als scsi-targets aan Dell PowerEdge-servers aangeboden. De verbinding tussen de harde schijven en de PowerEdge-servers geschiedt via InfiniBand. Als bestandssystemen worden xfs voor de opslag en ext3 voor het besturingssysteem gebruikt.
Dat betekent dat elke server over 160 terabyte ruimte beschikt. Alle bestandssystemen zijn als xfs en ext3 geformatteerd, terwijl de schijven in raid-6 staan opgesteld. Een kleiner deel van de servers komt van Sun en heeft sata-schijven van 500GB aan boord, eveneens in raid-6 opgesteld. De totale opslagruimte op harddisk van Nikhef en SARA komt hiermee uit op vier petabyte. SARA beschikt ook nog over tape-opslag.

In heel Europa staan circa 250.000 cores in dienst van het project. "Dat aantal groeit met 15 tot 20 procent per jaar", zegt Nikhef-instituutmanager Arjen van Rijn.
Helaas!
De video die je probeert te bekijken is niet langer beschikbaar op Tweakers.net.
Resultaten
Het EGI wordt actief gebruikt. Zo gebruikt het Nikhef zijn deel van het grid om proton-proton-botsingen van de LHC-deeltjesversneller te analyseren. Het Nikhef heeft daartoe een tier-1-verbinding met het CERN in Zwitserland. Voor het analyseren van die resultaten is dan ook aardig wat rekenkracht vereist, aangezien de LHC jaarlijks vijftien petabyte aan informatie produceert.
Maar ook onderzoek waarbij de volksgezondheid baat kan hebben, wordt door het grid ondersteund. Zo wordt het gebruikt om mri-scans van hersenen te analyseren en zo beter inzicht te krijgen in de oorzaken van de ouderdomsziekte Alzheimer. Taiwanese onderzoekers hebben het grid gebruikt om onderzoek naar de vogelgriep te doen.
Of neem het onderzoek van de Universiteit van Manchester over hoe dinosauriërs bewogen. Een onderzoeker maakte een computermodel van een tyrannosaurus rex en analyseerde aan de hand daarvan hoe snel hij vermoedelijk kon rennen. Het antwoord: circa 25 kilometer per uur.
Het grid is ook gebruikt na de aardbeving in Haïti. De servers comprimeerden satellietbeelden naar een formaat dat geschikt was voor internetverbindingen met weinig bandbreedte, zodat hulpverleners op hun mobiele telefoon over actuele plattegronden van de omgeving konden beschikken.
Arjen van Rijn van het Nikhef weet niet wat de bezuinigingen van de nieuwe regering concreet voor het Nederlandse deel van het grid gaan betekenen. Hij heeft echter goede hoop dat de infrastructuur structureel door de overheid zal worden gefinancierd. "We weten in elk geval voor de komende twee tot drie jaar wat we kunnen uitgeven."
/i/1289995056.jpeg?f=imagenormal)