Hoofdcategorieën
Device Settings

Europa's krachtigste supercomputer in bedrijf genomen

Door Tamara van Hal, dinsdag 17 februari 2004 11:29
Bron: Forschungszentrum Jülich, views: 17.739

Gisteren werd met een feestelijk symposium Europa's snelste supercomputer van dit moment in gebruik genomen, zo zien we op de site van het Forschungszentrum Jülich waar het geheel staat. De supercomputer is in staat om 8,9 teraflops per seconde uit te voeren, dit is bijna twee keer zoveel als de vorige nummer een van Europa: de AlphaServer van het Franse CEA. Wereldwijd staat de Duitse supercomputer met gemak in de top twintig, zo vertelt Heise Online. In totaal zal de supercomputer 41 rekennodes bevatten, die bestaan uit een IBM p690-systeem met 32 Power4+ CPU's. Twee van deze processorunits zijn geintegreerd tot een chip en vier van deze chips vormen samen met het cachegeheugen een multichipmodule (MCM).

De rekennodes worden verbonden via een High Performance Switch van IBM, die per link een gemeten bandbreedte kan leveren van 1200Mbyte per seconde met een latentietijd van elf microseconden. De supercomputer, die de naam JUMP heeft meegekregen (JUelich MultiProcessor), kan door alle onderzoeksinstellingen in Duitsland gratis gebruikt worden mits hun onderzoeken zijn goedgekeurd door het onderzoekscentrum Jülich. JUMP zal vooral gebruikt worden voor wetenschappelijk onderzoek zoals theoretische scheikunde, levens-wetenschappen en astrofysica.

Cray-complex
Volgende 11:30 AnandTech test chipsets op PCI/AGP-lock
Vorige 00:14 Samsung van plan NAND-flashprijzen flink te verlagen
Advertentie

Reacties

«  1  2  3  »

(JUelich MultiProzessor)
Met een Z?

Met een Z is Duits :)

handig voor Dutch Power Cows :Y)

Nu nog iets bedenken waardoor het wetenschappelijk verantwoord is. :)

Distributed Folding :Y)

Staan we in 1 dag meteen boven FreeDC :+

kan door alle onderzoeksinstellingen in Duitsland gratis gebruikt worden
toch netjes :)

mits.....

maar toch wel mooi jah, hebben we in NL ook zoiets.

Eigenlijk moet er een opteron-slagschip in NL komen.
I.V.M de innovatie-strijdi n NL (8> :Y) }> }> }>

En het is nog een stoer ook :7

hebben we in NL ook zoiets.
Ja, http://www.sara.nl

Sara, ik heb geen goede openingszin, maar jij hebt rekenkracht, en ik heb zin.

Helaas is het gebruik van een bak als Teras alles behalve gratis...

//offtopic
lekkere ontopic replies, zijn altijd dezelfde als het over super pc's gaat
//offtopic

Maar is zo'n snelle nou echt nodig? Ik bedoel, dan heb je onderzoek gedaan naar iets, wat vervolgens berekent moet worden. Moet je eerst speciale programatuur gaan schrijven. Dan verzoek tot gebruik indienen. Na een poosje hoor je of je hem mag gebruiken, moet je daar nog heen etcetc.
Kan je menig Universiteits clustertje die tijd voor laten draaien lijkt me zo.

Na een poosje hoor je of je hem mag gebruiken, moet je daar nog heen etcetc.
Sorry hoor, maar ehm... Internet?

En je hebt nog altijd snailmail ;)

Maar is zo'n snelle nou echt nodig?
Ja. Als jouw onderzoek op zo'n machine een maand nodig heeft, dan kun je met zo'n 'clustertje' waarschijnlijk nog veel langer wachten.

Wat ik me vaak afvraag is:
Hoe verhoudt de rekenkracht van deze supercomputers zich met, laten we zeggen een state of the art home computer.
1000x sneller, 10000 ?
Want die teraflops zeggen me zo weinig als ons alledaagse computers geen 'flops' specificatie meekrijgen.

Dat kun je met bijv sisoft sandra benchmarken :)

ik geloof dat de huidige desktop pc's rond de enkele Megaflops zitten,
en Tera is een miljoen keer meer. dus tel uit je winst :)

Een gokje:
Bij sandra heb ik 3000 mflops.
Mega = 1e+6
Tera = 1e+12
Dus +/- 3000x sneller, hoewel dat getal waarschijnlijk weinig zegt aangezien ze voor totaal verschillende zaken gebruikt worden.

edit: ik zit op een XP2400+ op het moment..

41 nodes met 32 processing units met 8 CPU's geeft ongeveer de genoemde 1312 CPU's. Met die factor 3000 blijkt 1 zo'n powerPC CPU dus zo'n 2 keer sneller te vermenigvuldigen dan een 2400MHz P4.
Ergens klopt dit niet.

Het is dan ook geen PowerPC maar een POWER cpu. Wel familie maar toch anders, zoals een enorm grote cache.

KotServer Beta 0.1 benching...
(Celeron Tualatin 1,2GHz)

Whetstone FPU 1644 MFLOPS = 1,6 GFLOPS

De supercomputer doet met 8,9 TeraFlops = 8900 TeraFlops 5562,5 keren sneller.

Dus de supercomputer is te vergelijken met 5562,5x Celeron Tualatin 1,2GHz (ik heb geen rekening gehouden met overhead, dus je heb eigenlijk meer Tualatins nodig).
ik geloof dat de huidige desktop pc's rond de enkele Megaflops zitten,
en Tera is een miljoen keer meer. dus tel uit je winst
Onze desktop computers zitten al op GigaFlops sinds Pentium3 750MHz (volgens Sisoft Sandra).

Je kunt het in flops bekijken.
Maar ook veel simpeler:
Een Power4+ CPU ligt qua snelheid in dezelfde orde van grootte als de nieuwste P4 of Opteron modellen. Waarschijnlijk ietsje sneller, maar misschien met sommige dingen iets trager. Maar in ieder geval geen factoren verschil.

Nu zal er van de 41 rekennodes eentje nodig zijn voor de interne besturing/afstemming. Houd je over 40 nodes van ieder 32 processoren. Dat zijn dus 1280 parallelle processoren.

Dit ding is dus ruim 1200 maal sneller dan een state-of-the-art pc (maar alleen voor toepassingen die van parallelliteit gebruik kunnen maken).
En omdat dit soort performance gemeten wordt in floating-point-ops (iets waar x86 niet echt heel goed in is, i.t.t. integer stuff), zal het geheel misschien wel tot 2000 maal zo snel zijn als x86 processoren.

Dit is niet geheel de waarheid. Die is veel ondoorzichtiger namelijk.

Alleen speciale taken die parallelliseerbaar zijn kunnen heel snel uitgevoerd worden op zo'n machine. De latency van deze machine is lachwekkend slecht in vergelijking met bijvoorbeeld de supercomputers van de Nederlandse Staat (zie www.sara.nl)

Dus alleen SIMPLISTISCH parallelliseerbare taken kunnen snel uitgevoerd worden. Bijvoorbeeld matrix calculaties.

Die calculaties zijn dan vaak floating point. Er is geen PC processor die de floating point snelheid bijhoudt van dit soort processors met een sterke floating point unit.

Als het gaat om integers echter of lastig parallelliseerbare taken, dan racet zo'n opteron natuurlijk deze processors een factor 2 voorbij met zijn ogen dicht.

Verder dient men goed in de gaten te houden dat dit soort supercomputers erg uniek zijn in de wereld, dus ze hebben continue problemen. Elke week is er wel een probleem en elke maand crasht zo'n supercomputer wel in zijn geheel.

Het zijn hele delicate machines met heel ondeskundige helpdesks typisch. Op het moment dat namelijk iemand in zo'n helpdesk erg goed wordt, dan stapt hij vaak over naar een andere baan in het bedrijfsleven.

Doordat er zo weinig bekend is over dit soort machines (met name technische specificaties, want de hardware producenten overdrijven nogal graag) is het natuurlijk extra lastig om efficient op zo'n machine te rekenen.

Ook is in de wetenschappelijke wereld vaak de mentaliteit: "liever lui dan moe". Dus iets wat in 1989 geschreven is, dat draait met wat veranderingen nog steeds net zo, terwijl het veel efficienter kan. Dan gaan nog veel andere zaken mis en kunnen andere gebruikers nog roet voor jou in het eten gooien.

Dit komt er vaak op neer dat efficiente PC software op pak hem beet een dual opteron vaak overeenkomt met een processor of 100 van zo'n machine.

Alleen in theorie is het dus zo dat je dus goed parallelliseerbare taken wel een factor 100000 sneller kunt uitvoeren op zo'n machine als op een PC. De praktijk is heel anders.

Dat is dat er dus een paar wetenschappers zijn die echt die cpu power nodig hebben en gebruiken voor bijvoorbeeld heftige floating point calculaties. Dat wordt dan ook supervlug gedaan en is dus factoren sneller als op een PC. 90% van de jobs echter zouden sneller op de pc draaien als er efficiente software gemaakt/gebruikt zou worden.

OK, dus een supercomputer als deze is zo'n 4000x sneller dan een moderne pc. Dat in ogenschouw nemend is de vinding van Distributed Computing natuurlijk wel geweldig. Ga maar na, een beetje project heeft toch al gauw 10.000 gebruikers die meewerken. Weliswaar is de efficiëntie wel wat lager, maar op die manier biedt Distributed Computing toch wel een geweldig alternatief voor projecten waar wel een hele hoop rekenkracht voor nodig is, maar waarbij het budget het niet toelaat om veel tijd te huren op een supercomputer (bijvoorbeeld in het geval van universiteitsprojecten)!

Distributed computing draaien zonder uitzondering lachwekkende projecten op.

Huh?
Mijn werkstation draait al een dikke week hoor.

//offtopic
Slechts een opmerking in positieve zin voor degene die dit news-article in elkaar gedraaid heeft: erg leuk gekozen plaatje!! Kon ik wel om lachen! Beetje humor kan nooit kwaad.
//offtopic

Hoeveel heeft het mogen kosten?

Prijs hangt men in europa liever niet aan de grote klok, vaak omdat het factor 2 tot 4 te duur ingekocht wordt. Iedereen weet dat dan en niemand interesseert het.

41 reken nodes @ 32 processors power4.

Dat zijn in totaal dus 1312 processors.

Je kunt deze supercomputer overigens beter zien als 41 stand alone supercomputers van 32 cpu's.

Als je parallel draait over die switch heen dan wordt je daar echt niet gelukkiger van hoor.

De reden dat ik even op kladblaadje uitreken wat het aantal processors is, heeft hier mee te maken namelijk dat zo'n machine vaak per unit wordt afgerekend.

Wat veel uitmaakt is welke snelheid power4 cpu's er in die rekennodes zitten.

Je moet toch al snel denken aan zo'n 1 miljoen euro per 2 rekennodes voor cc-NUMA machines. Echter dit is de dure powerprocessor en die rekennodes zijn volledig SMP staat me bij (we hebben in NL overigens 1 zo'n rekennode).

Dus dat verdubbeld de prijs snel.

1 miljoen euro per rekennode.

41 miljoen euro voor de machine.
Dan nog zo'n 4 miljoen euro voor de switch erbij.

45 miljoen euro.

Dan wordt de duitse staat vast weer getild voor 100% dus dan kom je uit op 90 miljoen euro ongeveer.

Ik hoop overigens dat een ieder zich hier realiseert dat je voor 45 miljoen dollar ook een 10000 processor opteron cluster kunt halen bij IBM.

Wetenschappers zijn echter vaak totaal doorgedraaid onnozel als het gaat om geld van de staat en niet erg zakelijk en WILLEN per se die mooiere power4+ processor hebben in SMP configuratie.

Het voordeel is dus dat je bepaalde jobs die SMP vereisen dus supersnel kunt laten draaien op 32 processors met behoorlijk wat RAM.

Dat is niet mogelijk op zo'n 20000 processor cluster, die overigens wel 60 Tflop haalt, dus voor die matrix berekeningen effectief sneller is. Echter, wetende dat heel duitsland toch 80+ miljoen inwoners heeft, is het zo dat 1000 processors effectief kunnen inzetten voor rekenjobs natuurlijk wel enorme wachtlijsten gaat geven.

Dus het is helemaal niet zo onnozel om voor een paar miljoen eerst even een x duizend processor cluster aan te schaffen.

Die heeft overigens een latency van 5 microsecondes dan van processor naar elke willekeurige processor. Dus in dat opzicht is deze supercomputer nogal traag.

Voor grote jobs boven de 32 processors is dit een trage slak.
«  1  2  3  »

Op dit item kan niet meer gereageerd worden.

Volgende 11:30 AnandTech test chipsets op PCI/AGP-lock
Vorige 00:14 Samsung van plan NAND-flashprijzen flink te verlagen
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011