Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 29 reacties
Bron: Ars Technica

Op Ars Technica is een technisch, maar zeer interessant verhaal te vinden over de werking van de KLAT2 (Kentucky Linux Athlon Testbed 2) supercomputer. Deze cluster is ontworpen door mensen van de University of Kentucky en bestaat uit 64 Athlon-gebaseerde systemen. KLAT2 gebruikt zeer efficiënte technieken om de prijs van deze supercluster laag te houden en de performance omhoog te halen. Dit laatste gebeurt o.a. door gebruik te maken van de 3DNow! technologie:

Most processor instruction sets recently have been extended with what we generically call SWAR (SIMD Within A Register) instructions that allow the programmer to specify quite a bit of parallelism. Using these SWAR instructions for scientific computing, not just the 3D games that motivated their development, is the other technological key to achieving supercomputer performance at record low cost. This performance boost isn't trivial to achieve, but the hardware to support it is already there, so it is free.

Now you're probably thinking that Athlons are pretty fast anyway, so why do I need to worry about SWAR/3DNow! stuff? While it is true that, per processor, the Athlons in KLAT2 are slightly faster in double-precision floating point performance than the Alphas in LANL's Avalon, using 3DNow! can provide a huge additional boost. On ScaLAPACK (the benchmark application used in the Top500 supercomputers list), KLAT2's 80/64-bit double-precision performance is around 22.8 GFLOPS, a very respectable number. Then again, using 3DNow!, KLAT2's single-precision ScaLAPACK performance zips to over 64 GFLOPS. That's nearly a 3X boost at no additional cost!

Er valt heel veel over dit artikel te zeggen, vooral het gedeelte over het oplossen van het 'netwerkprobleem' is zeer interessant, maar veel te lang om iets uit te quoten. Gewoon zelf lezen.

Moderatie-faq Wijzig weergave

Reacties (29)

Must... assimmilate... resistance is futile...

}:O
Een erg indrukwekkende oplossing voor het routing probleem om het met grafen theorie op te lossen. Wat me wel zorgen baart is dat ze voor 64 nodes al veel rekentijd nodig hebben om een goed schema met routing tabellen en switch verbindingen op te bouwen. Dit wordt dan bij 1024 nodes een veel extremer probleem.

Dit soort getallen zijn niet ondenkbaar als je bijvoorbeeld de renderfarm van ILM in gedachte houdt.

De toepassing van 3DNow! extenties op lineaire algebra in een gedistribueerde omgeving is iets waar zelfs AMD geen rekening mee gehouden zal hebben. Met MATLAB kom ik met een paar duizend cases al een in een paar seconden uit mijn samengestelde matrix bewerkingen. Wil het zin hebben om dit over 64 Athlons tegelijk te doen dan moeten ze wel heftige vloeistof dynamica modellen of kernexplosies simuleren.

Gaaf speelgoed maar wel echt voor de extremere toepassingen.
Inderdaad DrZeuss... maareh, je merkt toch wel dat het verdelen van de processen in dit geval toch wel wat kost:
136 MKeys voor 64xAthlon 800 = 2.125 MKeys/PC
Thuis:
Athlon 550@650 -> 2.20 MKeys/sec
Dus er is best een verschilletje, 150 MHz minder, en sneller!!!! Ik vraag me ook af hoe DNet er draait.... hij zal wel per processor één instance draaien net als bij een "gewoon" multiprocessor systeem :P
Ik weet wat mijn vader gaat kopen voor mij morgen, dan mogen jullie best een keer komen kijken. :) :7

Ik heb het net effe een stukkie zitten lezen, en zeker weten dat het boeiend is. Vooral het feit dat je denkt dat het een symetrische bekabeling moet worden, maar dat het dat niet blijkt te zijn, verbaasde mij.
Dus dat ding staat te grazen voor AT }>

22,8 GFlops is geen kattepis
die van mij is lekker sneller!!!!!!! :7
en in welke duw je nou je unreal tournament cd-tje?
en kun je zo een stuk of honderd cd's tegelijk kopieren? :)
zitten wel brute koelers bij
ps:
ja jippit deze post is al eerder gepost
ps wat bet. (score 0) gemodereerd????
Ja hoor, Crazy Bert, zie jij een cd-rom speler? Laat staan een schrijver.

Maarre, ken ik dit plaatje niet ergens van? Volgens mij is dit al eerder gepost...'k kan me vergissen natuurlijk.
Dit heeft een week of wat geleden ook al in het nieuws getaan dacht ik :), maar wel cool, hebbe

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True