Tien teraflops supercomputer "snelste cluster ter wereld"

Het in Californië gevestigde Lawrence Livermore National Laboratory is bezig een supercomputer te bouwen van standaardcomponenten, meldt EE Times. De grap is dat het te bouwen cluster bijna net zo snel zal zijn als de momenteel door hen gebruikte ASCII White system van IBM, maar dan een factor tien goedkoper. De Linux NetworX Evolocity Cluster zal volgens het lab het snelste computercluster ter wereld zijn. Met rond de elf teraflops zal het systeem niet evensnel zijn als de IBM machine, die behoort tot de regionen der 's werelds snelste computers, maar door het gebruik van Linux en standaard onderdelen een stuk vriendelijker voor de portemonnee. Het systeem heeft een aantal unieke features, volgens een lab-woordvoerder, waaronder het gebruik van standaard PCI-sloten voor iedere processor-node:

The system has a few unique features that the lab says will facilitate applications performance, including a fast, custom-made network that taps into an enterprisewide file system. "We have been using the File Transfer Protocol over Gigabit Ethernet, but now we will be able to read files directly from any available disk," said Mark Seager, assistant department head for terascale systems at the lab.

"This network approach is nice because we can use a standard PCI slot on each processor node, which gives a 4.5-microsecond latency," he said, as opposed to 90-µs latency for Gigabit Ethernet.

The network uses bus host adapters on each node, supporting a 320-Mbyte transfer speed in one direction and 400-Mbyte bidirectional throughput. Each processing node is a server board from SuperMicro Inc. (San Jose, Calif.), built around the Intel E7500 chip set with two Xeon processors running at 2.4 GHz. The boards are linked by a network assembled by Linux Networx into a clustered system that will have 960 server nodes.

Vorig nieuwsartikel Volgend nieuwsartikel

Door Jack Leenders

Feedback • 12-11-2002 12:09
51 • submitter: Jurroon

12-11-2002 • 12:09

Submitter: Jurroon

Bron: EE Times

Lees meer

Space Simulator Cluster gebaseerd op Shuttle barebones Nieuws van 26 november 2002

IBM haalt order voor Power5 supercomputer binnen Nieuws van 20 november 2002

IBM introduceert opvolger van Deep Blue Nieuws van 18 november 2002

x86-clusters voor het eerst in top 10 van supercomputers Nieuws van 15 november 2002

Sun beveiligt netwerken tegen grote rampen Nieuws van 29 oktober 2002

IBM kiest Linux voor nieuwe supercomputers Nieuws van 25 oktober 2002

IBM introduceert Power blade-servers Nieuws van 24 oktober 2002

Unisys ES7000 met TPC-H Itanium 2 benchmark Nieuws van 22 oktober 2002

Linux NetworX samen met Fraunhofer in supercomputers Nieuws van 20 oktober 2002

Quadrics bouwt Itanium 2 supercomputer Nieuws van 11 oktober 2002

Geen Itanium 2 voor Google Nieuws van 4 oktober 2002

Linux cluster met 2048 CPU's voor kernwapensimulatie Nieuws van 24 september 2002

Cornell, Dell, Intel en Microsoft in supercomputerdeal Nieuws van 7 augustus 2002

Industrial Light & Magic stapt over op Intel workstations Nieuws van 26 juli 2002

Weta bouwt renderfarm van 220 dual Xeon servers Nieuws van 19 juli 2002

Scooby Doo geboren in Athlon MP renderfarm Nieuws van 28 juni 2002

Rocketcalc introduceert Redstone cluster computer Nieuws van 21 mei 2002

Clustersystemen in-depth bij Digit-Life Nieuws van 22 april 2002

Cray gaat Dell computerclusters leveren Nieuws van 5 februari 2002

Meer producten en artikelen

Computers

Reacties (51)

-Moderatie-faq

Wijzig sortering

Brainwaste 12 november 2002 12:11

Hoeveel flops doet een "normale" pc eigelijk. Ik denk dat dat ter vergelijking wel leuk is om erbij te zetten. Ik lees wel meer van deze berichten, en het klinkt wel alsof het veel is, maar waar moet je het tegenover stellen ???

edit: Wat nou overbodig, er blijken dus toch wel veel mensen te zijn die dit niet weten. Hoe kan je het dan vergelijken ??? Nu krijg je pas echt het idee van: Wow, da's best snel

JSK @Brainwaste • 12 november 2002 13:06

Snelle RISC processoren, zoals de MIPS14000 of Power3/4, halen rond 1 tot 1.5 GFlop/s. (2 of 3 fpu instructies per cycle, op 500MHz). Maar dit is slechts theoretische peak performance. Real life toepassingen die lopen op meer dan 250 MFlop/s zijn snel. Een desktop processor redt dit meestal niet door te kleine level2 caches, dus zeg 50 tot 100 MFlop/s, voor niet triviale berekeningen.

styno @Brainwaste • 12 november 2002 13:06

In het artikel wordt het aantal van 960 units genoemd. De processors zijn Intel Xeons 2.4GHz. Per unit zijn 2 Xeons geinstalleerd. De totale (piek?) performance van het cluster is 10000 GFlops.
Dus een simpel rekensommetje leert ons dat een enkele Xeon ongeveer 5.2 GFlops doet.

Overigens zal er ergens op de Intel site vast wel een tabelletje met dat soort gegevens staan.

I.R. Overclocked @styno • 12 november 2002 18:24

volgens mijn kunnen ze dat ding dan beter met NV30 kaartjes bouwen, die doen er nl 51...

www.tweakers.net/nieuws/24129

Helaas zal het wel niet helemaal werken...

edit:
ff wat meer zoekwerk gedaan, de snelste Xserve (dat 1U ding van Apple) haalt 600 Gflops.

een Itanium2 zou volgens intel 1350 Gflops kunnen halen.
De Itanium doet er 701.

van AMD kon ik niks vinden.

hellbringer @Brainwaste • 12 november 2002 21:22

Een gigaflop is 1 miljard (

) floating-point berekeningen per seconde.
Floating point berekening per seconde kun je benchen met SiSoft Sandra oid dus reken maar na.

Bron

edit:
Getal ff iets verhoogd

I.R. Overclocked @hellbringer • 13 november 2002 00:53

gigaflop One billion floating-point arithmetic operations per second.

billion vertaald naar het nederlands is miljard, niet miljoen...

Verwijderd @I.R. Overclocked • 13 november 2002 03:27

iedereen zou dat denken maar dat is niet zo, als een amerikaan over billion praat, dan bedoeld hij wel degelijk miljoen in het nederlands. Kwestie van graag vreemd doen zeker

Verwijderd @I.R. Overclocked • 13 november 2002 08:04

WildJim reageert off-topic. Misschien dat Amerikanen soms miljoen wel met billion bedoelen, maar in deze context is de vertaling erg simpel:

Megabyte (Mega = miljoen) 1 miljoen bytes
Gibabyte (Giga = miljard) 1 miljard bytes

Wat maken we dus van een Gigaflop?
(GFLOPS) One thousand million (10^9) floating point operations per second

Verwijderd 12 november 2002 12:14

De grap is dat het te bouwen cluster vrijwel evensnel zal zijn als de momenteel door hen gebruikte ASCII White system van IBM, maar dan een factor tien goedkoper.

De grap hierbij is dat ze de kosten van de onderdelen van de door hun gebouwde computer vergelijken met de kosten van de aanschaf van het ASCII White system van IBM. Bij de laatste zit ook nog een stukje service garantie en support die ze nu waarschijnlijk niet mee rekenen. Ook de kosten de mankracht di het hun gekost heeft zal waarschijnlijk buiten bescouwing gelaten worden. De vergelijking gaat dus niet helemaal op.

mvt @Verwijderd • 12 november 2002 12:16

Daarnaast vraag ik me af of bijvoorbeeld stroom en koelingskosten meegerekend zijn.

Atmosphere @mvt • 12 november 2002 12:29

Ik denk dat die IBM ook flink gekoeld diende te worden, en uit ervaring kan ik zeggen dat de meeste IBM machines die ik onder mijn handen heb gehad ook allemaal vrij ruim in de voeding zaten. Overigens spelen die factoren vaak ook een grote bij besluit tussen 1 (super)computer en cluster.

Ik kan me goed voorstellen dat ze misschien 100€ pm meer kwijt zijn aan voedings-kosten, maar dat ze €400 pm besparen op onderhoud & service-contracten. Nou zijn de bedragen wat gok werk, maar het gaat er bij mij niet in dat ze daar geen rekening mee gehouden hebben.

killercow 12 november 2002 12:33

gebruiken ze nou de pci bus direct als netwerk systeem? dus pci bus aan pci bus? waardoor de latecy lager wordt dan bij gigabit ehternet? ik niet snap, dan zal je namenlijk toch altijd weer een controller moeten bouwen die de aansluiting van de pci bus gebruikt om te netwerken, dan heb je in principe toch aleen een voordeel aangezien pci meer anders heeft dan ethernet? naja als iemand het anders leest (waarschijnlijk) dan moeten jullie het me maar uitleggen.

Verwijderd 12 november 2002 12:15

Wat ik wel raar vind is dat er gewone PCI ports worden gebruikt voor de CPU nodes. Het zal wel aan mij liggen maar is dat niet een beetje langzaam. Als je bedenk dat een PCI slot maar een bandbreedte heeft van 133Mhz. ??

Qwerty-273 @Verwijderd • 12 november 2002 12:26

Nee dit is niet raar. Er zijn in de professionele markt bv deze die gebruik kunnen maken van de PCI standaard om te communiceren met andere hardware delen (hmzz ok klinkt krom maar ok) De latency daarbij is zoals het stuk al meldt. stukken lager. en in sommige omgevingen ook haast onmisbaar. Daarbij worden dan weer backplates gebruikt om de verschillende cpu cards (zijn zo goed als complete pc's) met elkaar te verbinden. En daardoor hebben de evrschillende onderdelen super snelle verbindingen met elkaar.

PowerFlower @Verwijderd • 12 november 2002 12:51

Het is een beetje verwarrend idd maar je moet het zo zien: in plaats van een gigabit ethernet kaartje in een pci slot, loopt het netwerk rechtstreeks over de pci bus. Wat dus veel sneller is. Het is zeg maar een pci - pci verbinding. (Zoals het in deze nieuwspost gezegd wordt klopt meer met hoe dat er in werkelijkheid uitziet, maar ik denk dat het zo duidelijker is).

Sorcerer8472 @Verwijderd • 12 november 2002 12:54

Euhm... Paar 100? Mijn XP2000+ @ 1.67 GHz heeft zo'n 350 Mflops (0.35 Gflops) in SETI@Home...

jp @Verwijderd • 12 november 2002 12:58

PCI 33Mhz/32bit wel ja

laurensl @Verwijderd • 12 november 2002 12:18

volgens mij zitten de processoren niet op het pci-slot, maar de netwerkkaart oid...

Verwijderd 12 november 2002 12:15

een mac g4 doet 18gflops, das dus ongeveer 600x minder.
een intel p4 machine doet geloof ik 5 of 6 gflops.

De twee 1,25-GHz PowerPC G4 -processors , met een gezamenlijke snelheid van 18 miljard drijvende-kommaberekeningen per seconde, ofwel 18 gigaflop, plaatsen deze supersonisch snelle Power Mac G4 stevig boven aan de ranglijst van de beste en meest geavanceerde grafische werkstations aller tijden.

ACM Software Architect @Verwijderd • 12 november 2002 12:18

Gelukkig staat er ook teraflops...

Das iets meer.

Verwijderd @ACM • 12 november 2002 12:24

Da's de performance op papier. Dat wil natuurlijk niets zeggen. Het gaat er om hoeveel Gflops je haalt in een normale applicatie. Laten we zeggen Quake, MPEG-compressie of zo (zonder MPEG-compressie-acceleratie-hardware uiteraard)

[reactie was bedoeld op lhynkesd]

boner @Verwijderd • 12 november 2002 13:04

dus als we ff rekenen. 2log600 = 9.22
dus als elke 18 maanden de snelheid van de processoren met een factor 2 toeneemt zijn we over 13.8 jaar op elke PC op dat nivo.

vrije interpretatie van de wet van moore. elke 18 maanden 2keer zo snel ipv 2 keer zoveel transistoren (maar klopt wel redelijk).

Verwijderd @Verwijderd • 12 november 2002 13:06

Die 18 Gigaflops kun je theoretisch halen, al zal het in de praktijk niet of nauwelijks voorkomen. En dan heb je het ook automatisch over de duurste dual-G4 Mac.

Domino 12 november 2002 12:16

De grap is dat het te bouwen cluster vrijwel evensnel zal zijn als de momenteel door hen gebruikte ASCII White system van IBM

Met rond de elf teraflops zal het systeem niet evensnel zijn als de IBM machine

Dit leest niet echt soepel, het cluster is bijna even snel maar toch ook weer niet

Atmosphere @Domino • 12 november 2002 12:22

De eerste zin geeft aan dat er geen snelle machine voor in de plaats komt, wat om zijn minst opmerkelijk is. Met de tweede geven ze aan dat de IBM sneller is maar het cluster goedkoper.

Overigens over de soepelheid van lezen, dat gaat al een stuk beter als je niet twee zinnen uit de tekst pakt en deze achter elkaar plakt zonder tussenliggende (en volgende) tekst.

Verwijderd 12 november 2002 12:20

Was er laatst niet een nieuws bericht dat AMD samen met een ander een super computer ging bouwen van 1Miljoen Teraflops. ????

Verwijderd @Verwijderd • 12 november 2002 12:24

nee 15000 terraflops, dus 15 petaflops.

Verwijderd 12 november 2002 12:24

Vraag me af wat er zo superspeciaal is aan een PCI-Slot, dat het in de titel gezet word van deze newspost

DennisBoom @Verwijderd • 12 november 2002 13:19

Het lijkt erop dat ze het netwerk gebaseerd hebben op PCI ipv Gigabit ethernet

"This network approach is nice because we can use a standard PCI slot on each processor node, which gives a 4.5-microsecond latency," he said, as opposed to 90-µs latency for Gigabit Ethernet.

rashmatash 12 november 2002 12:28

Zie foto: dat ze nog magnetische banden gebruiken voor suppercomputers ;-)
Wel een gave foto! Let op die afzuigkoppen op die kasten. Dat is waarschijnlijk het enige wat niet veranderd is bij suppercomputers van vandaag.

Verwijderd @rashmatash • 12 november 2002 12:30

dat plaatje wat je ziet is alleen het zogenaamde "werkstation" hoor je wil niet zitten te werken in de echte render farm, dus de aparatuur die aan de andere kant van de muur staat.

Timfonie @Verwijderd • 12 november 2002 13:57

Dan ben benieuwd wat er zoals aan Eniac-achtige machines in die renderfarm staan ;-)

Zware Unit

12 november 2002 12:36

Zijn er trouwens ook programma`s die het aantal flops uitrekenen onder windows en linux.

Lijkt me wel aardig om hiero te draaien

<found it>
http://performance.netlib.org/performance/html/flops_1.data.col0.html
</found it>

Best een cool overzicht

Mijn Celeron 1@1.34 Ghz met SiSoft Sandra staat op 1.8GFLOPS (Hij wordt afgemaakt door AMD Athlon (1.8Ghz - FPU 2500MFLOPS) en nauwlijk door de Intel P4 (2.6Ghz - FPU 1400MGLOPS)

iSSE2 wordt natuurlijk niet ondersteund door de Celeron. Je ziet daar dat de Athlon geen iSSE2 ondersteund. Dan wint de P4 2.6Ghz het met bijna 2000Mflops meer. Benchmark is natuurlijk twijfelachtig van Sisoft, maar dat wisten we al langer

bennovb @Zware Unit • 12 november 2002 13:47

de gegevens op die bewuste pagina zijn wel hopeloos verouderd, vind je niet?

snelste intel daar is een Pentium Pro 200
hoe zou een dual Xeon 2.4 het nu doen dan?

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (51)

Sorteer op:

Weergave: