Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 51 reacties
Bron: EE Times, submitter: Jurroon

Het in CaliforniŽ gevestigde Lawrence Livermore National Laboratory is bezig een supercomputer te bouwen van standaardcomponenten, meldt EE Times. De grap is dat het te bouwen cluster bijna net zo snel zal zijn als de momenteel door hen gebruikte ASCII White system van IBM, maar dan een factor tien goedkoper. De Linux NetworX Evolocity Cluster zal volgens het lab het snelste computercluster ter wereld zijn. Met rond de elf teraflops zal het systeem niet evensnel zijn als de IBM machine, die behoort tot de regionen der 's werelds snelste computers, maar door het gebruik van Linux en standaard onderdelen een stuk vriendelijker voor de portemonnee. Het systeem heeft een aantal unieke features, volgens een lab-woordvoerder, waaronder het gebruik van standaard PCI-sloten voor iedere processor-node:

IBM 704 computerroom in LLNL (1956)The system has a few unique features that the lab says will facilitate applications performance, including a fast, custom-made network that taps into an enterprisewide file system. "We have been using the File Transfer Protocol over Gigabit Ethernet, but now we will be able to read files directly from any available disk," said Mark Seager, assistant department head for terascale systems at the lab.

"This network approach is nice because we can use a standard PCI slot on each processor node, which gives a 4.5-microsecond latency," he said, as opposed to 90-Ķs latency for Gigabit Ethernet.

The network uses bus host adapters on each node, supporting a 320-Mbyte transfer speed in one direction and 400-Mbyte bidirectional throughput. Each processing node is a server board from SuperMicro Inc. (San Jose, Calif.), built around the Intel E7500 chip set with two Xeon processors running at 2.4 GHz. The boards are linked by a network assembled by Linux Networx into a clustered system that will have 960 server nodes.
Moderatie-faq Wijzig weergave

Reacties (51)

Hoeveel flops doet een "normale" pc eigelijk. Ik denk dat dat ter vergelijking wel leuk is om erbij te zetten. Ik lees wel meer van deze berichten, en het klinkt wel alsof het veel is, maar waar moet je het tegenover stellen ???

edit: Wat nou overbodig, er blijken dus toch wel veel mensen te zijn die dit niet weten. Hoe kan je het dan vergelijken ??? Nu krijg je pas echt het idee van: Wow, da's best snel :D
Snelle RISC processoren, zoals de MIPS14000 of Power3/4, halen rond 1 tot 1.5 GFlop/s. (2 of 3 fpu instructies per cycle, op 500MHz). Maar dit is slechts theoretische peak performance. Real life toepassingen die lopen op meer dan 250 MFlop/s zijn snel. Een desktop processor redt dit meestal niet door te kleine level2 caches, dus zeg 50 tot 100 MFlop/s, voor niet triviale berekeningen.
In het artikel wordt het aantal van 960 units genoemd. De processors zijn Intel Xeons 2.4GHz. Per unit zijn 2 Xeons geinstalleerd. De totale (piek?) performance van het cluster is 10000 GFlops.
Dus een simpel rekensommetje leert ons dat een enkele Xeon ongeveer 5.2 GFlops doet.

Overigens zal er ergens op de Intel site vast wel een tabelletje met dat soort gegevens staan.
volgens mijn kunnen ze dat ding dan beter met NV30 kaartjes bouwen, die doen er nl 51...

www.tweakers.net/nieuws/24129

Helaas zal het wel niet helemaal werken... :)


edit:
ff wat meer zoekwerk gedaan, de snelste Xserve (dat 1U ding van Apple) haalt 600 Gflops.

een Itanium2 zou volgens intel 1350 Gflops kunnen halen.
De Itanium doet er 701.

van AMD kon ik niks vinden.
Een gigaflop is 1 miljard ( |:() floating-point berekeningen per seconde.
Floating point berekening per seconde kun je benchen met SiSoft Sandra oid dus reken maar na.

Bron

edit:
Getal ff iets verhoogd
gigaflop One billion floating-point arithmetic operations per second.
billion vertaald naar het nederlands is miljard, niet miljoen...
iedereen zou dat denken maar dat is niet zo, als een amerikaan over billion praat, dan bedoeld hij wel degelijk miljoen in het nederlands. Kwestie van graag vreemd doen zeker :?
WildJim reageert off-topic. Misschien dat Amerikanen soms miljoen wel met billion bedoelen, maar in deze context is de vertaling erg simpel:

Megabyte (Mega = miljoen) 1 miljoen bytes
Gibabyte (Giga = miljard) 1 miljard bytes

Wat maken we dus van een Gigaflop?
(GFLOPS) One thousand million (10^9) floating point operations per second
De grap is dat het te bouwen cluster vrijwel evensnel zal zijn als de momenteel door hen gebruikte ASCII White system van IBM, maar dan een factor tien goedkoper.
De grap hierbij is dat ze de kosten van de onderdelen van de door hun gebouwde computer vergelijken met de kosten van de aanschaf van het ASCII White system van IBM. Bij de laatste zit ook nog een stukje service garantie en support die ze nu waarschijnlijk niet mee rekenen. Ook de kosten de mankracht di het hun gekost heeft zal waarschijnlijk buiten bescouwing gelaten worden. De vergelijking gaat dus niet helemaal op.
Daarnaast vraag ik me af of bijvoorbeeld stroom en koelingskosten meegerekend zijn.
Ik denk dat die IBM ook flink gekoeld diende te worden, en uit ervaring kan ik zeggen dat de meeste IBM machines die ik onder mijn handen heb gehad ook allemaal vrij ruim in de voeding zaten. Overigens spelen die factoren vaak ook een grote bij besluit tussen 1 (super)computer en cluster.

Ik kan me goed voorstellen dat ze misschien 100§ pm meer kwijt zijn aan voedings-kosten, maar dat ze §400 pm besparen op onderhoud & service-contracten. Nou zijn de bedragen wat gok werk, maar het gaat er bij mij niet in dat ze daar geen rekening mee gehouden hebben.
gebruiken ze nou de pci bus direct als netwerk systeem? dus pci bus aan pci bus? waardoor de latecy lager wordt dan bij gigabit ehternet? ik niet snap, dan zal je namenlijk toch altijd weer een controller moeten bouwen die de aansluiting van de pci bus gebruikt om te netwerken, dan heb je in principe toch aleen een voordeel aangezien pci meer anders heeft dan ethernet? naja als iemand het anders leest (waarschijnlijk) dan moeten jullie het me maar uitleggen.
Wat ik wel raar vind is dat er gewone PCI ports worden gebruikt voor de CPU nodes. Het zal wel aan mij liggen maar is dat niet een beetje langzaam. Als je bedenk dat een PCI slot maar een bandbreedte heeft van 133Mhz. ??
Nee dit is niet raar. Er zijn in de professionele markt bv deze die gebruik kunnen maken van de PCI standaard om te communiceren met andere hardware delen (hmzz ok klinkt krom maar ok) De latency daarbij is zoals het stuk al meldt. stukken lager. en in sommige omgevingen ook haast onmisbaar. Daarbij worden dan weer backplates gebruikt om de verschillende cpu cards (zijn zo goed als complete pc's) met elkaar te verbinden. En daardoor hebben de evrschillende onderdelen super snelle verbindingen met elkaar.
Het is een beetje verwarrend idd maar je moet het zo zien: in plaats van een gigabit ethernet kaartje in een pci slot, loopt het netwerk rechtstreeks over de pci bus. Wat dus veel sneller is. Het is zeg maar een pci - pci verbinding. (Zoals het in deze nieuwspost gezegd wordt klopt meer met hoe dat er in werkelijkheid uitziet, maar ik denk dat het zo duidelijker is).
Euhm... Paar 100? Mijn XP2000+ @ 1.67 GHz heeft zo'n 350 Mflops (0.35 Gflops) in SETI@Home...
PCI 33Mhz/32bit wel ja
volgens mij zitten de processoren niet op het pci-slot, maar de netwerkkaart oid...
een mac g4 doet 18gflops, das dus ongeveer 600x minder.
een intel p4 machine doet geloof ik 5 of 6 gflops.
De twee 1,25-GHz PowerPC G4 -processors , met een gezamenlijke snelheid van 18 miljard drijvende-kommaberekeningen per seconde, ofwel 18 gigaflop, plaatsen deze supersonisch snelle Power Mac G4 stevig boven aan de ranglijst van de beste en meest geavanceerde grafische werkstations aller tijden.
Gelukkig staat er ook teraflops...

Das iets meer.
Da's de performance op papier. Dat wil natuurlijk niets zeggen. Het gaat er om hoeveel Gflops je haalt in een normale applicatie. Laten we zeggen Quake, MPEG-compressie of zo (zonder MPEG-compressie-acceleratie-hardware uiteraard)

[reactie was bedoeld op lhynkesd]
dus als we ff rekenen. 2log600 = 9.22
dus als elke 18 maanden de snelheid van de processoren met een factor 2 toeneemt zijn we over 13.8 jaar op elke PC op dat nivo.

vrije interpretatie van de wet van moore. elke 18 maanden 2keer zo snel ipv 2 keer zoveel transistoren (maar klopt wel redelijk).
Die 18 Gigaflops kun je theoretisch halen, al zal het in de praktijk niet of nauwelijks voorkomen. En dan heb je het ook automatisch over de duurste dual-G4 Mac.
De grap is dat het te bouwen cluster vrijwel evensnel zal zijn als de momenteel door hen gebruikte ASCII White system van IBM
Met rond de elf teraflops zal het systeem niet evensnel zijn als de IBM machine
Dit leest niet echt soepel, het cluster is bijna even snel maar toch ook weer niet :?.
De eerste zin geeft aan dat er geen snelle machine voor in de plaats komt, wat om zijn minst opmerkelijk is. Met de tweede geven ze aan dat de IBM sneller is maar het cluster goedkoper.

Overigens over de soepelheid van lezen, dat gaat al een stuk beter als je niet twee zinnen uit de tekst pakt en deze achter elkaar plakt zonder tussenliggende (en volgende) tekst. ;)
Was er laatst niet een nieuws bericht dat AMD samen met een ander een super computer ging bouwen van 1Miljoen Teraflops. ????
nee 15000 terraflops, dus 15 petaflops.
Vraag me af wat er zo superspeciaal is aan een PCI-Slot, dat het in de titel gezet word van deze newspost :?
Het lijkt erop dat ze het netwerk gebaseerd hebben op PCI ipv Gigabit ethernet
"This network approach is nice because we can use a standard PCI slot on each processor node, which gives a 4.5-microsecond latency," he said, as opposed to 90-Ķs latency for Gigabit Ethernet.
Zie foto: dat ze nog magnetische banden gebruiken voor suppercomputers ;-)
Wel een gave foto! Let op die afzuigkoppen op die kasten. Dat is waarschijnlijk het enige wat niet veranderd is bij suppercomputers van vandaag.
dat plaatje wat je ziet is alleen het zogenaamde "werkstation" hoor je wil niet zitten te werken in de echte render farm, dus de aparatuur die aan de andere kant van de muur staat.
Dan ben benieuwd wat er zoals aan Eniac-achtige machines in die renderfarm staan ;-)
Zijn er trouwens ook programma`s die het aantal flops uitrekenen onder windows en linux.

Lijkt me wel aardig om hiero te draaien

<found it>
http://performance.netlib.org/performance/html/flops_1.data.col0.html
</found it>

Best een cool overzicht

Mijn Celeron 1@1.34 Ghz met SiSoft Sandra staat op 1.8GFLOPS (Hij wordt afgemaakt door AMD Athlon (1.8Ghz - FPU 2500MFLOPS) en nauwlijk door de Intel P4 (2.6Ghz - FPU 1400MGLOPS)

iSSE2 wordt natuurlijk niet ondersteund door de Celeron. Je ziet daar dat de Athlon geen iSSE2 ondersteund. Dan wint de P4 2.6Ghz het met bijna 2000Mflops meer. Benchmark is natuurlijk twijfelachtig van Sisoft, maar dat wisten we al langer ;)
de gegevens op die bewuste pagina zijn wel hopeloos verouderd, vind je niet?

snelste intel daar is een Pentium Pro 200
hoe zou een dual Xeon 2.4 het nu doen dan?

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True