Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 35 reacties
Bron: TPC.org

Eind februari schreven we dat een NEC server met 32 Itanium 2 1GHz processors de tweede plaats had veroverd in de TPC-C lijst. De enige server die nog beter scoorde was destijds de veel duurdere Primepower 2000 van Fujitsu met 128 SPARC64-processors. Inmiddels is laatstgenoemde beestje met kracht van zijn eerste plaats afgestoten door systemen van NEC en HP, beide voorzien van de nieuwe Itanium 2 6M 1,5GHz processors. In de nieuwe lijst is te zien dat de NEC-server met 32 Madison-chips bijna 19% hoger scoort dan zijn voorganger met McKinley-chips. De prijs (tegen de zes miljoen dollar) is echter praktisch gelijk gebleven, waardoor de prijs/prestatie-verhouding natuurlijk een stuk beter geworden is.

HP Superdome Opvallender is echter de HP Superdome-server die nu op de eerste plaats staat. Deze kast kost 6,4 miljoen dollar en is voorzien van 64 1,5GHz Itanium 2 6M-processors. Draaiend met de 64-bit versies van Microsoft SQL Server 2000 en Windows .NET Enterprise Server 2003 zet deze machine een score neer van 658.277 transacties per minuut, 28% meer dan de nummer twee kan verwerken. Niet alleen is de Superdome op dit moment met afstand de snelste non-clustered database, maar ook nog eens degene met de beste prijs/prestatieverhouding in de top 10.

Top-5 non-clustered TPC-C performance
HP Superdome (64x Itanium 2 1,5GHz) 658277
NEC Express5800/1320Xc (32x Itanium 2 1,5GHz) 514034
Fujitsu PrimePower 2000 (128x Sparc64 GP 563MHz) 455818
NEC Express5800/1320Xc (32x Itanium 2 1,0GHz) 433107
IBM eServer pSeries 690 (32x Power4 1,3GHz) 427760

Lees meer over

Gerelateerde content

Alle gerelateerde content (32)
Moderatie-faq Wijzig weergave

Reacties (35)

En dan nog zijn er mensen die beweren dat Microsoft geen schaalbare (enterprise) producten maakt. Met 64 processoren maarliefst 45% sneller zijn dan het eerstvolgende met 128 processoren uitgeruste Sparc/UNIX systeem (dat ook nog eens letterlijk 2x zo duur is):

http://www.tpc.org/tpcc/results/tpcc_perf_results.asp?resulttype=noncl uster&version=5
Het punt is dat bij unix machines met tuxedo als transaction monitor veel werk op de server gedaan wordt, terwijl bij MS met DTC/COM+ als transaction coordinator veel werk op de client wordt gedaan (veel als in: meer dan op de server). Hierdoor is de server stukken rapper en verdeel je het werk beter over je totale park, echter is er een grotere kans op falende transacties als je de transacties uitrekt over het netwerk ipv ze start op de server, ze laat leven op de server en het resultaat terugkrijgt op de client.

Dit maakte ik althans op uit unix-adepten die de TPC resultaten met argusogen volgen. Ikzelf heb meer zoiets van: tja, de teller staat wel erg hoog bij die MS oplossingen, en falende transacties tellen niet, dus er slagen wel een heleboel, misschien heeft MS het wat slimmer bekeken en gebruikt het de beschikbare resources wat beter dan de Unix systemen.

(overigens is dit de reden waarom sun geen TPC results inlevert, het zou niet realistisch zijn om transactions uit te rekken vanaf de client naar de server en terug)
Waarschijnlijk zijn veel van die UNIX adepten waaraan je refereert nog steeds aan het denken in inmiddels verouderde client-server architecturen. De transaction coordinator bij MS werkt namelijk niet op de client maar op de middle-tier.

Dit zou standaard moeten zijn in elke enterprise oplossing en ik kan me niet voorstellen dat tuxedo dit doet op dezelfde server als de database. Een goede enterprise oplossing is immers opgebouwd uit 3 of meerdere tiers:

1. database
2. middleware
3. client.

De 3-tier architectuur die Microsoft hanteert heeft juist een hogere betrouwbaarheid en veel minder kans op falen. De middle-tier is onafhankelijk van de databaseserver en je kan voor hoge beschikbaarheid meerdere middle-tier servers (en dus meerdere transaction coordinatoren) gebruiken. Dit voorkomt een single point of faillure die je in client-server omgevingen vaak ziet.
Ik weet hoe de MS oplossing werkt (bouw die apps full time ;) ) maar niet hoe de unix oplossing werkt. (ken tuxedo niet). Het is zo dat in de MS oplossing, de client (dus de code direct achter de gui) de transaction start, dat deze doorrolt in de middle tier, dal, database en terug. Dit is logisch: de starter van de transaction wil ook het resultaat ontvangen en deze bevindt zich in de client. Je hebt dus op alle systemen een DTC process nodig die de boel coordineren.

Ik weet niet in hoeverre die unix clients hierin meegaan, of ze ook de transaction starten echt fysiek op de client, of dat ze een RPC doen naar een service op de server en dat daar in feite de transaction gestart wordt. In dat geval heb je nl geen client-server verkeer nodig mbt de transactions, wat meer solide is, maar zoals ik al zei: het aantal geslaagde transacties is dermate hoog dat het me prietpraat lijkt van die unix-adepten :)
Schaalbaarheid heeft niets te maken met een vergelijking met de concurrent.

Ultieme schaalbaarheid is als je 2x zoveel processors gebruikt, je precies 2x zo snel bent. In de praktijk haal je dat niet door allerlei overhead.

Maar 64 processoren op systeem X vergelijken met 128 processoren op systeem Y zegt natuurlijk niet dat die 64 meer schaalbaar zijn, maar alleen dat ze sneller zijn (eventueel in combinatie met de gebruikte software).

Je zou 64 processoren op systeem X moeten vergelijken met 128 processoren op systeem X. Daaruit komt een snelheidswinst (bv. 1.8x). Je doet dan hetzelfde (64 proc sys Y vgl met 128 proc sys Y) en daar komt ook een snelheidswinst uit (bv. 1.6x).

Door die twee getallen (1.8 en 1.6) te vergelijken kun je iets zeggen over de schaalbaarheid.

(Schaalbaarheid zegt dan weer niets over de uiteindelijke snelheid van een systeem, en dat is natuurlijk in de praktijk belangrijk, daar heb je zeker gelijk in)
Er zijn ook flink wat taken te bedenken waarin die SPARC sneller is ... in MsSQL DB's graven is de itanium idd heer en meester dankzij vele optimalistaties voor de Itanium(2), maar de Itanium is gemaakt door Intel niet door Microsoft.

64 procs (ik denk in 8 of 16 nodes) is nou ook overigens niet echt bepaald het toppunt van schaalbaarheid. Deze schaalbaarheid kan je ook met veel meer (andere) producten halen.
64 procs (ik denk in 8 of 16 nodes) is nou ook overigens niet echt bepaald het toppunt van schaalbaarheid.
Het is de benchmark voor "non-clustered" configurations. 64 CPU's in een box dus.

Voor clustered results kijk hier:
http://www.tpc.org/tpcc/results/tpcc_perf_results.asp?resulttype=clust er&version=5
Dit soort grote 32-way en 64-way systemen zijn opgebouwd uit modules met vaak vier of acht processors die via zeer snelle externe interconnects een single system image met een gedeeld geheugen (wat bij een cluster niet het geval is) vormen. Een voorbeeld is de SGI Altix 3000, waarover je hier meer kunt lezen. Newisys is bezig met een modulaire 4-way Opteron rackmounts die opgeschaald kunnen worden tot een 32-way systeem.
wou je daarmee zeggen dat er mobo's bestaan waar 64 proc's op passen? lijkt me best wel stug eigenlijk.. pics?
De Fujitsu PrimePower 2000 draaide op 128 563MHz Sparc64 GP processors. Dit is de vorige generatie Sparc64 processor van Fujitsu. Het is geen wonder dat 64 Itanium 2 processors op 1,5GHz sneller zijn.
Niet alleen is de Superdome op dit moment met afstand de snelste non-clustered database, maar ook nog eens degene met de beste prijs/prestatieverhouding.
Nope....das de QuatreX-64 4P Opteron 844/32GB van Racksaver.....zie hier. Op een niet geoptimaliseerd besturingssysteem, met niet geoptimaliseerde software.
En waarschijnlijk op de lange duur zowiezo alleen al goedkoper in stroomverbruik dan de energie slurpende Itaniums
Ehm, gedeeltelijk. In de tabel op de site staat toch duidelijk dat er "Microsoft Windows Server 2003 Enterprise Server" gebruikt is als OS. Dat OS maakt wel gebruik van NUMA en is dus in staat om de betere geheugen architectuur wel te gebruiken en haalt dus veel betere resultaten dan bijvoorbeeld Windows 2000.

Het maakt alleen nog geen gebruik van het 64-bit gedeelte, dat klopt en daar kan de Opteron dus nog wat performance winst mee behalen. Alleen heb ik het idee dat NUMA ondersteuning voor de performance meer helpt als 64-bit ondersteuning voor de meeste toepassingen.

edit:

En inderdaad heb je niet goed gekeken, de benchmark resultaten die jij geeft gaan over systemen waar veel minder CPU's inzitten. Zo gebruikt de winnaar 4 Opteron 844 1,8GHz CPU's

De nummer twee gebruikt 1 Xeon 2,4GHz CPU, vandaar het grote verschil.

De winnaar haalt een resultaat van 82,226, iets minder dan het resultaat van de Superdome dus ;) (658277).
Hmmm jij zegt dus dat een 8 cpu's tellend opteron sys een 64 cpu's tellend Intanium sys eruit trekt? Je moet minstens 8 van die operon dingen clusteren om dit te berijken niks mis met de opteron hoor maar die KAN simpelweg niet met z'n 64tiggen in een sys en jouw vergelijking gaat dus niet op want het gaat hier over NON-clustered systemen.

De Opteron is een prima CPU maar totaal niet te vergelijken met de Itanium CPU's. Vergelijk de Opteron maar met de XEON / XEON MP.
De Opteron kan heus wel in een 64-way systeem gebruikt worden. Het zal zelfs relatief eenvoudig zijn omdat de Opteron van zichzelf al erg schaalbaar is. Alles wat nodig is, is een crossbar switch waarmee groepen van acht of vier processors aan elkaar geknoopt kunnen worden. Het levende bewijs is Cray, die een supercomputer met een stuk of 10.000 Opterons aan het bouwen is. Newisys is bezig met een crossbar switch waarmee 4-way systemen opgestapeld kunnen worden tot een 32-way machine (single system image, geen cluster). Meer dan 32 processors heeft voorlopig geen zin omdat er toch geen markt voor is.
lezen is ook een vak schijnbaar, want er staat duidelijk dat het om de PRIJS/PRESTATIE vehouding gaat...
tuurlijk trekt een 8-way opteron systeem een 64-way itaniumsysteem er niet uit. dat lukt zelfs een 8-way itanium systeem niet... :+
Het kan best zijn dat de QuatreX-64 4P Opteron 844/32GB van Racksaver een betere prijs/prestatie verhouding heeft, maar als je de zin die je daar aanhaalt volledig leest:
"... de beste prijs/prestatie verhouding in de top 10"

Dus als je met dit klein detail ook rekening houdt, dan klopt het wel weer helemaal! :)
Tering! Misschien dat nog niemand het opgevallen is, maar kijk eens wat een performance die opteron haalt:

4x opteron 1.8Ghz 82K
2x Xeon 2.8Ghz 26K - 38K
1x Xeon 2.4Ghz 18K

Als deze resultaten kloppen, performt de Opteron dus *best* goed in de TPC-C benchmarks.

De benchmarks zijn wel vreemd; een 4 cpu Xeon haalt tussen de 52K en de 78K, da's nogal een range. Maargoed, de best performende 4cpu Xeon kost 2x zoveel als het opteron systeempje.

Ik hoop dat er binnenkort meer opteron resultaten bij TPC ingeleverd worden, dat kan nog interessant worden. Een 32-way systeempje gaat zeker hoge ogen gooien denk ik zo (i.i.g. top 10, waarschijnlijk top 3 ofzo)
even een ontzettende n00bvraag.

Wat is heel concreet de doelgroep voor dit soort systemen? En waarom kopen bedrijven zo'n ding? Is het voor wetenschappelijke doeleinden enz. (even ons zonnestelsel renderen)? Of is zoveel rekenkracht echt nodig voor webservers om bijv. tweakers.net te bedienen?
Nope, dit zijn vooral grote databases die op dit soort machines draaien. Dat is ook het enige waar dit soort systemen worden gebruikt. Als ze in combinatie met webservers worden gebruikt staan er meestal aparte webservers en dienen dit soort jongens als back-end.
Dit soort systemen worden niet voor webservers gebruikt, maar meestal als grote renderfarms om super complexe data te verwerken, zoals het in kaart brengen van het DNA, het uitrekenen van de effecten van een kernexplosie is, het berekenen van weer (erg complexe zaak, al zou je dat niet denken als je Piet Paulusma ziet ;)) etc.

Webservers hebben dit soort super rekenkracht niet nodig, het servereren van pagina's is niet complex, dan kan je het beter vergelijken met de database servers van Tweakers.net, die hebben veel meer werk te verichten en daardoor worden database benchmarks meestal gebruikt om de kracht van de systemen aan te duiden. Zo ook nu weer.
Doelgroep zijn bedrijven die enorm veel transacties per seconde moeten verwerken.
Denk hierbij aan:

Beuzen (AEX, Nasdaq)
Banken (pinbetalingen, overboekingen)
Creditcardmaatschappijen (verwerken van alle transacties)
etc. etc.

Maar het is denk ik meer een voorbeeld dat Wintel Servers met SQL als database de grootst mogelijke omgevingen aankunnen (en dus schaalbaar zijn van file- en printserver tot datacenter oplossing). Denk dat MS af wil van het imago van "leuke oplossingen voor het MKB".
Femme, is dit niet het overwegen waard voor het Tweakers-serverpark? Kun je lekker mee patseren... :+
Doneer jij even 6,4 miljoen dollar?
Het was inderdaad een optie geloof ik, maar is afgewezen omdat ze niet in de 19" racks van TrueServer passen :+

:P
wel een heel mooie kast die er omheen.
zit doet me wel een beetje aan een koffie automaat denken

1 kleine opmerking deze server kan 32 clients aan is dat niet een beetje weinig ?
Die server kan heel wat meer cliŽnts aan. Ze bedoelen dat er 32 cliŽnts gebruikt werden om al die aanvragen te doen tijdens de benchmark :).
waar in dit hele verhaal lees jij dat dat ding maar 32 clients aan kan?
Die ga ik binnenkort ook maar is aanschaffen denk ik :9
Eentje maar? Dacht er gelijk maar drie te bestellen. :P
Kom maar op met die opteron! }>
We wachten af, ik denk dat we niet lang hoeven te wachten :9
als je de link volgt naar de hp superdrome zie je dat
maar mijn vraagje is al beantwoordt.
In het K7 design was al rekening gehouden met een theoretisch maximum van 14 miljoen geschakelde CPU's. Ik denk dat we spoedig ook zulke Opteron servers zullen gaan zien met zo'n 64 CPU's. HTB staat weliswaar geen 14 miljoen CPU's toe maar toch zeker wel 64. Wat intel al jaren kan, zal nu geopteroniseerd gaan worden!

Trouwens raar dat nr3 relatief zo zwak presteerd...

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True