Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 29 reacties
Bron: TPC

De dinsdag geïntroduceerde IBM eServer pSeries 690 Power4 1,7GHz server heeft een nieuw snelheidsrecord voor non-clustered systemen gevestigd in de TPC-C-benchmark van het Transaction Processing Performance Council. De pSeries 690 bereikte een score van 680.612 TpmC en presteerde daarmee 3,4 procent beter dan de HP Superdome, die slechts enkele weken van zijn koppositie mocht genieten. De IBM pSeries 690 was voorzien van zestien dual-core Power4 1,7GHz processors, verdeeld over vier multi-chip modules met elke een gedeeld L3 cache van 128MB. In totaal was er 512GB geheugen in het systeem aanwezig. De HP Superdome draaide op 64 Itanium 2 1,5GHz processors met 6MB L3 cache en had eveneens de beschikking over 512GB geheugen.

IBM PowerPC 970 core met Power4 core (klein)Andere belangrijke verschillen tussen de systemen van IBM en HP waren het besturingsysteem en de data- basesoftware. De IBM-machine draaide op AIX 5L V5.2 en IBM DB2 8.1, terwijl HP gebruik maakte van Microsoft SQL Server 2000 Enterprise op Windows Server 2003 Datacenter Edition. De HP Superdome bleef de IBM pSeries 690 wel voor op het gebied van price/performance. De prijs per TpmC betrof respectievelijk $9,80 en $11,13 voor de machines van HP en IBM. Bij IBM waren ze zeer te spreken over de prestaties van de pSeries 690, getuige deze quote van The Inquirer:

The firm said HP had taken 18 months to catch up to its performance using its Power chips, and that lead only lasted a few weeks. It took a further dig at HP and Intel. Adalio Sanchez, general manager of the eServer division, said: "We don't just assemble boxes with third party components"
Top zes non-clustered TPC-C performance
IBM eServer pSeries 69032xPower4 1,7GHz 680613
HP Superdome64xItanium 2 1,5GHz 658277
NEC Express 580032xItanium 2 1,5GHz 514035
Fujitsu PrimePower 2000128xSparc64 GP 563MHz 455818
NEC Express 580032xItanium 2 1GHz 433108
IBM eServer pSeries 69032xPower4 1,3GHz 427761
Moderatie-faq Wijzig weergave

Reacties (29)

hier zie je eer dat mhz niet alles wil zeggen 64x 1.5 of 32 * 1.7. Toch win de 1.7 het. Zij het zo dat het verschil aanzienlijk kleiner is dan het verschil tussen 2 en 3.
Ik vind het alleen discutabel of je een dual-core processor nu als twee processoren moet tellen, zoals in het overzicht. Fysiek is het 1 processor, dus je kan ook zeggen dat IBM maar 16 processoren gebruikt (zoals in het verhaal).

Zeker als er meer CPU's met meer dan 1 core uitkomen kan dit nog wel eens een discussiepunt worden..
maar een dual core processor, mag je dan het aantal mhz delen door 2 dan maakt het weinig uit 32 * 1.7
of 64 * 0.85 ghz.
zo klinkt het alsof de frequentie de snelheid bepaald, das dus niet zo
Als je het zo zegt dan is het niet "32 * 1.7 of 64 * 0.85 ghz", zoals jij zegt, maar "32 * 1,7 of 16 * 2,4 GHz".

(Dit geeft dan aan hoeveel cycles een core respectievelijk cpu kan draaien in een seconde. Niet de totale snelheid van de core/cpu dus!)
rofl, broek af van intel de helft van de cpu'tjes en nog een pak sneller B-)
rofl, broek af van intel de helft van de cpu'tjes en nog een pak sneller B-)
Het IBM systeem is met 32 Power4+ cores inderdaad sneller dan het systeem van HP met 64 Intanium 2 cores. Maar vergeet niet dat de Power4 processor meer L3 cache tot zijn beschikking heeft dan de Itanium2. De Power4+ werkt met 128MB off-chip L3 cache per MCM (Multi-Chip module), terwijl de Itanium het met 6MB L3 cache per processor moet doen. Cache is nou eenmaal duur, dus het kan best zijn dat die 128MB één van de belangrijkste factoren is geweest die ervoor heeft gezorgt dat de prijs hoger is uitgevallen dan de prijs van een Itanium2 systeem.

De IBM eServer pSeries 690 heeft een prijs van $7.574.961, en dan heb je een systeem die ongeveer 680.613 tpmC neer kan zetten. De HP Superdrome, daarentegen, kost maar $6.453.432 en kan ongeveer 658.278 tpmC neerzetten per systeem. De IBM eServer is dus ruim 17% duurder, terwijl hij "slechts" 3.3% beter presteren zal. Daarnaast ligt het price/performance nivo (in $ / tpmC) van de HP Superdrome hoger dan die van de IBM eServer.

Kortom, de HP Superdroms is, qua prijs/performance, in meerdere aspecten een betere koop dan de IBM eServer. Daar staat echter weer tegenover dat beide systemen nog niet leverbaar zijn. Het kan zijn dat er nog verandering worden aangebracht, of misschien krijgen we voor de introductiedatum snellere systemen die meteen al verkrijgbaar zijn.
Het is niet alleen de Cache.

Itanium2 is een predication processor die met veel geluk tot maximaal een ipc van 6 kan komen. Dat op 1.5Ghz.

Laten we dat een theoretisch maximum van 6 x 1.5 = 9 ipcG noemen (nieuwe grootheid ;))

De power4 heeft een theoretisch maximum ipc van 8 en draait op 1.7Ghz. Dat is van de nieuwe grootheid:

8 x 1.7 = 13.6

Aanzienlijk meer dus.

Dan praten we over een kleine configuratie van de power4 in 32 cpu's. Dat is zijn limiet (grotere configuraties zuigt de IPC in dit geval staand voor interprocess communication latency).

Dan wil ik verder niet betrokken raken bij een predication versus out of order oorlog, maar de out of order dient iets meer respect als zij krijgt.

Neemt niet weg dat de prestatie van beide systemen enorm goed is.

Dat dan 64 processoren op grootte 9 van de nieuwe grootheid slechter presteren als 32 processoren met enorm snellere latencies op 13.6 lijkt me triviaal.

De meeste 'benchmarks' zoals top500.org gebruikt zijn volledig treurig. Er wordt totaal aan latencies voorbij gegaan, terwijl latency belangrijk is.

Dat dus deze 32 processor machine sneller is als een 64 processor machine die hiervoor de benchmark aanvoerdde, dat vind ik volledig terecht dus.
Hoeveel kost een NEC Express 5800 dan, wat zou daarvan de prijs/performance verhouding zijn?
Het is dus 128 MB L3 cache per Multichip module maar :
verdeeld over vier multi-chip modules met elke een gedeeld L3 cache van 128MB
De Power 4 config beschikt hiermee in totaal over 512 Meg L3 ( off-die ). De 64 Itanium's beschikken over 384 MB cache ( on-die ). In de snelheid van de 2 verschillende cache varianten zal gezien het on en off-die, ook nog wel het nodige verschil zitten.

Verder is het domweg een bench om te zien wie nou het snelste non-clustered systeem neer zet. En òf het nou een 64-way Itanium of een 32-way Power4 config, dat doet er dus niet toe. Prijs performance is dus eigenlijk helemaal niet aan de orde.

En voor je het weet brengt IBM nog een 64-way Power4 uit die het nog allemaal weer sneller doet ;) ............... verder blijkt de 64-way Superdome ook 'maar' net 28% sneller te zijn dan de 32-way oplossing van NEC. Gaan we dan toch in prijs/performance ................
Het zal ook wel een unix benchmarkje zijn.... want Windows draait niet op de PowerPC/Power4 architectuur... Laat staan op sparc64.
FF een puur hypothetisch vraagje:

Windows 98 is over het algemeen sneller dan Windows 2000. (in ieder geval in games). Weet niet hoe dat zit met Windows 2003, maar stel dat dat ook langzamer is dan Windows 98. Zouden ze dan bij HP een benchmark kunnen draaien op een Win98 server en daarmee een paar % performancewinst kunnen behalen (mits het ding tijdens de benchmark niet vastloopt natuurlijk ;) :z)

MS Sql server zal wel niet draaien op Win98 maar toch...

Of praten we hier over 64 bits systemen?
edit: ik zie het al: Itanium.

Om het dan nog hypothetischer te maken: stel dat ze een 32 bits server bouwen en daar Win98 met Win2003 zouden vergelijken, wie zou dan winnen (en nogmaals: het gaat mij dan ff niet om stabiliteit!)

edit2: Is trouwens ook multi-cpu, dus voeg maar toe dat het een 1-cpu systeem moet zijn om op te testen.
Stel gras was blauw.. zou koeiemelk dan paars zijn???
LOL :)

Windows 98 voor SERVER Benchmarks? No offense maar dat is absoluut totaal niet een optie. Windows98 is dan wellicht 'sneller' in desktop related stuff maar het VEEL betere geheugenmanagement van de NT family (NT/ 2000 / 2003) zal er echt zonder *enige* twijfel voor zorgen dat de NT based systemen aanzienlijk beter zullen presteren.
Best knap, in dat vorige bericht stond dat de nieuwe p690 65% sneller zou zijn dan de vorige generatie, uit benchmarks die IBM zelf gedraaid had. Als je nu de reele scores bekijkt, dan blijkt ie dat bijna te halen: 680613 / 427761 is 59% sneller. En dat met maar 30% meer kloksnelheid en een heleboel verbeteringen aan de architectuur. Erg goed van IBM.
Vandaag is Microsoft met HP dit alweer voorbij gegaan:
http://www.tpc.org/tpcc/results/tpcc_perf_results.asp?resulttype=noncl uster&version=5

Een superdome met lagere prijs alweer hogere performance...
Wat wel heftig is, is het verschil in aantal processoren... Gaat aardig schelen in de energiekosten waarschijnlijk :+
"De IBM pSeries 690 was voorzien van zestien dual-core Power4 1,7GHz processors, verdeeld over vier multi-chip modules met elke een gedeeld L3 cache van 128MB."

Hij stat te boek als 32way systeem 4x4xDual core
Met per module van 128MB L3 dus dat maal vier 512MB L3 totaal om 512GB memory te bufferren.

L3 van iTanium is onDIE en loopt op hoge clock
L3 van Power4 doet mij denken aan die SLot modules van intel lijken en denk dus dat die niet op volle snelheid te draaien. maar daar staat er verder niks overin.
Ik vraag me af hoeveel invloed dit heeft op TPC-c performance

iTanim 6MB L3 * 64 = 384L3
384 vs 512 is niet een grote verhouding maar toch.

Dus zoals ik het nu volgens het bericht zie is één Power4 core twee maal zo snel als 'n iTanium2 dus 'n Dualcore CPU zo snel als 4 It2 CPU's.

Alleen staat er niks bij over de vermogen opname verhouding tov mekaar
hij gebruikt maar 32 cpu's,das opzich weining en een goed resultaat te vergelijken met die andere!
Ik snap het nog niet helemaal, zijn het nou 16 dualcore 'processors' die verdeeld zijn over 4 modules (dat is een soort sub-moederbord) met per module 128MB geheugen (L3).
Of zit het nog anders; Iemand zin om hiervan een schetje te maken (krijgt van mij een +1 behulpzaam:-)
dual-core Power4 1,7GHz processors, verdeeld over vier multi-chip modules met elke een gedeeld L3 cache van 128MB
:Y) dat is ook niet te vergeten, zou handig kunnen zijn. }:O grazen
<Een beetje offtopic>
Is het nog steeds zo dat Linux op niet meer dan 4 processoren kan lopen ?? Of is dat inmiddels al aangepast.
Anders is het een beetje jammer dat het niet op deze machine optimaal kan lopen.
</Een beetje offtopic>
Kan iemend mij vertellen hoe deze scores zich verhouden tot een standaaard desktop systeem. Bijv. een P4 2Ghz?

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True