Benchmarkblog SPECint_2006

Vorige week heb ik in mijn blog gekeken naar de prestaties van verschillende (server)processors in SPECfp_2006, een test van rauwe cpu-prestaties en doorvoer, voornamelijk gebaseerd op wetenschappelijke simulaties die zwaar leunen op floating point-getallen. Vandaag ga ik kijken naar de broer van deze test, SPECint_2006. Deze is op een heel ander soort software gebaseerd, zoals (video)compressie, compilers, kunstmatige intelligentie, spellen en xml-verwerking, stuk voor stuk applicaties waarin de nadruk ligt op integers. Kenmerkend voor SPECint is dat de code ook veel meer vertakkingen heeft dan SPECfp, zoals if-else constructies. Hierdoor komt de nadruk iets meer te liggen op de intelligentie van de processor en compiler, in plaats van op 'domme' rekenkracht. In sommige gevallen kan dat voor grote verschillen in relatieve prestaties zorgen.

Broncode / source codeNet als SPECfp kent SPECint eigenlijk twee scores: base en peak. Bij de eerste worden alle subtests met dezelfde instellingen gecompileerd, terwijl bij de tweede voor iedere benchmark opnieuw getweakt mag worden. De discussie over wat nou het meest realistisch is woedt na jaren nog steeds hevig door. Voorstanders van peak vinden dat bijna alles aan de kant van de software geoorloofd is om de hardware in het beste licht te laten zien.

Tegenstanders redeneren echter dat ontwikkelaars in de praktijk zelden de moeite doen om reeksen van tientallen exotische parameters te proberen, alleen maar om de laatste paar procent extra prestaties weg te slepen. Bovendien beweren boze tongen dat sommige opties in compilers er alleen maar voor deze test zijn ingebouwd. Het is 'illegaal' om een compiler te gebruiken die specifieke SPEC-code probeert te herkennen (op straffe van verwijdering uit de database), maar is het niet onmogelijk om de regels te buigen. In dit blog gebruik ik peakscores, zodat niemand zich benadeeld kan voelen en omdat ik later toch nog een aantal andere benchmarks ga behandelen die niet van compilers afhankelijk zijn.

Laten we weer eens beginnen met de singlethreadprestaties. Net als in SPECfp staat de Power6 hier bovenaan de lijst, maar het verschil met Intels Xeon is eigenlijk te verwaarlozen. Gegeven het feit dat de chip van IBM met gemak twee keer zoveel stroom verbruikt, veel hoger geklokt is en hele sloten extra cache en bandbreedte tot zijn beschikking heeft, kunnen we de Xeon eigenlijk wel de morele overwinnaar noemen van deze fotofinish. Ten opzichte van de Opteron heeft de Core-architectuur ook duidelijk een grotere voorsprong in SPECint (30%) dan in SPECfp (11%). De Itanium zakt van de tweede naar de vierde positie - net onder AMD. Het hek wordt gesloten door de op Pentium 4 gebaseerde Xeon MP, die bijna twee keer zo traag is als de nieuwe Woodcrest. Pijnlijk.

SPECint2006 (singlethread)
IBMPower6dual4,7GHz 21,6
IntelXeon 5160dual3,0GHz 21
AMDOpteron 2222dual3,0GHz 16,1
IntelItanium 9050dual1,6GHz 15,7
IBMPower5+dual2,2GHz 13,2
IntelPentium 4 EEdual3,73GHz 11,7
FujitsuSparc64 VIdual2,4GHz 11,3
IntelXeon MP 7140Mdual3,4GHz 11,2
SPECint2006 (singlethread) - score per GHz
IntelItanium 9050dual1,6GHz 9,8
IntelXeon 5160dual3,0GHz 7,0
IBMPower5+dual2,2GHz 6,0
AMDOpteron 2222dual3,0GHz 5,4
FujitsuSparc64 VIdual2,4GHz 4,7
IBMPower6dual4,7GHz 4,6
IntelXeon MP 7140Mdual3,4GHz 3,3
IntelPentium 4 EEdual3,73GHz 3,1

* Dual socket

Scores met twee sockets (vier of acht threads) zijn vaak belangrijker voor servers dan prestaties met een thread, dus dat wordt het volgende waar ik naar ga kijken. IBM staat weer bovenaan, maar dat was niet meer dan verwacht. Opvallend is dat de Xeon het in deze test een stuk beter doet dan in SPECfp_rate. Vorige week werd namelijk duidelijk dat Intel die test alleen maar kon winnen van AMD omdat het als enige van de twee een quadcore in de aanbieding heeft. In deze test is daar geen sprake van: de dualcore Woodcrest neemt al een kleine voorsprong op de Opteron, waarna de quadcore Clovertown kans ziet om het gat wijd open te blazen. Het is duidelijk dat SPECint_rate een stuk minder afhankelijk is van bandbreedte. De Itanium en Xeon MP blijven echter wel nog steeds achter.

SPECint_rate2006 (dual socket)
IBMPower6dual4,7GHz 122
IntelXeon X5365quad3,0GHz 106
IntelXeon 5160dual3,0GHz 65
AMDOpteron 2222dual3,0GHz 60,4
IntelItanium 9040dual1,6GHz 53,9
IBMPower5+dual2,2GHz 53,3
IntelXeon MP 7140Mdual3,4GHz 45,5
SPECint_rate2006 (dual socket - score per coreGHz)
IntelItanium 9040dual1,6GHz 8,4
IBMPower6dual4,7GHz 6,5
IBMPower5+dual2,2GHz 6,1
IntelXeon 5160dual3,0GHz 5,4
AMDOpteron 2222dual3,0GHz 5,0
IntelXeon X5365quad3,0GHz 4,4
IntelXeon MP 7140Mdual3,4GHz 3,3

* Quad socket

Bij vier sockets begint de voorsprong van Power6 echt belachelijke vormen aan te nemen: hij is meer dan 120% sneller dan de eerstvolgende concurrent, de Opteron. Intel doet op dit niveau nauwelijks meer mee, omdat de huidige Xeon MP nog steeds op de Pentium 4 gebaseerd is en bovendien lijdt onder een erg beperkte bandbreedte. Verrassend is dat de Itanium de Opteron nog redelijk goed kan bijhouden, ondanks het feit dat de AMD-chip bijna twee keer zo hoog klokt en gebruikmaakt van geïntegreerde geheugencontrollers. Dit is weer een indicatie dat de Itanium-architectuur - ondanks alle kritiek die het te verduren krijgt - een hoop potentieel heeft.

SPECint_rate2006 (quad socket)
IBMPower6dual4,7GHz 240
AMDOpteron 8222dual3,0GHz 108
IntelItanium 9050dual1,6GHz 102
FujitsuSparc64 VIdual2,15GHz 81,6
IntelXeon MP 7140Mdual3,4GHz 80,6
SunUltraSparc IV+dual2,1GHz 78
SPECint_rate2006 (quad socket - score per coreGHz)
IntelItanium 9050dual1,6GHz 8,0
IBMPower6dual4,7GHz 6,4
FujitsuSparc64 VIdual2,15GHz 4,7
SunUltraSparc IV+dual2,1GHz 4,6
AMDOpteron 8222dual3,0GHz 4,5
IntelXeon MP 7140Mdual3,4GHz 3,0

* Conclusie

We hebben vandaag gezien dat processors zich onder SPECint_2006 heel anders kunnen gedragen dan onder SPECfp_2006. De brute 4,7GHz Power6 laat ook hier zijn kracht gelden door alle eerste posities te bezetten, maar vooral op het gebied van Intel tegen AMD zijn er een aantal interessante verschillen op te merken. Aan beide fronten wint Core het van K8 als het aankomt op de prestaties van een enkele thread. De dualcore Xeon gaat echter kopje onder bij meerdere fp-threads, waarna hij alleen nog maar gered kan worden door zijn grotere broer de quadcore. Met integers kan hij echter wel zelf zijn hoofd boven water houden. Het feit dat de Xeon MP nog steeds op de Pentium 4 is gebaseerd blijft in het segment voor vier sockets echter een strop. De Itanium maakt op integergebied een zwakkere start dan in floating point, maar blijkt toch verbazend goed op te kunnen schalen en heeft geen probleem om steeds binnen tien procent van een veel hoger geklokte Opteron te blijven scoren. Volgende week is het tijd om aan een benchmark te beginnen die niet alleen de processor belast: de databasetest TPC-C.

Door Wouter Tinus

25-07-2007 • 00:22

4

Reacties (4)

4
4
1
0
0
2
Wijzig sortering
Moet AMD nageven dat ze voor hun aardig oude ontwerp het nog redelijk doen tegenover de Xeons.

Persoonlijk vind ik die grafiekjes van score per GHz wel apart het laat telkens zien dat de Itanium duidelijk de beste prestaties neerzet per GHz maar doordat ie zo laag is geclocked toch niet zo geweldig presteerd in het totaal. Ben benieuwd hoe het gaat als ze hem gaan verkleinen en hoger clocken.

Zou de Itanium op den duur de basis gaan vormen voor nieuwe desktops processors? Bedoel dat wordt steeds meer 64 bit en de Itanium heeft veel rekenkracht.
Desktop processors gebruiken de X86-64 architectuur, tegenover de IA64 die de itaniums gebruiken, dus dat gaat niet gebeuren.
Anoniem: 9449 26 juli 2007 01:24
En we krijgen straks een Itanium met een heleboel cores, omdat deze maar zeer klein zijn en dus makkelijk "bij te plakken". Let maar eens op wat er dan nog aan serverprocs overblijft: alleen Power en Itanium.
Dat denk ik niet; er zijn genoeg toepassingen waarvoor je het liefst een redelijk geprijsde server hebt en wat mindere CPU prestaties voor lief neemt.

Ik zou niet een itanium-gebaseerde machine aanbevelen voor een relatief eenvoudige server met websites, MySQL en PHP.

Op dit item kan niet meer gereageerd worden.