Summer of servers, SPEC CPU
Afgelopen zomer werd door Intel aangeduid als de 'summer of servers', omdat het in korte tijd zijn volledige aanbod van serverprocessors heeft vernieuwd. Het begon 23 mei met Dempsey, een 65nm dualcore Netburst-Xeon die in tandem werd gelanceerd met een nieuwe chipset, die meer dan twee keer zoveel bandbreedte bood dan de vorige generatie. Iets meer dan een maand later - op 26 juni om precies te zijn - werd Woodcrest uitgebracht, gebaseerd op de nieuwe Core-architectuur en weer 25% snellere bussen. Op 18 juli was vervolgens Itanium aan de beurt, met de introductie van de dualcore Montecito, een chip met 24MB L3-cache en meer dan 1,7 miljard transistors. Weer grofweg een maand later - 29 augustus - kwam er een nieuwe Xeon MP uit onder de codenaam Tulsa, met 16MB L3-cache. Clovertown - de eerste quadcore Xeon - werd op 14 november als nageboorte afgeleverd.

Intel heeft in de tweede helft van vorig jaar dus overuren gedraaid om de concurrentie in te halen. Het enige wat AMD daar tegenover heeft gesteld is de introductie van de Socket F-modellen (die op de nieuwe 2,8GHz-smaak na weinig voor de prestaties bleken te doen), en een prijsverlaging. Hoewel dat niet betekent dat AMD het slecht heeft gedaan in termen van gewonnen contracten en marktaandeel - integendeel - betekent het wel dat Intel op het moment (veel) gevaarlijker is dan lange tijd het geval is geweest. Hoewel de quadcore Opteron Barcelona de balans over een klein half jaar weer zou kunnen verstoren, ligt Intel op het moment voor in een hoop benchmarks.
Voor we overgaan tot onze eigen vergelijkende databasetest, zullen we eerst laten zien wat de huidige stand van zaken is in benchmarkland. Voor de goede orde: onderstaande verzamelde 'non-tweakers.net'-scores zijn weliswaar praktijkscores, maar onafhankelijk van elkaar gemeten. Er kunnen derhalve verschillen zitten tussen een aantal parameters van de diverse systeemconfiguraties. Dat betekent ook dat betere resultaten niet altijd volledig aan verbeteringen aan de hardwarezijde toe te schrijven zijn, want ook de gebruikte software wordt tenslotte verbeterd. Er mag echter van worden uitgegaan dat iedere systeembouwer zijn best doet om tot zo goed mogelijke eindresultaten te komen, en met het voorgaande in het achterhoofd, zijn de scores wel als indicatief te beschouwen.
SPEC CPU
We beginnen met SPECint_rate en SPECfp_rate, twee benchmarks die ontworpen zijn om rauwe processorprestaties te meten. De 'int' (integer) suite bestaat onder andere uit een compiler, schaakprogramma, compressie en tekstverwerking, terwijl de 'fp' (floating point) suite onder andere gezichtherkenning, neurale netwerken en natuurkundige en scheikundige simulaties doet. Alle subtests zijn gebaseerd op software die ook 'in het echt' gebruikt wordt, maar de code is hier en daar aangepast om bijvoorbeeld belasting van de harde schijf te minimaliseren of de porteerbaarheid naar andere platforms te verbeteren.
De toevoeging 'rate' geeft aan dat het niet om een test van een enkele chip gaat, maar van alle cores in een systeem tegelijk, waardoor bandbreedte ook een belangrijke factor wordt. De andere toevoeging ('peak') geeft aan dat er maximaal getuned mag worden met de compiler. Een standaard run vereist dat alles met dezelfde instellingen gebouwd wordt, maar voor een 'peak'-run mag iedere individuele test zijn eigen parameters hebben. Omdat een Clovertown-server een unieke configuratie van acht cores in twee sockets heeft, zullen we hem zowel vergelijken met systemen die acht cores in vier sockets hebben, als met configuraties die vier cores in twee sockets hebben. In de integerbenchmark zien we dat de nieuwe Xeon aan kop gaat: de Core-architectuur is al eerder sterk gebleken in dit soort werk, maar dat hij zelfs de beste scores van systemen met vier sockets verbetert blijft een knappe prestatie.
In de fp-benchmark zien we dat de quadcore het niet zo goed doet, waarschijnlijk het gevolg van zijn beperkte bandbreedte, iets waar SPECfp_rate geen genoeg van kan krijgen. Toch zien we dat Intel gedurende de loop van het jaar een gestage verbetering heeft gerealiseerd, van een magere score van 40,3 met Paxville naar een respectabele score van 104. Nog steeds lager dan de Opteron (hoewel het zonder compilermagie een nipte overwinning zou zijn) maar het probleem is dat AMD nog steeds een stap naar quadcore én 128 bit rekeneenheden voor de boeg heeft, terwijl Clovertown dat kruit al verschoten heeft. De Itanium kan het allemaal nog wel bijbenen, maar deze test blijft toch een van de favorieten voor AMD.

Intel heeft in de tweede helft van vorig jaar dus overuren gedraaid om de concurrentie in te halen. Het enige wat AMD daar tegenover heeft gesteld is de introductie van de Socket F-
Voor we overgaan tot onze eigen vergelijkende databasetest, zullen we eerst laten zien wat de huidige stand van zaken is in benchmarkland. Voor de goede orde: onderstaande verzamelde 'non-tweakers.net'-scores zijn weliswaar praktijkscores, maar onafhankelijk van elkaar gemeten. Er kunnen derhalve verschillen zitten tussen een aantal parameters van de diverse systeemconfiguraties. Dat betekent ook dat betere resultaten niet altijd volledig aan verbeteringen aan de hardwarezijde toe te schrijven zijn, want ook de gebruikte software wordt tenslotte verbeterd. Er mag echter van worden uitgegaan dat iedere systeembouwer zijn best doet om tot zo goed mogelijke eindresultaten te komen, en met het voorgaande in het achterhoofd, zijn de scores wel als indicatief te beschouwen.
We beginnen met SPECint_rate en SPECfp_rate, twee benchmarks die ontworpen zijn om rauwe processorprestaties te meten. De 'int' (integer) suite bestaat onder andere uit een compiler, schaakprogramma, compressie en tekstverwerking, terwijl de 'fp' (floating point) suite onder andere gezichtherkenning, neurale netwerken en natuurkundige en scheikundige simulaties doet. Alle subtests zijn gebaseerd op software die ook 'in het echt' gebruikt wordt, maar de code is hier en daar aangepast om bijvoorbeeld belasting van de harde schijf te minimaliseren of de porteerbaarheid naar andere platforms te verbeteren.
De toevoeging 'rate' geeft aan dat het niet om een test van een enkele chip gaat, maar van alle cores in een systeem tegelijk, waardoor bandbreedte ook een belangrijke factor wordt. De andere toevoeging ('peak') geeft aan dat er maximaal getuned mag worden met de compiler. Een standaard run vereist dat alles met dezelfde instellingen gebouwd wordt, maar voor een 'peak'-run mag iedere individuele test zijn eigen parameters hebben. Omdat een Clovertown-server een unieke configuratie van acht cores in twee sockets heeft, zullen we hem zowel vergelijken met systemen die acht cores in vier sockets hebben, als met configuraties die vier cores in twee sockets hebben. In de integerbenchmark zien we dat de nieuwe Xeon aan kop gaat: de Core-architectuur is al eerder sterk gebleken in dit soort werk, maar dat hij zelfs de beste scores van systemen met vier sockets verbetert blijft een knappe prestatie.
| Opteron 8220 | 4 | 2,8GHz | Santa Rosa | |||||||
| Xeon MP 7140 | 4 | 3,4GHz | Tulsa | |||||||
| Power5 | 4 | 1,9GHz | ||||||||
| Itanium 2 9050 | 4 | 1,6GHz | Montecito | |||||||
| Xeon MP 7041 | 4 | 3,0GHz | Paxville | |||||||
| 2 | 2,66GHz | Clovertown | ||||||||
| Xeon 5160 | 2 | 3,0GHz | Woodcrest | |||||||
| Opteron 2280 | 2 | 2,8GHz | Santa Rosa | |||||||
| Power5+ | 2 | 2,1GHz | ||||||||
| Xeon 5080 | 2 | 3,73GHz | Dempsey | |||||||
| Xeon DC | 2 | 2,8GHz | Paxville | |||||||
In de fp-benchmark zien we dat de quadcore het niet zo goed doet, waarschijnlijk het gevolg van zijn beperkte bandbreedte, iets waar SPECfp_rate geen genoeg van kan krijgen. Toch zien we dat Intel gedurende de loop van het jaar een gestage verbetering heeft gerealiseerd, van een magere score van 40,3 met Paxville naar een respectabele score van 104. Nog steeds lager dan de Opteron (hoewel het zonder compilermagie een nipte overwinning zou zijn) maar het probleem is dat AMD nog steeds een stap naar quadcore én 128 bit rekeneenheden voor de boeg heeft, terwijl Clovertown dat kruit al verschoten heeft. De Itanium kan het allemaal nog wel bijbenen, maar deze test blijft toch een van de favorieten voor AMD.
| Power5 | 4 | 1,9GHz | ||||||||
| Itanium 2 9050 | 4 | 1,6GHz | Montecito | |||||||
| Opteron 8220 | 4 | 2,8GHz | Santa Rosa | |||||||
| Xeon MP 7140 | 4 | 3,4GHz | Tulsa | |||||||
| Xeon MP 7041 | 4 | 3,0GHz | Paxville | |||||||
| Power5+ | 2 | 2,1GHz | ||||||||
| Itanium 2 9050 | 2 | 1,6GHz | Montecito | |||||||
| Opteron 2220 | 2 | 2,8GHz | Santa Rosa | |||||||
| 2 | 2,66GHz | Clovertown | ||||||||
| Xeon 5160 | 2 | 3,0GHz | Woodcrest | |||||||
| Xeon 5080 | 2 | 3,73GHz | Dempsey | |||||||
| Xeon DC | 2 | 2,8GHz | Paxville | |||||||
Volgende pagina (TPC-C, SAP-SD en SPECjbb2005 - 3/8)
