Introductie
For your convenience, an
English translation of this article is available.
Op 14 november introduceerde Intel zijn eerste quadcore serverchips, de Xeon 5300-serie, voorheen bekend onder de codenaam Clovertown. Hoewel de chip technisch gezien vrijwel identiek is aan de desktopversie die we eerder onder handen namen, draait hij op een ander platform, bedoeld voor andere taken. In dit artikel bekijken we hoe stap van dualcore naar quadcore Intels concurrentiepositie heeft beïnvloed en hoe Clovertown zich houdt in onze databasetest.
Oud en nieuw
Omdat de Xeon 5300 'Clovertown' op de snellere bus na identiek is aan de Core 2 Extreme QX6700 'Kentsfield' - wiens architectuur al uitgebreid besproken is in deze review - heeft dit artikel een wat luchtigere introductie. In de onderstaande tabel wordt de nieuwe quadcore vergeleken met de allereerste microprocessor van Intel, de 4004. Recent stond deze weer in de schijnwerpers, omdat het op 13 november jongstleden precies 35 jaar jaar geleden was dat deze op de markt kwam.
| 4004 | Clovertown | Verschil |
---|
Introductie | 1971 | 2006 | 35 jaar later |
Prijs | ~$935* | $1172 | 25% duurder |
![]() |
---|
Cores | 1 | 4 | 4x zoveel |
Instructies per clock | 1 | 16 | 4x zoveel per core |
Kloksnelheid | 108kHz | 2,66GHz | 24.691x hoger |
Busfrequentie | 108kHz | 1333MHz | 12.346x hoger |
Bandbreedte | 54KB/s | 10,6GB/s | 197.530x meer |
![]() |
---|
Productietechniek | 10000nm | 65nm | 154x kleiner |
Wafergrootte | 50mm | 300mm | 36x groter oppervlak |
Transistors | 2300 | 582 miljoen | 63.261x meer per core |
Fysieke grootte | 12mm² | 286mm² | 6x groter per core |
![]() |
---|
Contactpunten | 16 | 771 | 48x meer |
Registers | 4 bit | 64 bit | 16x breder |
Adresruimte | 640KB | 16EB | Onvoorstelbaar |
Instructies | 46 | ~700 | 15x zoveel |
![]() |
---|
Verbruik | 1W | 120W | 30x hoger per core |
Spanning | 15V | 1,34V | >90% lager |
Stroom | 0,07A | 90A | 1286x sterker |
* Gecorrigeerd voor
inflatie - originele prijs $200. Verzamelaars betalen er nu nog steeds $1000 voor.
Het verschil is gigantisch: de 4004 kon met zijn klok van een tiende megahertz iets meer dan honderdduizend handelingen per seconde uitvoeren, terwijl Clovertown er in theorie bijna 43 miljard aankan in dezelfde tijd. Om de theoretische rekenkracht van een quadcore Xeon te evenaren zouden er 395.061 stuks van de 4004 nodig zijn, en dan knijpen we nog een half oogje dicht voor het feit dat de één met 4 bits tegelijk rekent en de ander met 64 bits. We zullen maar niet beginnen aan een vergelijking van de prestaties per watt en prestaties per dollar, maar het mag duidelijk zijn dat de kleine stapjes die we jaar in, jaar uit zien over verloop van een paar decennia vrij extreme vormen aan gaan nemen.
Summer of servers, SPEC CPU
Afgelopen zomer werd door Intel aangeduid als de 'summer of servers', omdat het in korte tijd zijn volledige aanbod van serverprocessors heeft vernieuwd. Het begon 23 mei met Dempsey, een 65nm dualcore Netburst-Xeon die in tandem werd gelanceerd met een nieuwe chipset, die meer dan twee keer zoveel bandbreedte bood dan de vorige generatie. Iets meer dan een maand later - op 26 juni om precies te zijn - werd Woodcrest uitgebracht, gebaseerd op de nieuwe Core-architectuur en weer 25% snellere bussen. Op 18 juli was vervolgens Itanium aan de beurt, met de introductie van de dualcore Montecito, een chip met 24MB L3-cache en meer dan 1,7 miljard transistors. Weer grofweg een maand later - 29 augustus - kwam er een nieuwe Xeon MP uit onder de codenaam Tulsa, met 16MB L3-cache. Clovertown - de eerste quadcore Xeon - werd op 14 november als nageboorte afgeleverd.

Intel heeft in de tweede helft van vorig jaar dus overuren gedraaid om de concurrentie in te halen. Het enige wat AMD daar tegenover heeft gesteld is de introductie van de Socket F-modellen (die op de nieuwe 2,8GHz-smaak na weinig voor de prestaties bleken te doen), en een prijsverlaging. Hoewel dat niet betekent dat AMD het slecht heeft gedaan in termen van gewonnen contracten en marktaandeel - integendeel - betekent het wel dat Intel op het moment (veel) gevaarlijker is dan lange tijd het geval is geweest. Hoewel de quadcore Opteron Barcelona de balans over een klein half jaar weer zou kunnen verstoren, ligt Intel op het moment voor in een hoop benchmarks.
Voor we overgaan tot onze eigen vergelijkende databasetest, zullen we eerst laten zien wat de huidige stand van zaken is in benchmarkland. Voor de goede orde: onderstaande verzamelde 'non-tweakers.net'-scores zijn weliswaar praktijkscores, maar onafhankelijk van elkaar gemeten. Er kunnen derhalve verschillen zitten tussen een aantal parameters van de diverse systeemconfiguraties. Dat betekent ook dat betere resultaten niet altijd volledig aan verbeteringen aan de hardwarezijde toe te schrijven zijn, want ook de gebruikte software wordt tenslotte verbeterd. Er mag echter van worden uitgegaan dat iedere systeembouwer zijn best doet om tot zo goed mogelijke eindresultaten te komen, en met het voorgaande in het achterhoofd, zijn de scores wel als indicatief te beschouwen.
SPEC CPU
We beginnen met SPECint_rate en SPECfp_rate, twee benchmarks die ontworpen zijn om rauwe processorprestaties te meten. De 'int' (integer) suite bestaat onder andere uit een compiler, schaakprogramma, compressie en tekstverwerking, terwijl de 'fp' (floating point) suite onder andere gezichtherkenning, neurale netwerken en natuurkundige en scheikundige simulaties doet. Alle subtests zijn gebaseerd op software die ook 'in het echt' gebruikt wordt, maar de code is hier en daar aangepast om bijvoorbeeld belasting van de harde schijf te minimaliseren of de porteerbaarheid naar andere platforms te verbeteren.
De toevoeging 'rate' geeft aan dat het niet om een test van een enkele chip gaat, maar van alle cores in een systeem tegelijk, waardoor bandbreedte ook een belangrijke factor wordt. De andere toevoeging ('peak') geeft aan dat er maximaal getuned mag worden met de compiler. Een standaard run vereist dat alles met dezelfde instellingen gebouwd wordt, maar voor een 'peak'-run mag iedere individuele test zijn eigen parameters hebben. Omdat een Clovertown-server een unieke configuratie van acht cores in twee sockets heeft, zullen we hem zowel vergelijken met systemen die acht cores in vier sockets hebben, als met configuraties die vier cores in twee sockets hebben. In de integerbenchmark zien we dat de nieuwe Xeon aan kop gaat: de Core-architectuur is al eerder sterk gebleken in dit soort werk, maar dat hij zelfs de beste scores van systemen met vier sockets verbetert blijft een knappe prestatie.
 |
 | SPECint_rate_peak2000 |  |
 |
 | Opteron 8220 |  | 4 |  | 2,8GHz |  | Santa Rosa |  |   175 |  |
 |
 | Xeon MP 7140 |  | 4 |  | 3,4GHz |  | Tulsa |  |   164 |  |
 |
 | Power5 |  | 4 |  | 1,9GHz |  | |  |   147 |  |
 |
 | Itanium 2 9050 |  | 4 |  | 1,6GHz |  | Montecito |  |   134 |  |
 |
 | Xeon MP 7041 |  | 4 |  | 3,0GHz |  | Paxville |  |   114 |  |
 |
 | Xeon X5355 |  | 2 |  | 2,66GHz |  | Clovertown |  |   200 |  |
 |
 | Xeon 5160 |  | 2 |  | 3,0GHz |  | Woodcrest |  |   123 |  |
 |
 | Opteron 2280 |  | 2 |  | 2,8GHz |  | Santa Rosa |  |   90,3 |  |
 |
 | Power5+ |  | 2 |  | 2,1GHz |  | |  |   90 |  |
 |
 | Xeon 5080 |  | 2 |  | 3,73GHz |  | Dempsey |  |   82,8 |  |
 |
 | Xeon DC |  | 2 |  | 2,8GHz |  | Paxville |  |   59,9 |  |
 |
In de fp-benchmark zien we dat de quadcore het niet zo goed doet, waarschijnlijk het gevolg van zijn beperkte bandbreedte, iets waar SPECfp_rate geen genoeg van kan krijgen. Toch zien we dat Intel gedurende de loop van het jaar een gestage verbetering heeft gerealiseerd, van een magere score van 40,3 met Paxville naar een respectabele score van 104. Nog steeds lager dan de Opteron (hoewel het zonder compilermagie een nipte overwinning zou zijn) maar het probleem is dat AMD nog steeds een stap naar quadcore én 128 bit rekeneenheden voor de boeg heeft, terwijl Clovertown dat kruit al verschoten heeft. De Itanium kan het allemaal nog wel bijbenen, maar deze test blijft toch een van de favorieten voor AMD.
 |
 | SPECfp_rate_peak2000 |  |
 |
 | Power5 |  | 4 |  | 1,9GHz |  | |  |   249 |  |
 |
 | Itanium 2 9050 |  | 4 |  | 1,6GHz |  | Montecito |  |   244 |  |
 |
 | Opteron 8220 |  | 4 |  | 2,8GHz |  | Santa Rosa |  |   178 |  |
 |
 | Xeon MP 7140 |  | 4 |  | 3,4GHz |  | Tulsa |  |   110 |  |
 |
 | Xeon MP 7041 |  | 4 |  | 3,0GHz |  | Paxville |  |   67,3 |  |
 |
 | Power5+ |  | 2 |  | 2,1GHz |  | |  |   149 |  |
 |
 | Itanium 2 9050 |  | 2 |  | 1,6GHz |  | Montecito |  |   123 |  |
 |
 | Opteron 2220 |  | 2 |  | 2,8GHz |  | Santa Rosa |  |   119 |  |
 |
 | Xeon X5355 |  | 2 |  | 2,66GHz |  | Clovertown |  |   104 |  |
 |
 | Xeon 5160 |  | 2 |  | 3,0GHz |  | Woodcrest |  |   85,9 |  |
 |
 | Xeon 5080 |  | 2 |  | 3,73GHz |  | Dempsey |  |   66,5 |  |
 |
 | Xeon DC |  | 2 |  | 2,8GHz |  | Paxville |  |   40,3 |  |
 |
TPC-C, SAP-SD en SPECjbb2005
SPEC CPU is een interessante test voor verschillende soorten processorwerk, maar er is op de wereld meer dan puur rekenen. Een taak die veel servers hebben is het draaien van een of andere database. TPC-C is een benchmark die in veel gevallen als maatstaaf wordt gebruikt voor databaseprestaties. De test simuleert de complete bedrijfsvoering van een distributeur met meerdere vestigingen en honderdduizenden klanten en producten. De prestaties worden uiteindelijk gegeven in aantal transacties per minuut. Omdat de test gevoelig is voor snelle opslagsystemen en veel geheugen geeft men ook de prijs/prestatieverhouding, waardoor het duidelijk zichtbaar is als een fabrikant zijn score kunstmatig ophoogt door een paar miljoen extra te investeren in harde schijven. Wat niet terugkomt in de score is het gebruikte besturingssysteem en databasepakket; deze mogen vrij gekozen worden. Itanium en Power halen hun beste scores met Oracle onder HP-UX en DB2 onder AIX, terwijl de x86-chips vrijwel exclusief onder Windows met SQL Server getest worden.
We zien hier dat Clovertown de beste prestaties en prijs/prestaties biedt van alle servers met twee sockets, maar dat hij toch niet is opgewassen tegen de grote jongens met vier sockets. De Opteron komt op het eerste gezicht niet overtuigend over, maar wie naar de absolute prijzen kijkt in plaats van naar de prestaties per dollar komt er achter dat de AMD-machines wel de goedkoopste zijn. Voor de Opteron- en Clovertown-scores is overigens dezelfde versie van SQL Server (64-bit) gebruikt. Woodcrest, Dempsey en Tulsa missen SP1, wat wellicht een klein nadeel is.
 |
 | TPC-C |  |
 |
 | Power5 |  | 4 |  | 1,9GHz |  | |  |   429900 @ $4,99 |  |
 |
 | Itanium 2 9050 |  | 4 |  | 1,6GHz |  | Montecito |  |   359440 @ $1,99 |  |
 |
 | Xeon MP 7140 |  | 4 |  | 3,4GHz |  | Tulsa |  |   318407 @ $1,88 |  |
 |
 | Opteron 8220 |  | 4 |  | 2,8GHz |  | Santa Rosa |  |   262989 @ $2,09 |  |
 |
 | Xeon MP 7041 |  | 4 |  | 3,0GHz |  | Paxville |  |   221017 @ $8,27 |  |
 |
 | Xeon X5355 |  | 2 |  | 2,66GHz |  | Clovertown |  |   240737 @ $1,85 |  |
 |
 | Itanium 2 9050 |  | 2 |  | 1,6GHz |  | Montecito |  |   230569 @ $2,63 |  |
 |
 | Power5 |  | 2 |  | 1,9GHz |  | |  |   203440 @ $3,93 |  |
 |
 | Xeon 5160 |  | 2 |  | 3,0GHz |  | Woodcrest |  |   169360 @ $2,93 |  |
 |
 | Opteron 2220 |  | 2 |  | 2,8GHz |  | Santa Rosa |  |   139693 @ $2,28 |  |
 |
 | Xeon 5080 |  | 2 |  | 3,73GHz |  | Demspey |  |   125954 |  |
 |
Een soortgelijke benchmark is SAP-SD (Sales & Distribution) dat ook een bedrijfsvoering simuleert, maar in plaats van transacties per minuut het aantal gebruikers dat tegelijkertijd op het systeem kan werken als eindscore geeft. Zoals de naam doet vermoeden richt deze test zich meer op het alombekend ERP-pakket dan op de achterliggende database, maar dat wil niet zeggen dat hij ongevoelig is voor factoren buiten de processor om. Helaas worden en mogen er geen prijzen bij de geteste systemen gegeven worden. Wel kunnen we aan de hand van de cpu-belasting zien of het systeem tot zijn maximum was belast of niet. In vrijwel alle gevallen ligt die belasting boven de 95%, met uitzondering van de viervoudige Paxville. Hieruit kunnen we opmaken dat de processor voor de rest van de cijfers een beperkende factor was en extra schijven of geheugen toevoegen geen zin zou hebben. Ook hier zien we Intels opleving: de prestaties voor twee sockets zijn ruim verdubbeld en die voor vier sockets meer dan de helft toegenomen, in beide gevallen genoeg om de Opteron voorbij te streven.
 |
 | SAP-SD 2-tier |  |
 |
 | Itanium 2 9050 |  | 4 |  | 1,6GHz |  | Montecito |  |   2150 |  |
 |
 | Xeon MP 7140 |  | 4 |  | 3,4GHz |  | Tulsa |  |   2127 |  |
 |
 | Opteron 2280 |  | 4 |  | 2,8GHz |  | Santa Rosa |  |   1978 |  |
 |
 | Xeon MP 7041 |  | 4 |  | 3,0GHz |  | Paxville |  |   1345 |  |
 |
 | Xeon X5355 |  | 2 |  | 2,66GHz |  | Clovertown |  |   1806 |  |
 |
 | Xeon 5160 |  | 2 |  | 3,0GHz |  | Woodcrest |  |   1285 |  |
 |
 | Opteron 2218 |  | 2 |  | 2,6GHz |  | Santa Rosa |  |   1047 |  |
 |
 | Xeon 5080 |  | 2 |  | 3,73GHz |  | Demspey |  |   1047 |  |
 |
 | Xeon DC |  | 2 |  | 2,8GHz |  | Paxville |  |   788 |  |
 |
De laatste zakelijke benchmark is SPECjbb2005, dat een drielaags architectuur simuleert waarbij de nadruk ligt op de middelste laag, de zogenaamde 'business logic', waarin alle xml-verwerking en dergelijke plaatsvindt. De test is volledig in Java geschreven en de prestaties van de virtuele machine zijn dus minstens even belangrijk als die van de software zelf. De score wordt uitgedrukt in bops - business operations per second. Ook hier zien we dat Clovertown domineert met een score waar zelfs systemen met vier sockets niet bij in de buurt kunnen komen.
 |
 | SPECjbb2005 |  |
 |
 | Xeon MP 7140 |  | 4 |  | 3,4GHz |  | Tulsa |  |   178201 |  |
 |
 | Opteron 8220 |  | 4 |  | 2,8GHz |  | Santa Rosa |  |   143525 |  |
 |
 | Itanium 2 9050 |  | 4 |  | 1,6GHz |  | Montecito |  |   138382 |  |
 |
 | Power5+ |  | 4 |  | 1,65GHz |  | |  |   127851 |  |
 |
 | Xeon X5355 |  | 2 |  | 2,66GHz |  | Clovertown |  |   210065 |  |
 |
 | Xeon 5160 |  | 2 |  | 3,0GHz |  | Woodcrest |  |   130589 |  |
 |
 | Opteron 2220 |  | 2 |  | 2,8GHz |  | Santa Rosa |  |   80617 |  |
 |
 | Xeon 5080 |  | 2 |  | 3,73GHz |  | Dempsey |  |   64482 |  |
 |
 | Power5+ |  | 2 |  | 1,65GHz |  | |  |   63544 |  |
 |
 | Xeon DC |  | 2 |  | 2,8GHz |  | Paxville |  |   49233 |  |
 |
 | UltraSparc T1 |  | 1 |  | 1,2GHz |  | Niagara |  |   74365 |  |
 |
SPECweb2005 en samenvatting
De laatste benchmark die we hier bespreken is SPECweb2005, een test die de prestaties van de machines in de rol van webserver aan de tand voelt, waarbij dynamische pagina's (in php of jsp), encryptie (ssl-verbindingen) en webservices worden geprobeerd. Het resultaat is een gewogen geminddelde van het aantal gelijktijdige sessies in drie scenario's: bankieren, winkelen en support. Wat hier vooral opvalt is het goede resultaat van Niagara: de prestaties ervan zijn vergelijkbaar met die van een dual Woodcrest en zelfs een quad Tulsa. Voor de dubbele Clovertown of viervoudige Opteron is Niagara niet snel genoeg.
 |
 | SPECweb2005 |  |
 |
 | Opteron 8220 |  | 4 |  | 2,8GHz |  | Santa Rosa |  |   20235 |  |
 |
 | Xeon MP 7140 |  | 4 |  | 3,4GHz |  | Tulsa |  |   14896 |  |
 |
 | Xeon X5355 |  | 2 |  | 2,66GHz |  | Clovertown |  |   18160 |  |
 |
 | Xeon 5160 |  | 2 |  | 3,0GHz |  | Woodcrest |  |   13257 |  |
 |
 | Opteron 285 |  | 2 |  | 2,6GHz |  | Italy |  |   11293 |  |
 |
 | Power5+ |  | 2 |  | 1,9GHz |  | |  |   7881 |  |
 |
 | Xeon 5080 |  | 2 |  | 3,73GHz |  | Dempsey |  |   6400 |  |
 |
 | Xeon DC |  | 2 |  | 2,8GHz |  | Paxville |  |   5597 |  |
 |
 | UltraSparc T1 |  | 1 |  | 1,2GHz |  | Niagara |  |   14001 |  |
 |
Samengevat kunnen we stellen dat Intel inderdaad behoorlijk heeft ingehaald het afgelopen jaar. In het segment van twee sockets hebben we een gemiddelde winst van 24% gezien van Woodcrest boven Opteron. De enige test die Intel nog steeds niet wint is SPECfp_rate, maar ook daar is het verschil behoorlijk teruggebracht. Na de introductie van Clovertown liep het gemiddelde prestatieverschil tussen Xeon en Opteron zelfs op tot maar liefst 79%. Hoewel AMD dat gat zeker kleiner gaat maken met de introductie van zijn eigen quadcore, kan het nog wel een halfjaar duren voor die wordt uitgebracht. Voorlopig kan Intel dus nog aan zijn gedeukte reputatie blijven werken en marktaandeel terug blijven winnen, terwijl AMD op zijn best de schade kan beperken met lagere prijzen.
Voor het segment van 4-way servers is het een moeilijker verhaal. Intel is daar van een hopeloze achterstand naar een min-of-meer gelijkspel gegaan, waarbij een deel van de tests gewonnen en een ander deel verloren wordt. AMD houdt echter nog steeds het voordeel van prijs en zuinigheid in handen. Hoewel Tulsa misschien net goed genoeg is om verdere erosie van het marktaandeel in dit segment te voorkomen, zal er iets overtuigenders moeten komen om de trend te keren, zeker als Opteron volgend jaar ook vier cores krijgt. Intels hoop is gevestigd op Tigerton om voldoende weerstand te bieden aan de nieuwe generatie van AMD.
4-way | Opteron | Tulsa | Verschil |
---|
SPECint_rate_peak2000 | 175 | 164 | -6%  |
SPECfp_rate_peak2000 | 178 | 110 | -38%  |
TPC-C | 262989 | 318407 | 21%  |
SAP-SD | 1978 | 2127 | 8%  |
SPECjbb2005 | 143525 | 178201 | 24%  |
SPECweb2005 | 20235 | 14896 | -26%  |
Gemiddeld | -3%  |
2-way | Opteron | Clovertown | Verschil |
---|
SPECint_rate_peak2000 | 90.3 | 200 | 121%  |
SPECfp_rate_peak2000 | 119 | 104 | -13%  |
TPC-C | 139693 | 240737 | 72%  |
SAP-SD | 1047 | 1806 | 72%  |
SPECjbb2005 | 80617 | 210065 | 161%  |
SPECweb2005 | 11293 | 18160 | 61%  |
Gemiddeld | 79%  |
2-way | Opteron | Woodcrest | Verschil |
---|
|
SPECint_rate_peak2000 | 90.3 | 123 | 36%  |
SPECfp_rate_peak2000 | 119 | 85.9 | -18%  |
TPC-C | 139693 | 169360 | 21%  |
SAP-SD | 1047 | 1285 | 23%  |
SPECjbb2005 | 80617 | 130589 | 63%  |
SPECweb2005 | 11293 | 13257 | 17%  |
Gemiddeld | 24%  |
2-way | Woodcrest | Clovertown | Verschil |
---|
SPECint_rate_peak2000 | 123 | 200 | 63%  |
SPECfp_rate_peak2000 | 85.9 | 104 | 21%  |
TPC-C | 169360 | 240737 | 42%  |
SAP-SD | 1285 | 1806 | 41%  |
SPECjbb2005 | 130589 | 210065 | 61%  |
SPECweb2005 | 13257 | 18160 | 37%  |
Gemiddeld | 44%  |
Testhardware
Nu we een stap terug hebben gedaan en hebben gekeken naar de algemene situatie is serverland is het hoogste tijd om terug te keren naar onze eigen realiteit: de database van Tweakers.net. Voor dit artikel leverde Melrow een server met twee Xeon X5355-processors en 8GB FBD667-geheugen. Het gaat om de QX208SATA-G3, die is voorzien van Intels eigen S5000PSL-moederbord. Naast twee Xeons heeft deze 2U rackmount standaard ruimte voor zes sata-schijven in raid0, raid1 of raid10 (upgradebaar met een extra controller naar acht schijven en raid5-ondersteuning), twee keer gigabit ethernet, een dvd-drive en een enkele 500W-voeding. Het feit dat er geen redundante voeding is maakt hem wat gevoeliger voor uitval dan sommige van de andere machines die we hebben getest, maar met de stabiliteit van een Intel serverbord zit het doorgaans wel goed.


De X5355 die we ontvingen is het topmodel van de Clovertown-serie, met een kloksnelheid van 2,66GHz, een 120W tdp en een prijskaartje van 1172 dollar. Er zijn op dit moment nog drie goedkopere modellen in omloop met een lagere kloksnelheid en een bescheidener tdp van 80W. Begin volgend jaar worden er nog twee versies verwacht, waaronder een low-voltage model dat slechts 50W nodig heeft, oftewel 12,5 watt per core. Hieronder volgt een overzicht van de verschillende quadcores en een vergelijking van hun prijzen ten opzichte van die in het Woodcrest- en Opteron-gamma:
Model | Klok | Bus | Tdp | Prijs | Intro |
---|
X5355 | 2,66GHz | 1333MHz | 120W | $1172 | - |
E5345 | 2,33GHz | 1333MHz | 80W | $851 | - |
E5335 | 2,0GHz | 1333MHz | 80W | ? | Q1 |
E5320 | 1,86GHz | 1066MHz | 80W | $690 | - |
E5310 | 1,6GHz | 1066MHz | 80W | $455 | - |
L5310 | 1,6GHz | 1066MHz | 50W | ? | Q1 |
Opteron | Woodcrest | Clovertown |
---|
1,8GHz | $209 | | 1,6GHz | $209 | | | |
2,0GHz | $255 | 1,86GHz | $256 | | |
| | 2,0GHz | $316 | | |
2,2GHz | $377 | | | | |
2,4GHz | $450 | 2,33GHz | $455 | 1,6GHz | $455 |
2,6GHz | $611 | | | | |
| | 2,66GHz | $690 | 1,86GHz | $690 |
2,8GHz | $786 | | | | |
| | 3,0GHz | $851 | 2,33GHz | $851 |
| | | | 2,66GHz | $1172 |
De Clovertown is duidelijk de duurste chip in ons testarsenaal. In dit artikel vergelijken we hem met Intels dualcore topper - de 3,0GHz Woodcrest - omdat deze prijstechnisch gezien het dichtst in de buurt komt.
MySQL 5.0.20a en 5.0.32-bk
De eerste testkandidaat is MySQL 5.0.20a, dezelfde versie die we in alle eerdere reviews ook hebben gebruikt. Tijdens het opschalen van één core naar twee cores is er weinig bijzonders aan de hand. Clovertown is door zijn lagere kloksnelheid wel wat trager dan het topmodel Woodcrest, maar vertoont geen abnormaal gedrag. Ook de stap van een enkele dualcore naar een dubbele dualcore is weinig bijzonder vergeleken met eerdere ervaringen. Wanneer we twee dualcores met één quadcore vergelijken zien we dat het minder soepel verloopt. Omdat nog maar een van de twee bussen gebruikt kan worden, is de hoeveelheid beschikbare bandbreedte effectief in tweeën gesneden. De prestaties dalen hierdoor met ongeveer 5% onder zware belastingen van 25+ gelijktijdige gebruikers. De uiteindelijke stap naar acht cores blijkt funest te zijn: MySQL snapt het allemaal niet meer en de prestaties zakken onder het niveau van twee dualcores, om tegen het einde zelfs helemaal in te storten. Gemiddeld verliezen we onder zware belastingen 22% van onze prestaties.

Het is niet de eerste keer dat MySQL dit soort gedrag vertoont: in het artikel over de Sun T2000 zagen we precies hetzelfde gebeuren. De ontwikkelaars van MySQL zijn op de hoogte van dit probleem, maar toen we destijds samen met Sun op zoek waren naar een oplossing hiervoor was er nog niets beschikbaar. Voor deze test zijn we opnieuw op zoek gegaan en het bleek dat er inmiddels een patch in de stijgers staat. Deze is nog niet officieel uitgebracht, maar met een snapshot uit BitKeeper - het systeem dat de ontwikkelaars gebruiken om de broncode mee te beheren - van MySQL 5.0.32 konden we alvast kijken hoe ver men hiermee gevorderd is.
De nieuwste ontwikkelingen op het gebied van MySQL zijn interessant: men lijkt een deel van de prestaties met een laag aantal cores te hebben ingeleverd om bij hogere aantallen stabieler te blijven. Gemiddeld verliezen we met één core 10% ten opzichte van 5.0.20a en met twee cores 4%. Bij vier cores registreren we echter een winst van 1% en met acht cores gaat het 36% beter. Ook de piek van 616 requests per seconde voor 5.0.32-bk is duidelijk beter dan de 498 die we maximaal uit 5.0.20a konden persen. Nog steeds geldt echter dat MySQL zware belasting niet leuk vindt: na de piek zakt het aantal requests per seconde weer hard naar beneden.
PostgreSQL 8.2-dev
PostgreSQL is in onze tests altijd het braafste jongetje van de klas geweest wanneer het op schaalgedrag aankwam, en is dit keer ook geen uitzondering. Na de rommelige grafieken van MySQL is het een hele verademing om de nette lijnen van PostgreSQL te zien die precies volgens de verwachtingen verlopen: tot vier cores is de 2,66GHz Clovertown iets trager dan de 3,0GHz Woodcrest, waarbij een enkele quadcore het iets minder doet dan een dubbele dualcore. Tegen twee quadcores is Woodcrest echter niet opgewassen en verbreken we voor het eerst de grens van 750 requests per seconde. Gemiddeld over zware belastingen is de Clovertown-machine van Melrow 19% sneller dan de huidige databaseserver van GoT. Hoewel dit duidelijk een beter resultaat is dan met MySQL werd behaald, blijft het aan de magere kant in verhouding tot het prijsverschil, het hogere tdp en de gemiddelde winst die we in andere benchmarks zagen.

Onder volle belasting gebruikte de server 355 watt. Gemiddeld werden er met PostgreSQL onder zware belastingen 448.726 pagina's geserveerd in tien minuten, wat een prestatie/watt verhouding van 1264 oplevert. Helaas is er (nog) niets om dit mee te vergelijken. De eerder gepubliceerde cijfers zijn namelijk behaald met een oudere versie van de Linux-kernel, terwijl de nieuwe het duidelijk beter doet. Een grove schatting gebaseerd op de cijfers die we wel hebben leert dat de Clovertown waarschijnlijk net iets betere prestaties per watt levert dan de 2,66GHz dualcore.
Conclusie
Na jaren achter de feiten aan te hebben gelopen pakte Intel met de introductie van de Xeon Woodcrest de prestatiekroon terug. AMD had geen echte technische reactie op de nieuwe architectuur klaar en moest derhalve de prijzen van de Opteron verlagen om hem enigszins concurrerend te houden. Een kalmer management was daarmee waarschijnlijk dik tevreden geweest, maar het nieuwe agressieve Intel wil er geen twijfel over laten bestaan dat het weer voorop staat, en gunt zijn concurrent geen seconde ademruimte. De stap van twee naar vier cores blaast het gat tussen Xeon en Opteron wijd open. Het is natuurlijk niet helemaal eerlijk om Intels quadcore, gebaseerd op een nieuwe architectuur, te vergelijken met AMD's huidige dualcore K8. Feit is echter wel dat klanten het komende halfjaar precies die keuze moeten en zullen maken. In die periode zal er voor grofweg 12 miljard dollar aan x86-servers worden verkocht en ligt er dus een goude kans voor Intel om marktaandeel terug te winnen.
Voor AMD is alle hoop gevestigd op Barcelona, de quadcore Opteron. Volgens de laatste geruchten zal deze op maximaal 2,5GHz worden geïntroduceerd, iets onder de 2,66GHz van Intels quadcore. Het is nog onduidelijk hoe veel effect de wijzigingen aan het ontwerp van 'K8L' hebben op de prestaties, maar als we voor het gemak aannemen dat hij even veel werk per klok doet zal hij een klein nadeel qua rauwe rekenkracht hebben. Waarschijnlijk zal dit ruimschoots goed worden gemaakt door het L3-cache en geïntegreerde geheugencontroller. Intel zal daar weer op antwoorden met hogere kloksnelheden, mogelijk nog op 65nm, anders later met het 45nm-procédé. Geruchten plaatsen de 45nm quadcores van Intel ruim boven de 3,0GHz, waar AMD moeilijk zal kunnen volgen.

Barcelona heeft nog een ander belangrijk voordeel boven Clovertown: hij schaalt door naar 4 en 8 sockets. De Xeon MP 'Tulsa' kan zich net staande houden tegen de huidige Opteron, maar maakt geen kans tegen een nieuwe generatie quadcore. Intel werkt daarom hard aan Tigerton, een versie van Clovertown die wel in zwaardere systemen gebruikt kan worden. Het grootste probleem zit hem daarbij niet in de processor - die is praktisch identiek - maar in de chipsets. Met vier losse 1066MHz bussen en 64MB cache in de northbridge zal Intels eigen Clarksboro-chipset de communicatie tussen de sockets een stuk soepeler laten verlopen dan nu het geval is. IBM werkt ondertussen ook aan X4 - de opvolger van de X3 'Hurricane' - die opschaalt tot 32 sockets door de Numa-architectuur van de Opteron na te bootsen in de chipset. Hoe deze zich gaan verhouden tegenover Barcelona kunnen we alleen nog maar raden.

In onze benchmark bood Clovertown niet heel veel voordeel, vooral MySQL was in eerste instantie een teleurstelling. De nieuwste ontwikkelversie lost de problemen deels op: de prestaties met acht cores zijn niet meer dramatisch slecht, maar gemiddeld onder zware belasting nog steeds niet beter dan die van een dubbele dualcore met de oude versie van de software. Wel registreerden we een 19% hogere piek, maar mogelijk profiteert Woodcrest ook van de wijzigingen in 5.0.32-bk, dus die kan niet volledig aan de extra cores worden toegeschreven. PostgreSQL doet het beter, maar een gemiddelde winst van 19% is ook niet echt iets om over naar huis te schrijven als het gaat om een verdubbeling van het aantal cores in een machine.
Misschien gaan de ontwikkelingen op het gebied van hardware op dit moment te snel om bij te houden voor de open source-jongens (m/v). Misschien ligt het ook aan Intels architectuur: met een beperkte busbandbreedte en gebrek aan gedeeld cache wordt Clovertown door AMD in ieder geval niet erkend als een 'echte' quadcore. Maar misschien moeten ook naar onszelf kijken en accepteren dat dit soort servers niet bedoeld is voor de T.net-database. We zullen er achterkomen zodra we een zwaardere Opteron-machine onder handen nemen
.
Dankwoord
Tweakers.net wil Melrow bedanken voor het uitlenen van de Clovertown-server, Peter Zaitsev van het MySQL Performance Blog voor het nakijken van onze configuratie en ACM en moto-moi voor het opzetten en uitvoeren van de benchmarks.
Eerdere artikelen in deze serie
13-11-2006: Intel Xeon 'Woodcrest' 3,0GHz (Apollo 5)
4-9-2006: Intel Xeon 'Woodcrest' 2,66GHz
30-7-2006: AMD Opteron Socket F 2,4GHz
27-7-2006: Sun UltraSparc T1 vs. AMD Opteron
19-4-2006: Xeon vs. Opteron, single- en dualcore