De Barcelona-processor van AMD houdt de gemoederen in de processorwereld ondertussen al bijna twee jaar bezig. De initiële hype en de daarop volgende problemen en teleurstellingen heb ik al eerder samengevat ter gelegenheid van nieuwjaar, dus ik kan hier heel kort zijn door te zeggen dat het er lang slecht uit heeft gezien voor het product.
Zelfs vandaag voldoet de K10 nog lang niet overal aan de verwachtingen. De Phenom 9850, een 2,5GHz-chip gebaseerd op de bugvrije B3-stepping, blijkt in een review van AnandTech gemiddeld ongeveer tien procent trager te zijn dan de 2,53GHz Core 2 Quad Q9300. We vergelijken dan het topmodel van AMD met de traagste 45nm-vierkopper van Intel. Wie voor een Phenom kiest krijgt bovendien tientallen watts extra stroomverbruik op de koop toe.
Met deze informatie in het achterhoofd is het niet verwonderlijk dat de Phenoms zo goedkoop zijn. Sommige mensen vinden dat een teken dat AMD 'goed bezig is', omdat ze de consument met een klein(er) budget bedienen. Het lijkt er echter sterk op dat deze strategie geboren is uit noodzaak en dat hij voor het bedrijf zelf niet echt gunstig uitpakt.
Het goede nieuws
De situatie in voor servers staat in sterk contrast met die in desktops. Nu de B3-stepping uit is en de quadcore Opteron voor het eerst normaal beschikbaar is, zijn er eindelijk een aantal goed gestandaardiseerde benchmarkresultaten van verschenen, te weten SAP-SD 2-tier en TPC-
TPC-C (4 sockets) | ||||
---|---|---|---|---|
Power6 | 4,2GHz | 256GB | $1.566.380 | ![]() ![]() ![]() |
Xeon | 2,93GHz | 256GB | $1.337.458 | ![]() ![]() ![]() |
Xeon | 2,93GHz | 128GB | $694.335 | ![]() ![]() ![]() |
![]() | 2,3GHz | 128GB | $502.836 | ![]() ![]() ![]() |
Itanium | 1,6GHz | 192GB | $673.551 | ![]() ![]() ![]() |
Opteron | 3,2GHz | 128GB | $549.416 | ![]() ![]() ![]() |
De score die HP neerzet voor Barcelona met zijn nieuwe Proliant DL585 G5 ligt ruim vijftig procent hoger dan het volgende beste AMD-
SAP-SD (4 sockets) | ||||
---|---|---|---|---|
Power6 | 4,7GHz | 64GB | ![]() ![]() ![]() | |
Xeon | 2,93GHz | 64GB | ![]() ![]() ![]() | |
![]() | 2,3GHz | 64GB | ![]() ![]() ![]() | |
Itanium | 1,6GHz | 48GB | ![]() ![]() ![]() | |
Opteron | 3,0GHz | 32GB | ![]() ![]() ![]() |
De voorsprong van de Xeon is hier met zeven procent iets groter, maar heel overtuigend is het nog steeds niet. Dit is geen goed nieuws voor Intel. De Barcelona heeft een 95W tdp, kost 1019 dollar en gebruikt 'gewoon' registered ddr2-repen. De Xeon daarentegen heeft een 130W tdp, kost 2301 dollar en werkt alleen in combinatie met relatief duur en warm fbdimm-geheugen. Dat is een hoge prijs voor minder dan tien procent extra prestaties.
Wat is er aan de hand waardoor Intel vrijwel moeiteloos wint in desktops, maar in servers met vier sockets alle zeilen bij moet zetten om een kleine overwinning te boeken? Het antwoord ligt in de bandbreedte. Een machine met vier Opterons kan in theorie 42,4GB/s van of naar het geheugen pompen, terwijl een machine met vier Xeons maximaal 32GB/s haalt. Dat laatste is de som van 21,3GB/s lezen en 10,6GB/s schrijven, waarbij eigenlijk vooral het lezen meeweegt. Als we kijken wat er per socket mogelijk is dan wordt het nog erger: een Xeon MP kan maximaal 8,5GB/s door zijn fsb persen, terwijl een Opteron door zijn lokale geheugen te combineren met HyperTransport-
Er zitten een hoop haken en ogen aan deze berekening, op de eerste plaats natuurlijk het gegeven dat de overige processors hun bandbreedte grotendeels zélf nodig hebben. Feit blijft echter dat systemen met directe interconnects en geheugencontrollers in de praktijk zeer succesvol zijn gebleken, zowel voor AMD in x86-land als voor bedrijven zoals DEC, HP en IBM die het al eerder toepasten in hun high-end serverproducten.
Het slechte nieuws
De huidige situatie zal niet lang meer duren: tegen het einde van het jaar zullen Intels Nehalem en Tukwila een inhaalslag gaan maken op het gebied van bandbreedte. De Xeon gaat van maximaal 12,8GB/s over de front side bus naar 70,4 tot 83,2GB/s uit drie ddr3-kanalen en twee QuickPath-

AMD heeft geluk dat Intel altijd traag is met het uitbrengen van Xeons die geschikt zijn voor vier sockets. Niet dat de voor dit jaar geplande Dunnington met zijn zes cores en 16MB L3-cache geen betere resultaten zal laten zien, maar omdat hij nog steeds vastzit op een zielig-afstekende bus van 8,5GB/s zal Barcelona of anders Shanghai nog wel in de buurt kunnen komen - al is het maar in bepaalde benchmarks of binnen een bepaald budget.
Over het geheel genomen zal het echter toch wel even slikken zijn voor AMD. Vijf jaar lang heeft het kunnen genieten van geïntegreerde geheugencontrollers en interconnects terwijl Intel maar met zijn ouderwetse bussen bleef aanmodderen. Als dat voordeel wegvalt zal het een stuk moeilijker worden om bij te blijven in de benchmarks. AMD had nog ruim een jaar kunnen genieten van deze situatie als de Barcelona op tijd uit was gekomen, maar door de TLB-bug is een groot deel van die tijd verspild. Nu is het dus zaak om nog even flink te profiteren, want zodra de grote wijzer van de 'tick-tock' op Nehalem staat, zal alles weer veranderen.