De verschillen tussen de dual-coreprocessors van AMD en Intel zijn door AnandTech op een rijtje gezet. In het kader van 'de zoektocht naar meer rekenkracht' wordt de opkomst van threadparallellisme toegelicht: het zwaartepunt in processorontwikkeling is verschoven van veel instructies uitvoeren, naar veel instructies tegelijk uitvoeren. Aan de hand van de Pentium D en de Opteron 875 schetst de site de sterke en zwakke punten van de verschillende benaderingen die de processorfabrikanten gebruiken.
Intels huidige dual-coreprocessor is in feite weinig meer dan een tweetal P4's op een enkel plakje silicium, die via een gedeelde 800MHz bus met elkaar moeten praten. Die bus wordt ook nog eens gebruikt om het RAM aan te spreken, met vertragingen als logisch gevolg. De oplossing van AMD voor dit probleem is de System Request Queue (SRQ), die enerzijds met de verschillende cores, en anderzijds met de geheugeninterface communiceert. Een benchmark van de chips laat duidelijk zien dat communicatie tussen twee cores bij AMD tot zestig procent sneller verloopt dan bij een vergelijkbaar dual Xeon- of Pentium D-systeem.
CPU configuration | Hyper Transport | Bus | Cache2Cache |
Dual Opteron 2.4 GHz | 800 MHz | N/A | 159 ns |
Dual Opteron 2.4 GHz (iwill) | 1000 MHz | N/A | 150 ns |
Dual core Opteron 2.2 GHz to other dual core | 1000 MHz | N/A | 164 ns |
One dual core Opteron 2.2 GHz (875) | 2200 MHz * | N/A | 107 ns |
Quad Opteron 848 2.2 GHz (CPU0 to CPU2) | 800 MHz | N/A | 240 ns |
XeonDP (Prestonia) 2.8GHz | N/A | 400 MHz | 297 ns |
Dual Xeon 3.06 (Gallatin) | N/A | 533 MHz | 219 ns |
Dual Xeon 3.2 GHz (Nocona) | N/A | 800 MHz | 242 ns |
Pentium D (dual core) | N/A | 800 MHz | 240 ns |
Dual Xeon 3.6 GHz (Nocona) | N/A | 800 MHz | 244 ns |
Ook het aanspreken van het externe geheugen zou minstens twintig procent sneller kunnen verlopen. De auteur beredeneert vervolgens dat software die weinig rekentijd vraagt maar wel veel schrijfacties op het geheugen uitvoert, weliswaar niet veel voordeel van een tweede core zal ondervinden, maar dat de Opteron-architectuur wel beduidend meer winst kan boeken dan Intels producten.
Verder gaat AnandTech in op de voor- en nadelen van Symmetric Multi Threading (SMT). Deze techniek, bedoeld om processors optimaal te gebruiken, heeft recentelijk veel kritiek gekregen vanwege de geringe snelheidswinst. De huidige implementatie van Intel wordt 'op zijn best middelmatig' genoemd. Als beter geslaagd voorbeeld van SMT wordt de IBM Power 5-processor aangehaald, die per procent toename in die-grootte bijna twee keer zoveel snelheidswinst kan boeken als de Intel.
Tot slot biedt het artikel een vooruitblik op toekomstige ontwikkelingen. Intel zou, onder meer door een beter ontworpen SMT-implementatie, eenvoudig de hoeveelheid instructies per klokcycle kunnen vergroten. Ook zou met extra cache snelheidswinst tussen de cores geboekt kunnen worden. AMD, dat met haar ontwerp volgens AnandTech ruim op Intel voorloopt, kan daar met extra cache een snellere SRQ tegenover stellen. Bovendien zou dat bedrijf nog winst op het terrein van geheugenbandbreedte kunnen boeken. Eén ding is wel duidelijk: in de slag tussen de beide fabrikanten zullen megahertzen steeds minder invloed hebben.
