Introductie
Met het Zambezi-platform heeft AMD het FX-label nieuw leven ingeblazen. De nieuwe FX-processors zijn gebaseerd op AMD's Bulldozer-architectuur. Deze volledig nieuwe micro-architectuur is de opvolger van de K10-architectuur, die in 2007 werd geïntroduceerd.
Van 2003 tot 2006 voerde AMD de Athlon 64 FX-processors, bedoeld voor overklokkers en andere 'hardware enthusiasts'. Deze single- en dualcore Athlons waren op 130nm en 90nm gebakken, hadden de hoogste kloksnelheden en hadden vrij instelbare multipliers.
De Bulldozer-cores worden door Global Foundries met 32nm-procestechnologie gebakken. Een van de meest kenmerkende vernieuwingen is het gebruik van modules. Elke module levert twee cores; de high-end Zambezi-processors beschikken over twee tot vier modules, waarmee dus quad-, hexa- en octacores gebouwd worden.
Voor we naar de prestaties van de FX-serie kijken, zullen we de architectuur onder de loep nemen.
De modules
Met de nieuwe Bulldozer-architectuur wordt een nieuwe manier geïntroduceerd om processors samen te stellen: AMD gebruikt niet langer volledig afzonderlijke cores, ieder met eigen cache en eigen executiepaden. De L3-cache werd al langer door meer dan een core gebruikt, maar voortaan geldt dat ook voor de L2-cache. Ook de floating point unit wordt tussen de twee cores van een module gedeeld.
Andere onderdelen, die niet kunnen worden gedeeld, blijven in elke module in tweevoud aanwezig. Daaronder valt L1-cache voor instructies en data, maar ook de integer units.
/i/1318259363.png?f=imagenormal)
Het delen van een aantal onderdelen moet zorgen voor een aanzienlijke uitbreiding van de rekenkracht, zonder dat de die-size veel groter wordt. Volgens AMD heeft een module met twee cores maar ongeveer vijftien procent extra siliciumoppervlak nodig dan een klassieke enkele core zoals van de K10-architectuur. De octacore FX-8150 zou ongeveer twee miljard transistors tellen, die een oppervlak van 315 vierkante millimeter beslaan.
Daarmee zijn de twee cores in een Bulldozer-module niet equivalent aan twee K10-cores. De gedeelde architectuur heeft wel degelijk invloed op de prestaties; een Zambezi-octacore is niet twee keer zo snel als een Phenom II-quadcore. Waarom dat zo is, bekijken we aan de hand van een close-up van een module.
De architectuur
De Bulldozer-modules werden ontwikkeld met twee cores als uitgangspunt, waarna zoveel mogelijk in redundante en niet optimaal benutte onderdelen werd gesneden. Uiteraard wilde AMD de prestaties zoveel mogelijk op peil houden, maar het bedrijf presenteert elke Bulldozer-core als echte core - en feitelijk is dat niet helemaal juist.
/i/1318259301.png?f=imagenormal)
De fetch- en decode-logica wordt door twee cores gedeeld. Elke core heeft eigen schedulers voor integer-verwerking, maar de L2-cache en de scheduler voor de floating-point-unit worden door de twee cores gedeeld.
/i/1318259331.png?f=imagenormal)
De data in de buffers wordt naar een gedeelde prediction queue gestuurd, die de data doorgeeft aan 64kB instructiecache. Daarvandaan worden instructies naar de fetch queue verzonden, om vervolgens bij vier x86-decoders aan te komen. Vanuit deze decoders worden de instructies doorgegeven aan de integer-scheduler van de beide sub-cores en aan de gedeelde floating point-scheduler.
/i/1318259363.png?f=imagenormal)
De tweekanaals geheugencontroller ten slotte is 72 bits breed en stuurt geheugen tot 1866MHz aan. Daarnaast telt een Bulldozer-die nog vier 16bits hypertransport-links.
Energiebeheer en turbo
Bulldozer-cores zijn zuiniger dan de K10-processors. Niet alleen is er door het delen van elementen bezuinigd op transistors en dus op het opgenomen vermogen; ook het 32nm soi-procedé zorgt voor zuiniger chips. Daarnaast is ingezet op efficiënt geheugenbeheer en wordt het energiebeheer via zowel firmware als software geregeld.
Bovendien worden de cores continu geschakeld tussen zuinige en actieve modi. In de zuinige C1E- of idle-state wordt minimaal energie verbruikt, terwijl de cores ook nog in de zogeheten C6-state kunnen worden gebracht: de cores zijn dan in feite uitgeschakeld.
Opvallender is dat er niet, zoals bijvoorbeeld in de Thuban-processors, een enkele turbo-status is. Naast de Turbo Core-modus is namelijk ook een Max Turbo-stand beschikbaar.
/i/1318259053.png?f=imagenormal)
Bij een werklast waarbij alle cores actief zijn, kunnen deze met Turbo Core worden versneld. Voor het topmodel, de standaard op 3,6GHz geklokte FX-8150, betekent dit een turbosnelheid van 3,9GHz voor alle acht cores tegelijk. Wanneer echter niet meer dan de helft van de cores aan het werk is en de tdp nog niet volledig wordt benut, kunnen de actieve cores een in de Max Turbo-stand worden gezet. Bij de FX-8150 betekent dat een effectieve kloksnelheid van 4,2GHz, een winst van 600MHz.
/i/1318259159.png?f=imagenormal)
Met AMD's OverDrive-software kunnen de snelheden van de cores in de gaten worden gehouden, maar ook worden aangepast. Daarbij zijn zowel de ht-snelheid als de multipliers in te stellen. Ook spanningen en andere variabelen kunnen worden gekozen en uitgelezen.
Het platform: Zambezi
Zoals we inmiddels van AMD gewend zijn, is het nieuwe Zambezi-platform backwards compatible met zijn voorganger. Een FX-processor kan in een AM3-moederbord worden gestoken, mits de fabrikant een bios-update uitbrengt om dat mogelijk te maken. Ook kan een wat oudere processor in een Zambezi-moederbord worden gestoken.
'Zambezi' bestaat uit de FX-processors en AMD's 900-chipset. Voor het high-end segment is er de combinatie van de 990FX-chipset en de SB950-southbridge. De iets eenvoudiger 990X-chipset wordt met dezelfde southbridge gecombineerd en de nog verder uitgeklede 970-chipset kan met zowel de SB950- als de SB920-southbridge worden gecombineerd.
Chipset | Southbridge | Pci-configuratie | Tdp | Extra |
990FX |
SB950 |
1x x16, 2x x16 of 4x x8 |
19,6W |
14x usb 2.0. sata-600 |
990X |
SB950 |
1x x16 of 2x x8 |
14W |
14x usb 2.0. sata-600 |
970 |
SB950/SB920 |
1x x16 |
13,6W |
14x usb 2.0. sata-600 |
AMD brengt de FX-serie processors uit in een aantal verschillende configuraties, met uiteraard steeds een veelvoud van twee cores aan boord. Vier van de cpu's zijn bij introductie direct verkrijgbaar; de andere processors worden in het eerste kwartaal van 2012 verwacht. AMD heeft beloofd dat er bij de introductie voldoende processors op voorraad zullen zijn; met de eveneens op 32nm geproduceerde Llano's had het bedrijf nog te kampen met productieproblemen.
Cpu | Kloksnelheid | Turbo | Max-turbo | Cores | L2-cache | Tdp | Prijs |
FX-8150 |
3,6GHz |
3,9GHz |
4,2GHz |
8 |
8MB |
125W |
244 euro |
FX-8120 |
3,1GHz |
3,4GHz |
4,0GHz |
8 |
8MB |
95W / 125W |
204 euro |
FX-8100 |
2,8GHz |
3,1GHz |
3,7GHz |
8 |
8MB |
95W |
Q1 2012 |
FX-6100 |
3,3GHz |
3,6GHz |
3,9GHz |
6 |
6MB |
95W |
159 euro |
FX-4170 |
4,2GHz |
n/a |
4,3GHz |
4 |
4MB |
125W |
Q1 2012 |
FX-B4150 |
3,8GHz |
3,9GHz |
4,0GHz |
4 |
4MB |
95W |
Q1 2012 |
FX-4100 |
3,6GHz |
3,7GHz |
3,8GHz |
4 |
4MB |
95W |
114 euro |
Een opvallend verschil tussen de FX-modellen en eerdere AMD- en Intel-processors is de ondersteunde geheugensnelheid. Die ligt bij de Bulldozers dankzij een vernieuwde geheugencontroller op 1866MHz. Bovendien zijn alle processors overklokbaar; de multipliers van alle gehele FX-modellen zijn vrij instelbaar. Daarmee zou je kunnen zeggen dat AMD van de Bulldozer-cpu's alleen Black Editions uitbrengt.