Door Willem de Moor

Redacteur

Bulldozer: AMD's nieuwe processorarchitectuur

12-10-2011 • 06:00

30

Multipage-opmaak

Introductie

Met het Zambezi-platform heeft AMD het FX-label nieuw leven ingeblazen. De nieuwe FX-processors zijn gebaseerd op AMD's Bulldozer-architectuur. Deze volledig nieuwe micro-architectuur is de opvolger van de K10-architectuur, die in 2007 werd geïntroduceerd.

Van 2003 tot 2006 voerde AMD de Athlon 64 FX-processors, bedoeld voor overklokkers en andere 'hardware enthusiasts'. Deze single- en dualcore Athlons waren op 130nm en 90nm gebakken, hadden de hoogste kloksnelheden en hadden vrij instelbare multipliers.

De Bulldozer-cores worden door Global Foundries met 32nm-procestechnologie gebakken. Een van de meest kenmerkende vernieuwingen is het gebruik van modules. Elke module levert twee cores; de high-end Zambezi-processors beschikken over twee tot vier modules, waarmee dus quad-, hexa- en octacores gebouwd worden.

Voor we naar de prestaties van de FX-serie kijken, zullen we de architectuur onder de loep nemen.

Bulldozer die

De modules

Met de nieuwe Bulldozer-architectuur wordt een nieuwe manier geïntroduceerd om processors samen te stellen: AMD gebruikt niet langer volledig afzonderlijke cores, ieder met eigen cache en eigen executiepaden. De L3-cache werd al langer door meer dan een core gebruikt, maar voortaan geldt dat ook voor de L2-cache. Ook de floating point unit wordt tussen de twee cores van een module gedeeld.

Andere onderdelen, die niet kunnen worden gedeeld, blijven in elke module in tweevoud aanwezig. Daaronder valt L1-cache voor instructies en data, maar ook de integer units.

Bulldozer: die-layout

Het delen van een aantal onderdelen moet zorgen voor een aanzienlijke uitbreiding van de rekenkracht, zonder dat de die-size veel groter wordt. Volgens AMD heeft een module met twee cores maar ongeveer vijftien procent extra siliciumoppervlak nodig dan een klassieke enkele core zoals van de K10-architectuur. De octacore FX-8150 zou ongeveer twee miljard transistors tellen, die een oppervlak van 315 vierkante millimeter beslaan.

Daarmee zijn de twee cores in een Bulldozer-module niet equivalent aan twee K10-cores. De gedeelde architectuur heeft wel degelijk invloed op de prestaties; een Zambezi-octacore is niet twee keer zo snel als een Phenom II-quadcore. Waarom dat zo is, bekijken we aan de hand van een close-up van een module.

De architectuur

De Bulldozer-modules werden ontwikkeld met twee cores als uitgangspunt, waarna zoveel mogelijk in redundante en niet optimaal benutte onderdelen werd gesneden. Uiteraard wilde AMD de prestaties zoveel mogelijk op peil houden, maar het bedrijf presenteert elke Bulldozer-core als echte core - en feitelijk is dat niet helemaal juist.

Bulldozer-module: evolutie

De fetch- en decode-logica wordt door twee cores gedeeld. Elke core heeft eigen schedulers voor integer-verwerking, maar de L2-cache en de scheduler voor de floating-point-unit worden door de twee cores gedeeld.

Bulldozer-module: architectuur

De data in de buffers wordt naar een gedeelde prediction queue gestuurd, die de data doorgeeft aan 64kB instructiecache. Daarvandaan worden instructies naar de fetch queue verzonden, om vervolgens bij vier x86-decoders aan te komen. Vanuit deze decoders worden de instructies doorgegeven aan de integer-scheduler van de beide sub-cores en aan de gedeelde floating point-scheduler.

Bulldozer: die-layout

De tweekanaals geheugencontroller ten slotte is 72 bits breed en stuurt geheugen tot 1866MHz aan. Daarnaast telt een Bulldozer-die nog vier 16bits hypertransport-links.

Energiebeheer en turbo

Bulldozer-cores zijn zuiniger dan de K10-processors. Niet alleen is er door het delen van elementen bezuinigd op transistors en dus op het opgenomen vermogen; ook het 32nm soi-procedé zorgt voor zuiniger chips. Daarnaast is ingezet op efficiënt geheugenbeheer en wordt het energiebeheer via zowel firmware als software geregeld.

Bovendien worden de cores continu geschakeld tussen zuinige en actieve modi. In de zuinige C1E- of idle-state wordt minimaal energie verbruikt, terwijl de cores ook nog in de zogeheten C6-state kunnen worden gebracht: de cores zijn dan in feite uitgeschakeld.

Opvallender is dat er niet, zoals bijvoorbeeld in de Thuban-processors, een enkele turbo-status is. Naast de Turbo Core-modus is namelijk ook een Max Turbo-stand beschikbaar.

Vernieuwde AMD Turbo Core

Bij een werklast waarbij alle cores actief zijn, kunnen deze met Turbo Core worden versneld. Voor het topmodel, de standaard op 3,6GHz geklokte FX-8150, betekent dit een turbosnelheid van 3,9GHz voor alle acht cores tegelijk. Wanneer echter niet meer dan de helft van de cores aan het werk is en de tdp nog niet volledig wordt benut, kunnen de actieve cores een in de Max Turbo-stand worden gezet. Bij de FX-8150 betekent dat een effectieve kloksnelheid van 4,2GHz, een winst van 600MHz.

AMD OverDrive

Met AMD's OverDrive-software kunnen de snelheden van de cores in de gaten worden gehouden, maar ook worden aangepast. Daarbij zijn zowel de ht-snelheid als de multipliers in te stellen. Ook spanningen en andere variabelen kunnen worden gekozen en uitgelezen.

Het platform: Zambezi

Zoals we inmiddels van AMD gewend zijn, is het nieuwe Zambezi-platform backwards compatible met zijn voorganger. Een FX-processor kan in een AM3-moederbord worden gestoken, mits de fabrikant een bios-update uitbrengt om dat mogelijk te maken. Ook kan een wat oudere processor in een Zambezi-moederbord worden gestoken.

'Zambezi' bestaat uit de FX-processors en AMD's 900-chipset. Voor het high-end segment is er de combinatie van de 990FX-chipset en de SB950-southbridge. De iets eenvoudiger 990X-chipset wordt met dezelfde southbridge gecombineerd en de nog verder uitgeklede 970-chipset kan met zowel de SB950- als de SB920-southbridge worden gecombineerd.

ChipsetSouthbridgePci-configuratieTdpExtra
990FX SB950 1x x16, 2x x16 of 4x x8 19,6W 14x usb 2.0. sata-600
990X SB950 1x x16 of 2x x8 14W 14x usb 2.0. sata-600
970 SB950/SB920 1x x16 13,6W 14x usb 2.0. sata-600

AMD brengt de FX-serie processors uit in een aantal verschillende configuraties, met uiteraard steeds een veelvoud van twee cores aan boord. Vier van de cpu's zijn bij introductie direct verkrijgbaar; de andere processors worden in het eerste kwartaal van 2012 verwacht. AMD heeft beloofd dat er bij de introductie voldoende processors op voorraad zullen zijn; met de eveneens op 32nm geproduceerde Llano's had het bedrijf nog te kampen met productieproblemen.

CpuKloksnelheidTurboMax-turboCoresL2-cacheTdpPrijs
FX-8150 3,6GHz 3,9GHz 4,2GHz 8 8MB 125W 244 euro
FX-8120 3,1GHz 3,4GHz 4,0GHz 8 8MB 95W / 125W 204 euro
FX-8100 2,8GHz 3,1GHz 3,7GHz 8 8MB 95W Q1 2012
FX-6100 3,3GHz 3,6GHz 3,9GHz 6 6MB 95W 159 euro
FX-4170 4,2GHz n/a 4,3GHz 4 4MB 125W Q1 2012
FX-B4150 3,8GHz 3,9GHz 4,0GHz 4 4MB 95W Q1 2012
FX-4100 3,6GHz 3,7GHz 3,8GHz 4 4MB 95W 114 euro

Een opvallend verschil tussen de FX-modellen en eerdere AMD- en Intel-processors is de ondersteunde geheugensnelheid. Die ligt bij de Bulldozers dankzij een vernieuwde geheugencontroller op 1866MHz. Bovendien zijn alle processors overklokbaar; de multipliers van alle gehele FX-modellen zijn vrij instelbaar. Daarmee zou je kunnen zeggen dat AMD van de Bulldozer-cpu's alleen Black Editions uitbrengt.

Reacties (30)

30
30
18
0
0
7
Wijzig sortering
Ai ai ai, 3,6 GHz Octa Core voor maar 244 euro! Misschien toch maar AMD in plaats van Intel voor mijn nieuwe CPU? *gaat snel naar de benchmarks*
ze staan nu nog maar bij een webshop aangezien ze nog niet gereleased zijn.
Waarschijnlijk worden ze nog wel een paart tientjes goedkoper als ze gereleased zijn.
Daar heb je gelijk in, hij staat nu bij Azerty voor €230. Da's alweer 14 euro eraf, en met een aantal grote webshops erbij zou het wel eens kunnen dat we richting de 215 - 220 euro gaan...
hmm echt super veel meer heb je niet aan een octa core de meeste programma's kunnen toch maar met 1 core overweg en dan blaast intel amd er uit
Ik gebruik nochtans continue software die voor meerdere cores gemaakt is (Photoshop, Autopano giga, HDR software, Visual studio, ...)
Je moet vooruit denken... Mischien zijn er in 2012 wel programma's die meerdere core's gebruiken, dat weet je niet. Een Octocore is altijd handig met name de toekomst.

''en dan blaast intel amd er uit''

Dat is echt een matige reactie.
Je moet vooruit denken... Mischien zijn er in 2012 wel programma's die meerdere core's gebruiken, dat weet je niet. Een Octocore is altijd handig met name de toekomst.
Tjsa, "met het oog op de toekomst" onderdelen kopen is altijd al duur geweest. Stel dat er in de toekomst de applicaties en programma's zo ver zijn dát we het nodig lijken te hebben, zijn er alweer nieuwe processoren ;)

(tenzij je nu PS of render progjes gebruikt)

OT: 5Ghz is wel über :*), heb benchmarks gezien met corsair H100 op 4,9 stabiel!

[Reactie gewijzigd door Gertjezzz op 24 juli 2024 21:57]

als je het mss nog niet wist, ze hebben met de FX-8150 onlangs het overclock record gehaald van iets boven de 8Ghz per core, dus ik zou zeggen dat deze idd wel lekker te overclocken zijn ^^

@Getto: deze 8-core CPU's zijn ook handig voor studentjes/scholen die enkele VM's (Virtual Machines) tegelijk draaien op hun computertje, dan is een hoger aantal cores zeker handig.

Kan je zo een 4tal VM's elk 1 dedicated core geven, en toch nog genoeg rekenkracht overhouden om op je desktop zelf ook nog wat te werken (bv browser op het internet naar handleidingen + tutorials enzo)
@ TehJoker:
Ho ho... STOP! Het was geen 8GHz per core, er waren zes "cores" uitgeschakeld en twee werden op 8+GHz geklokt met vloeibaar helium, blijkbaar was LN2 te weinig ofzo. Ik denk niet dat heel veel mensen dit gaan doen, mja, leuk voor het betere patswerk zullen we maar zeggen. :9
Meh, ja leuk allemaal, maar dat gaat eigenlijk allemaal prima op oude quadcore architectuur...

Ik heb zo nu en dan een VM of 4 lopen met microsimulaties (puur om te testen of het goed werkte) en daarbij kon ik rustig 1GB toewijzen aan iedere XP batch (700 nodig voor het applicatie, precies genoeg dus). Daarmee kon ik dan zo snel als een tragere VM + ouderwetsere applicatie gaat, op een i920 rekenen, terwijl m'n Win 7 x64 gewoon nog met 2 overgebleven GB internet radio kon streamen en een Diablo 2 clientje kon afdraaien.

Totdat je met meerdere VM's gaat Batch photoshoppen ben je voor 5 users al goed op weg met een oude 1366 machine. Ik denk dat je met meer memory zelfs een 6 tal studenten op je machine zou kunnen laten scripten en zelf nog gewoon kan werken op zo'n machientje.

Helaas geld het voor 95% van de applicaties nog niet dat meer cores echt voordeel oplevert. Tot je echt aan de massale berekeningen en webserver toepassingen gaat.

Ook zegt het aantal Mhz me haast niets meer tegenwoordig. Om en nabij gelijk aan een i930 (2,8Ghz) terwijl deze op 3,6Ghz loopt... En vrijwel continue gedomineerd door een 2600K...

Niet verkeerd maar ook niet geweldig.
als je het mss nog niet wist, ze hebben met de FX-8150 onlangs het overclock record gehaald van iets boven de 8Ghz per core, dus ik zou zeggen dat deze idd wel lekker te overclocken zijn ^^
Als jij het nog neit wist... Helium coolers kan ik niet krijgen :/
Ik heb het hier over "normale" koelings mogelijkheden...
het probleem met amd's keuze is dat de hele techniek die amd gebruikt heefd niet compleet ondersteund word en veel apps anders denken dan dat optimaal is voor amd en ik ben bang dat dat gaat blijven en dat is de rede dat deze chip trager is bij single core apps omdat het een module en geen core is.
Waar zijn de benchmarkresultaten? Het theoretische verhaal was natuurlijk al lang bekend, daarvoor hoefde niet gewacht te worden op het aflopen van de NDA. Alleen de exacte clocksnelheden, prijzen en tdp waren nog een soort publiek geheim.

Edit: twee artikelen die vlak achter elkaar gepubliceerd zijn dus.

Jammer dat Tweakers niet gekeken heeft naar de i5 2500, aangezien het de voorspelling was dat de 8150 tussen de 2500 en de 2600 zou uitkomen. Dat lijkt wel behoorlijk het geval, alleen is het verschil met de 2500 niet goed te zien.

Bulldozer valt me niet tegen. Het is niet het wonder waar sommigen op gehoopt hadden, maar met goede prijzen kan AMD hiermee weer fatsoenlijk concurreren met Intel. Dat laatste is wat mij betreft het belangrijkste, want daar plukt iedereen de vruchten van in de vorm van lagere prijzen.

In 2012 schijnt er al een nieuwe revisie uit te komen om bepaalde zwakke punten te verbeteren, ik ben benieuwd wat dat gaat brengen.

[Reactie gewijzigd door Verwijderd op 24 juli 2024 21:57]

de topic die 1 minuut later is gepubliceerd.
deze dus

een zeer verhelderende tekst, alleen 14x usb 2.0 en sata 600 word ondersteund. waar is usb 3.0? (of heb ik er overheen gelezen?)
USB3 komt nog in de volgende chipset.
Zo, op dat ene plaatje is te zien, de FX die is overklokt naar 5,0Ghz :9~ :9~ :9~

Wat een top prijzen trouwens! _/-\o_ (Had ik ook wel verwacht van AMD)
Zo, op dat ene plaatje is te zien, de FX die is overklokt naar 5,0Ghz :9~ :9~ :9~
Moet niet verwachten dat elke dat gaat halen natuurlijk, AMD zal wel een cherrypicked processortje hebben ;)
High-end lucht is als ik me goed herinner rond de 4,4Ghz..
Heb benchmarks gezien met corsair H100 op 5,2 (unstable) en 4,9 stabiel!

[Reactie gewijzigd door Gertjezzz op 24 juli 2024 21:57]

Jammer van het energie verbruik, de Intel Ivy Bridge gaat dat hoogst waarschijnlijk beter doen met hogere prestaties.
maar gaat een bak meer kosten qua prijs restatie is de 8150 tussen de 2500 en 2600k in.
Was al een tijdje aan het kijken voor een nieuwe render computer (werk veel met UDK, en die heeft veel baat bij extra cores),
mijn oude pc (q9400 met 4GB DDR2) begint helaas de tand des tijds te tonen.

De basis in dit artikel klinkt goed, had niet verwacht dat AMD een killer chip zou neerzetten, ben blij dat ze wel weer een goede prijs/kwaliteit verhouding vasthouden.

De prijs van een AMD setup blijft imo toch nog steeds een heel goed argument om toch AMD te blijven meenemen in de keuze voor een nieuw systeem. 8 threads kunnen gebruiken kost bij AMD een stuk minder dan bij Intel ... (dat is nog eens gewoon 4 cores met HT ...).

Kortom, zit eruit als een goede chip, ben benieuwd wat de prijzen gaan doen :), nu snel het benchmark gedeelte lezen ....
Wat een prijzen. Dit is wel een heel groot verschil met Intel. Nog een iets dat opvalt is dat alle processors makkelijk overklockt kunnen worden wat bij Intel niet altijd het geval heeft.
Als de benchmark goed zijn dan zal Intel waarschijnlijk moeten inboeten.
sorry maar de intel chip kan redelijk makkelijk op 4.5 ghz en hoger draaien.
en nee ik ben geen intel fanboy ik ben alleen diep teleurgesteld door amd
Hmm, dus een module heeft maar een logische unit? Wat ze dus eigenlijk een dualcore noemen, noemt Intel een hyperthreaded single core? Beetje verwarrend...
Wow die zijn goedkoop...
ze zijn bijna even duur dan de beter presterende intel chips dus de prijs is niet geheel correct als je het mij vraagd.
nadeel van intel is wel weer dat ik de borden niet echt super vind.
Prijzen vallen mij heel erg mee, snel de benches checken.
en vallen ze nog steeds mee :P ?
De prijzen zijn wel geweldig! Had wel iets meer verwacht van bulldozer maar het stukje overclocken is wel weer mooi ;) Toch maar eens een AMD overwegen voor mijn volgende pc.

Op dit item kan niet meer gereageerd worden.