Inleiding: strijd om budget
De Amerikaanse chipproducent AMD heeft opvolgers uitgebracht voor zijn meest energiezuinige chipgeneraties voor mobiele toepassingen. Deze nieuwe accelerated processing units, kortweg apu's, moeten niet zozeer sneller, maar vooral zuiniger worden dan de huidige generatie.
De nieuwe zuinige apu's, die luisteren naar de codenamen Beema en Mullins, werden aanvankelijk ontwikkeld voor goedkope laptops en netbooks, maar dankzij steeds lagere tdp's kunnen ze ook worden ingezet in passief gekoelde platforms als tablets. Bovendien zijn de apu's niet alleen bruikbaar in mobiele apparaten, maar ook in budgetdesktops zijn de AMD-producten steeds vaker te vinden.
Met de opvolgers van het huidige platform heeft AMD nieuwe processorcores tot zijn beschikking, die vooral tot zuinigere systemen moeten leiden. AMD heeft daartoe een aantal features toegevoegd, die we kort de revue laten passeren.
De weg naar zuinigheid
Met het Brazos-platform, in 2011, begon AMD met mobiele processors die zowel Bobcat-cores voor de cpu als grafische Northern Islands-chips aan boord hadden. Die 40nm-apu's, met de codenamen Ontario en Zacate, werden gebruikt voor budgetlaptops en all-in-ones. De apu's, die respectievelijk de C- en E-serie zouden vormen, hadden een tdp van 9W en van 18W.
De refresh of tweede versie van Brazos, in 2012, kreeg een snellere Southern Islands-gpu aan boord en de chipset kreeg een update. Op verlaging van het energiegebruik moest echter worden gewacht tot de volgende generatie, gebaseerd op Jaguar-cores voor de cpu./i/1398704164.png?f=imagenormal)
Die Jaguar-cores werden op 28nm geproduceerd en in de Temash- en Kabini-apu's gecombineerd met graphics core next-gpu's. Dat leidde tot een flinke reductie in de tdp; de zuinigste Temash-apu's werden geconfigureerd voor een tdp van 3,9W, terwijl de Kabini-apu's tdp's van 9, 15 en 25W kregen.
De Jaguar-generatie met Temash en Kabini kreeg meer nieuwe features. Zo werd de south bridge, ofwel de chipset danwel fusion controller hub in de processor geïntegreerd. Door de belangrijkste i/o-hardware als sata- en usb-controllers te integreren, werden de apu's echte socs.
Met de nieuwste generatie heeft AMD de energiebehoefte op de korrel genomen. De x86-cores en de overige soc-onderdelen worden nog steeds op 28nm gebakken, maar moeten zuiniger zijn. De tdp's bedragen 3,95 of 4,5W voor Mullins en 10 of 15W voor Beema. Dat niet alleen, de beveiliging is verbeterd met een geïntegreerde ARM-core, de grafische cores werden verbeterd en er kan van sneller geheugen gebruik worden gemaakt.
Codenaam | Platform | Introductie | Sdp | Tdp | X86-cores | Gpu-cores | Cpu-klok |
Ontario |
Brazos |
Q1 2011 |
x |
9W |
40nm Bobcat |
40nm Northern Islands |
1GHz tot 1,2GHz |
Zacate |
Brazos |
Q1 2011 |
x |
18W |
40nm Bobcat |
40nm Northern Islands |
1,3GHz tot 1,65GHz |
Ontario |
Brazos 2.0 |
Q2 2012 |
x |
9W |
40nm Bobcat |
40nm Southern Islands |
1GHz |
Zacate |
Brazos 2.0 |
Q3 2012 |
x |
18W |
40nm Bobcat |
40nm Southern Islands |
1,4GHz tot 1,75GHz |
Temash |
Jaguar |
Q2 2013 |
3,5W, 5,4W |
3,9W, 8W |
28nm Jaguar |
28nm gcn |
1GHz |
Kabini |
Jaguar |
Q2 2013 |
x |
9W, 15W, 25W |
28nm Jaguar |
28nm gcn |
1GHz tot 2GHz |
Mullins |
Puma+ |
Q2 2014 |
2,8W |
3,95W, 4,5W |
28nm Jaguar |
28nm gcn |
1,4GHz tot 2,2GHz |
Beema |
Puma+ |
Q2 2014 |
x |
10W, 15W |
28nm Jaguar |
28nm gcn |
1,35GHz tot 2,4GHz |
Onder de motorkap
De Mullins- en Beema-socs worden beide op 28nm geproduceerd. AMD weet in de socs respectievelijk twee en vier x86-cores onder te brengen. Die cores worden Puma+ genoemd en zijn per twee voorzien van 1MB L2-cache. Elke soc heeft verder 128 gcn-processors of Radeon-cores.
De Puma+-cores kunnen hoger geklokt worden dan de Jaguar-voorloper. Waar Kabini maximaal 2GHz haalde, kan Beema tot 2,4GHz geklokt worden. Mullins tikt op maximaal 2,2GHz, waar Temash op 1,4GHz bleef hangen. Overigens is Puma+ geen nieuwe processorarchitectuur; het zijn in beginsel dezelfde cores als de Jaguar-cores van de vorige generatie met dezelfde ipc. Wel zijn optimalisaties doorgevoerd, vooral voor energiebeheer./i/1398704266.png?f=imagenormal)
Aangezien de twee apu-families socs zijn, zijn alle overige componenten geïntegreerd. Niet alleen de geheugencontroller, goed voor zuinig ddr3l-geheugen tot 1866MHz, maar ook de pci-express-lanes, sata-controller en usb-controller zijn in de soc aanwezig. De display-logica, met ondersteuning voor vga, hdmi en displayport, is aanwezig, samen met hardware om video te coderen. De grafische processors zijn, net als de x86-cores, een stuk sneller geklokt. Bij Beema tikken de gcn-cores op maximaal 800MHz, waar dat bij Kabini 600MHz was. De zuinigere Temash haalde 300MHz, maar in Mullins is dat 500MHz.
De Mullins- en Beema-socs onderscheiden zich met hun beveiliging van andere socs. AMD heeft een ARM-core in de soc geïntegreerd, die de platform security processor genoemd wordt. Deze psp zorgt onder meer voor hardwarematige encryptie van data en is gebaseerd op een Cortex A5-core. Zo moet beveiliging buiten het besturingssysteem om worden geboden, zodat betalingsverkeer en persoonlijke gegevens veilig zijn. De psp bevat een coprocessor die versleuteling van onder meer aes-, sha- en rsa-data voor zijn rekening neemt./i/1398704300.png?f=imagenormal)
Ten slotte moeten de Mullins-socs in onder meer tablets gecombineerd worden met een losse processor voor sensordata. Die processor kan, zoals dat in steeds meer moderne smartphones gebeurt, sensordata van bijvoorbeeld gyroscopen, gps en accelerometers integreren. Zo hoeft de soc niet constant actief naar dergelijke data te luisteren en kan energie bespaard worden.
Verbeteringen in energiebeheer
Zowel Beema als Mullins wordt op 28nm geproduceerd, net als Temash en Kabini, de vorige generatie mobiele socs. Het ene 28nm-procedé is echter het andere niet en dankzij verbeteringen in het productieproces en aanpassingen in het ontwerp zijn de tdp's verlaagd. De tdp is echter niet de belangrijkste grootheid waarin het energieverbruik wordt uitgedrukt. Net als Intel maakt AMD gebruik van sdp, ofwel scenario design power. Daarmee wordt niet het maximale verbruik, maar een realistisch verbruik bij normaal gebruik aangeduid. Die zijn voor de Mullins-socs verlaagd tot 2,8W, waardoor Mullins passief gekoeld kan worden, terwijl Temash actieve koeling nodig had.
Het is vooral de lekstroom die dankzij de verbeteringen in de procedés en ontwerpen is aangepakt. Lekstromen worden veroorzaakt doordat de isolatielagen tussen de transistoronderdelen steeds kleiner worden. Elektronen kunnen dan 'lekken' en leiden tot stroomverbruik dat niet voor nuttige doeleinden wordt toegepast. AMD meldt dat de lekstroom van de x86-cores in de Mullins-socs met 19 procent is gereduceerd. Of dat ook voor de cores van Beema geldt, laat het bedrijf in het midden. Wel zou de lekstroom in de gpu-cores in zowel Mullins als Beema met maar liefst 38 procent zijn verminderd ten opzichte van die in Temash en Kabini./i/1398704464.png?f=imagenormal)
Voor de zuinigste socs wordt geheugen op 1066MHz ondersteund, maar snelheden van 1333MHz, 1600MHz en 1866MHz zijn ook mogelijk. Dat geheugen is, alweer om energie te besparen, ddrl-geheugen, waarbij de l staat voor low voltage. Voor 1333MHz-modules kost dat volgens AMD 500mW minder energie. Voor meer prestaties kan voor 1866MHz ddr3l gekozen worden; dat zou vooral de grafische prestaties ten goede komen. Naast het geheugen is ook de display aangepakt. AMD schat ongeveer 200mW te kunnen besparen door over te stappen op vml-aansturing van beeldschermen.
Ten slotte wordt het energiebeheer softwarematig aangepakt. Door slimmer gebruik te maken van beschikbare warmtebudgetten, kunnen de socs korte tijd extra hoog geklokt worden. Omdat een apparaat als een tablet relatief langzaam opwarmt, kan de soc gedurende korte tijd op volle snelheid werken. Werklasten kunnen zo sneller, tegen een tijdelijk hogere tdp, afgerond worden, zodat de soc weer sneller laag geklokt kan worden. Dat leidt tot een netto lager energiegebruik en lagere temperaturen. Slimme algoritmes moeten bepalen welke werklasten hiervoor in aanmerking komen.
/i/1398704349.png?f=imagenormal)
In toekomstige generaties zal AMD overigens nog meer energiebesparende features toepassen. Zo werkt het aan een in de soc geïntegreerde spanningsregulatie, wil het spanningen van soc-onderdelen afzonderlijk reguleren en zou het bedrijf de displaylogica in de periodes tussen het renderen van frames willen uitschakelen.
Niet echt sneller, wel zuiniger
De complete line-up van AMD's mobiele socs wordt als vanouds opgedeeld in de E-serie en de A-serie, waarbij de E-serie de minst krachtige en goedkoopste producten omvat. De A-serie is bedoeld voor iets krachtigere producten. AMD heeft Mullins-socs voor zowel de E- als de A-serie en dat geldt ook voor de Beema-socs.
Mullins-socs |
Soc | Sdp | Tdp | X86- cores | Klok- snelheid | Cache | Radeon- cores | Gpu- snelheid | Ddr3- snelheid |
A10 Micro- 6700T |
2,8W |
4,5W |
4x Puma+ |
2,2GHz |
2MB L2 |
128x gcn |
500MHz |
ddr3l-1333 |
A4 Micro- 6400T |
2,8W |
4,5W |
4x Puma+ |
1,6GHz |
2MB L2 |
128x gcn |
350MHz |
ddr3l-1333 |
E1 Micro- 6200T |
2,8W |
3,95W |
2x Puma+ |
1,4GHz |
1MB L2 |
128x gcn |
300MHz |
ddr3l-1066 |
De Mullins-socs zullen we vooral in tablets en budgetlaptops gaan terugzien. Met een sdp van nog geen drie watt kunnen ze passief gekoeld worden. De systeemprijzen zullen bovendien door het enkelkanaalsgeheugen met relatief lage snelheden niet veel hoger worden./i/1398704591.png?f=imagenormal)
Vergeleken met de Temash-generatie is Mullins net iets sneller, vooral dankzij de hogere kloksnelheden. De winst zit echter vooral in de lagere tdp's danwel sdp's en de verbeterde grafische prestaties.
Beema-socs |
Soc | Tdp | X86- cores | Klok- snelheid | Cache | Radeon- cores | Gpu- snelheid | Ddr3- snelheid |
A6-6310 |
15W |
4x Puma+ |
2,4GHz |
2MB L2 |
128x gcn |
800MHz |
ddr3l-1866 |
A4-6210 |
15W |
4x Puma+ |
1,8GHz |
2MB L2 |
128x gcn |
600MHz |
ddr3l-1600 |
E2-6110 |
15W |
4x Puma+ |
1,5GHz |
2MB L2 |
128x gcn |
500MHz |
ddr3l-1600 |
E1-6010 |
10W |
2x Puma+ |
1,35GHz |
1MB L2 |
128x gcn |
350MHz |
ddr3l-1333 |
Voor de Beema-socs geldt in grote lijnen hetzelfde als voor Mullins. Vergeleken met de vorige generatie Kabini zijn de prestaties marginaal verbeterd, hoewel volgens AMD de snelste Kabini-chip in PCMark 8 hoger scoort dan de snelste Beema-soc. Grafisch zijn de gcn-cores wat sneller en de hogere kloksnelheden van de Puma-cores maken de nieuwe generatie wat responsiever en combineren dat met een lagere tdp.
De socs van morgen?
AMD wil met de Mullins- en Beema-socs de concurrentie aangaan met Intels Bay Trail M- en T-socs, en het bedrijf heeft ook de energiezuinige Haswell-processors in de U- en Y-series in het vizier. AMD moet het daarbij vooral hebben van zijn goede grafische prestaties, in combinatie met een lage tdp.
Net als Kabini zou Beema overigens niet alleen voor mobiele toepassingen ingezet kunnen worden. AMD heeft met het onlangs geïntroduceerde AM1-platform Kabini-socs geschikt gemaakt voor desktopbordjes, compleet met socket. Het bedrijf hintte al op upgrades van die Kabini-socs in de toekomst en Beema zou daarvoor de logische kandidaat zijn./i/1398704669.png?f=imagenormal)
Hoe die gok zal uitpakken voor AMD, is nog even afwachten. Het bedrijf heeft de strijd om het highend feitelijk opgegeven: voor de desktop produceert het bedrijf geen FX-processors meer. In plaats daarvan zet AMD vol in op integratie van cpu- en gpu-cores, met hun apu's voor desktop en mobiele apparaten. Een steeds groter deel van de chips wordt gereserveerd voor de gpu: AMD heeft met de Radeon-gpu's sterke grafische capaciteiten in handen. De prestaties van de cpu-cores zijn vergeleken met de concurrentie wat minder sterk. Het is dus een logische keus vooral op gpgpu-berekeningen in te zetten: de vele gpu-cores kunnen de cpu-cores dan ontlasten. Het wachten is alleen op een brede ondersteuning voor gpgpu-technieken als openCL op applicatieniveau.