Het einde voor de oude Atom
Het einde voor de oude Atom
Intel heeft in de afgelopen vijf jaar veel uit zijn Atom-processor weten te halen. De chip werd ooit ontwikkeld voor netbooks. Toen bleek dat die categorie langzaam uitstierf, besloot Intel de chips om te bouwen voor gebruik in tablets en smartphones. Dat lukte deels. Er is een handjevol telefoons en tablets met Intel-hardware uitgekomen, maar vooral op de Android-markt is het bedrijf nog niet doorgebroken. De komst van Windows 8-tablets eind 2012 leidde nog tot een laatste opleving in de Atom-verkopen.
Al die jaren is de basis van Atom nauwelijks aangepast. Het originele processorontwerp uit 2008, genaamd Bonnell, is door de jaren heen hier en daar bijgeschaafd, maar grote wijzigingen op architectuurniveau vonden niet plaats. Intel werkte vooral aan het kleiner maken van de chip. Ook werd er gesleuteld aan de gpu-kant en het energiegebruik. De oude Bonnell Atom is nu uitontwikkeld en compleet uitgemolken; Intel kan er niks meer uithalen.
Tijd voor een opvolger dus en die komt dit najaar in de vorm van een nieuw processorontwerp dat zal worden ingezet in verschillende system on a chips voor zowel tablets als smartphones. De nieuwe architectuur heet Silvermont en zal begin 2014 in de Merrifield-soc zijn weg naar smartphones vinden. Dit najaar komen de Bay Trail-socs voor tablets en goedkope notebooks al uit.
In dit artikel gaan we dieper in op die Bay Trail-soc en kijken we naar de verschillende soc-varianten, de nieuwe processorarchitectuur, de vernieuwde gpu en de verbeteringen die Intel op het vlak van energiegebruik heeft doorgevoerd.
Zes verschillende Bay Trails
Intel heeft grootse plannen voor Bay Trail. De soc moet niet alleen gebruikt worden in tablets, zowel Windows als Android, maar de chipfabrikant ziet ook mogelijkheden aan de onderkant van de notebookmarkt en zelfs de desktopmarkt. De tabletversies zullen op de markt worden gebracht onder de bekende Atom-merknaam, in de Z3000-serie. Voor notebooks en desktops gebruikt Intel de vertrouwde Pentium- en Celeron-labels.
Van de tabletversie komen er in totaal zes varianten; er zijn versies met twee en met vier cores. De quadcores zullen gebruikt worden voor high-end Windows- of Android-tablets, terwijl de goedkope dualcores waarschijnlijk in budgettablets met Android en kleine beelddiagonalen zullen worden ingezet. Allemaal worden ze gemaakt met Intels tri-gate-procedé op 22nm, dat ook ingezet wordt bij de Haswell-chips voor desktops en notebooks. Dat alleen al is een groot voordeel ten opzichte van de oude Atoms; die werden nog op 32nm gemaakt.
/i/1378110558.jpeg?f=imagenormal)
Intel bouwt de processorkant van Bay Trail op uit modules van twee cpu's, die gezamenlijk de beschikking hebben over 1MB aan l2-cache. Volgens Intel is dit de efficiëntste optie om de cores in te delen, omdat bij multithreaded-berekeningen informatie snel via de l2-cache tussen de twee cores gedeeld kan worden. De quadcore-varianten beschikken over twee van dit soort cpu-modules, terwijl de dualcore-versies er logischerwijs maar eentje hebben. De modules zijn aangesloten op de Silvermont System Agent, een soort north bridge waarop onder andere de geheugencontroller, de gpu, de isp en de videodecoder zijn aangesloten.
/i/1377781313.jpeg?f=imagenormal)
Die-shot van een quadcore-uitvoering
Het krachtigste model is de Z3770, die over vier cores op maximaal 2,4GHz beschikt en een bandbreedte heeft van 17,1GB/s, dankzij de dualchannel-geheugencontroller, die in contact staat met lpddr3-geheugen. Die bandbreedte stelt de soc in staat om schermen met een resolutie tot 2560x1600 pixels aan te sturen. Er kan maximaal 4GB geheugen gebruikt worden, al zal daar effectief iets minder van beschikbaar zijn, omdat de soc aanvankelijk in 32bit-modus zal werken.
| Z3770 | Z3770D | Z3740 | Z3740D | Z3680 | Z3680D |
Aantal cores |
4 |
4 |
4 |
4 |
2 |
2 |
Kloksnelheid |
max 2,4GHz |
max 2,4GHz |
max 1,8GHz |
max 1,8GHz |
max 2GHz |
max 2GHz |
Geheugentype |
lpddr3-1067 |
ddr3l-rs-1333 |
lpddr3-1067 |
ddr3l-rs-1333 |
lpddr3-1067 |
ddr3l-rs-1333 |
Bandbreedte |
17,1GB/s |
10,6GB/s |
17,1GB/s |
10,6GB/s |
8,5GB/s |
10,6GB/s |
Max. geheugen |
4GB |
2GB |
4GB |
2GB |
1GB |
2GB |
Max. resolutie |
2560x1600 |
1920x1200 |
2560x1600 |
1920x1200 |
1280x800 |
1920x1200 |
De soc zelf is overigens 64bit, dus technisch gezien kan meer geheugen aangestuurd worden, maar Windows 8 zou daar momenteel nog niet op voorbereid zijn. Begin 2014 moet dat volgens Intel wel het geval zijn. Dan kunnen in theorie apparaten met een Bay Trail-soc en meer dan 4GB geheugen uitkomen.
Aan de andere kant van het spectrum heeft Intel de Z3680. Deze beschikt over twee kernen, kan overweg met slechts 1GB geheugen en heeft minder geheugenbrandbreedte. Daarom heeft hij als maximale uitvoerresolutie 1280x800 pixels, waardoor deze chip bijvoorbeeld geschikt is om in goedkope 7"-tablets gebruikt te worden.
Een nieuwe gpu
De allereerste Atoms gebruikten een gpu die Intel zelf gemaakt had, maar voor de vorige paar iteraties had Intel een gpu-ontwerp in licentie genomen bij Imagination Technologies. Ook onder andere Samsung en Apple gebruiken deze PowerVR-gpu's. Met de overstap naar Silvermont en Bay Trail is Intel teruggegaan naar een gpu die volledig in house ontwikkeld is. Het gaat om een variant van de HD4000, dezelfde gpu als in Ivy Bridge, maar dan met 4 in plaats van 16 execution units. Dat betekent dat de meeste moderne api's, waaronder DirectX 11 en Open GL ES 3.0 ondersteund worden, en er moderne encoders en decoders voor de meest gangbare videoformaten aanwezig zijn.
De Silvermont-core nader bekeken
Intel heeft zich bij de ontwikkeling van de Silvermont-core naar eigen zeggen primair gericht op het opschroeven van de singlethreaded-prestaties. Hoewel multithreading in sommige situaties flinke snelheidswinst kan opleveren, is het bedrijf van mening dat de meeste gebruiksscenario's bij smartphones en tablets nog steeds zwaar op taken leunen die niet makkelijker via verschillende threads verwerkt kunnen worden.
Tijdens de ontwikkeling van Silvermont heeft Intel daarom besloten de ondersteuning voor hyperthreading te verwijderen. Via hyperthreading konden de oude Atoms in sommige gevallen verschillende threads per processorkern verwerken. Hyperthreading vereist wel extra transistors en dat betekent weer dat de chip groter wordt. Bij Silvermont wilde Intel de ruimte op de die anders inzetten.
/i/1367865284.png?f=imagenormal)
/i/1367865288.png?f=thumb)
De grootste wijziging op architectuurniveau is de omschakeling naar out-of-order instructieverwerking. Dat betekent dat instructies niet altijd in de volgorde verwerkt worden waarin ze binnenkomen. In gevallen waarin twee opvolgende instructies op elkaar moeten wachten, kan de processor onafhankelijke instructies voorrang geven, wat de efficiëntie ten goede komt. De oude Atoms hadden nog een in-order-ontwerp, waardoor de instructies altijd verwerkt werden in de volgorde waarin ze binnenkwamen.
De volgorde van instructieverwerking is niet het enige wat aangepast is in het Silvermont-ontwerp. De verouderde front side bus is eindelijk met pensioen gestuurd en in plaats daarvan communiceren de verschillende componenten van de chip nu via de in die connect, die we al kennen van Intels desktop- en notebookchips. Dit moet de latencies fors verlagen. Verder zijn de branch predictors vergroot, is er meer l2-cache aanwezig en zijn de execution units opnieuw ontworpen. Daarnaast is de chip op instruciesetniveau op gelijke hoogte gebracht met de Westmere-generatie uit 2010. Dat betekent dat Silvermont-chips overweg kunnen met de instructieset-extensies sse 4.1, sse 4.2, popcnt en aes-ni.
/i/1367865285.png?f=imagenormal)
Energiegebruik
Dat Atom tot nu toe niet is doorgebroken heeft weinig te maken met rauwe rekenkracht, dat had de oude versie in vergelijking met de concurrentie namelijk voldoende. Intels achilleshiel was het energiemanagement. Onlangs zagen we dat nog bij de Asus PadFone en de MeMO Pad FHD 10. Beide zijn voorzien van een Atom-, respectievelijk Medfield- en Clover Trail+-platform, en geen van beide scoorde denderend in onze accutests.
Met Bay Trail heeft Intel naar eigen zeggen een heleboel gedaan om het stroomverbruik op orde te krijgen, maar harde cijfers hebben we nog niet. Geen enkele fabrikant van mobiele chips geeft hier overigens gedetailleerde data over, dus in tegenstelling tot bij notebook- en desktopchips weten we niets over de tdp's van de nieuwe Bay Trails. Wel weten we deels wat Intel aangepast heeft om het stroomverbruik binnen de perken te houden.
Allereerst kunnen van bijna alle onderdelen op de soc de spanning en kloksnelheid apart geregeld worden. Bij lage belasting kan bijvoorbeeld slechts één cpu-core actief zijn terwijl de rest slaapt en de kloksnelheid van die enkele core kan variëren, afhankelijk van de belasting. Ditzelfde geldt voor de gpu. Dit is overigens niet nieuw; de concurrentie past vergelijkbare technieken toe.
Interessant is dat Intel werkt met een gedeeld stroombudget. Er is een maximale hoeveelheid stroom die de verschillende soc-onderdelen bij elkaar mogen verbruiken, maar hoe dat onderling verdeeld wordt, is variabel.
De uitgangspositie is dat alles actief is. De vier kernen worden daarbij belast, de gpu is aan het werk, de camera is actief en ook het scherm staat aan. Valt echter een van die variabelen weg, dan dalen de totale energieconsumptie en de totale warmteontwikkeling. Dat schept ruimte om een ander onderdeel wat harder te laten lopen. Zo moet het voor een enkele processorkern mogelijk zijn om tijdelijk boven de bovengrens van 2,4GHz uit te schieten. Tot hoever de kloksnelheid kan gaan, laat Intel niet weten. Dat is ook moeilijk te zeggen, omdat alles afhangt van de totale energieopname en de hitte die daarbij ontwikkeld wordt.
/i/1378118739.jpeg?f=imagenormal)
Een quadcore-Bay Trail in stand-by, in idle, met twee cores actief en als laatste met alle cores actief.
Vergeleken met de concurrentie
Op papier zijn de nieuwe chips, en dan vooral de snelste varianten, geduchte concurrenten voor de topmodellen van chipontwerpers Qualcomm en Nvidia. Er zijn evenveel cores aanwezig als bij de concurrentie, maar Intel klokt ze hoger. Daarnaast kunnen gegevens sneller heen en weer gepompt worden dankzij de grotere geheugenbandbreedte. Daarbij moeten we natuurlijk opmerken dat het enigszins appels met peren vergelijken is; een x86-processorkern levert per kloktik niet dezelfde prestaties als een ARM-kern. In het verleden zagen we overigens al dat Intel hier een voorsprong had en het is aannemelijk dat ze die met Bay Trail zullen behouden.
De prestatiemedaille kent natuurlijk ook een andere zijde: de software. Vooral onder Android hangt veel af van de Dalvik VM, die de Java-code verwerkt waarin apps zijn geschreven. Hoewel Bay Trail er op papier dus meer dan krachtig genoeg uitziet, vallen of staan de prestaties in de praktijk met de mate waarin Intel de optimalisaties aan de softwarekant op orde heeft.
| Intel Atom Z3770 | Qualcomm Snapdragon 800 | Nvidia Tegra 4 |
Core-ontwerp |
Silvermont |
Krait |
Cortex A15 |
Productieprocedé |
22nm |
28nm |
28nm |
Aantal cores |
4 |
4 |
4 |
Kloksnelheid |
max 2,4GHz |
max 2,3GHz |
max 1,9GHz |
Geheugentype |
lpddr3-1067 |
lpddr3-800 |
lpddr3/ddr3l |
Bandbreedte |
17,1GB/s |
12,8GB/s |
14,9GB/s |
Aan de gpu-kant is het nog moeilijker om te zeggen hoe de verschillende socs zich tot elkaar verhouden, want elke fabrikant gebruikt een totaal verschillende achitectuur met variërende kloksnelheden.
Wat zegt Intel?
Intel doet overigens zelf genoeg uitspraken over de relatieve prestaties van de Bay Trail-socs. Het bedrijf heeft becijferd dat de Z3770 maar liefst 60 procent sneller is dan de Snapdragon 800 en 33 procent sneller dan de Tegra 4. Als je de kleine lettertjes leest, blijkt dat het gaat om een benchmark die voor Intel-cpu's geoptimaliseerd is, waarbij de scores van de twee ARM-socs niet gemeten, maar geschat zijn. Ook de andere benchmarkscores die Intel presenteert, nemen we daarom met een flinke korrel zout.
Tot slot
Het is Intel met Silvermont en Bay Trail duidelijk menens en dat is goed te begrijpen. Immers, de pc-markt krimpt en die voor mobiele apparaten laat nog steeds een forse groei zien. Intel wil daarvan meeprofiteren. Op papier zijn de nieuwe Atoms in ieder geval indrukwekkend. Het is interessant om te zien dat Intel zich op singlecore-prestaties heeft gericht en die keuze lijkt een goede. Via multithreading kun je eenvoudig de rekenkracht vergroten, maar gebruikers merken op een tablet of mobieltje waarschijnlijk meer van hoge singlethreaded-prestaties.
Volgens de fabrikant zullen de Bay Trail-socs sneller zijn dan wat de concurrentie te bieden heeft. Dat lijkt gezien de vrijgegeven informatie best waarschijnlijk, al hechten we niet veel waarde aan de benchmarks van Intel. Er wordt overigens vergeleken met de huidige high-end van Qualcomm en Nvidia, terwijl die bedrijven natuurlijk ook nieuwe producten in de pijplijn hebben.
Interessanter dan de prestaties vinden we echter het stroomverbruik, want dat moet Intel goed op orde hebben om echt mee te kunnen komen. Daarover valt nu nog weinig te zeggen, al is wel duidelijk dat Intel grote stappen heeft gezet sinds de vorige Atoms. Daarbij wordt het natuurlijk geholpen door het 22nm-procedé, terwijl de concurrentie nog op 28nm zit. Volgend jaar maakt Intel de stap naar 14nm, terwijl chipbakker TSMC, waarvan Qualcomm en Nvidia gebruikmaken, dan naar 20nm gaat.
De grootste uitdaging zal liggen op de Android-markt, want dat het gros van Windows-tablets Bay Trail zal gebruiken, durven we wel te voorspellen. Op de Android-markt moet Intel ten eerste bedrijven ervan overtuigen dat de overstap naar zijn chip de tijd en moeite waard is. Daarnaast zal Intel ervoor moeten zorgen dat de software naadloos aansluit op zijn nieuwe hardware. Lukt dat, dan zullen bedrijven als Qualcomm en Nvidia een stuk meer van Intel te vrezen hebben dan voorheen.