Inleiding: twee verschillende filosofieën
Vrijwel niemand weet welke processor er in zijn oude Ericsson met het monochrome schermpje zat, of welke chip Nokia voor zijn Nseries gebruikte. Dat is tegenwoordig wel anders: de ingewikkelde typenummers van mobiele processors zijn vervangen door vlot bekkende marketingnamen als Snapdragon, Exynos en Tegra.
De markt voor smartphones en tablets groeit dan ook steeds meer naar die van pc's toe. Net als bij pc's wordt er veel met specificaties geschermd, en net als bij pc's staan de smartphonechip-fabrikanten voor dezelfde keuzes als Intel en AMD een paar jaar geleden. Kloksnelheden kunnen immers niet oneindig verhoogd worden, dus moet er een balans gevonden worden tussen meer megahertzen en een groter aantal cores, en er kan natuurlijk ook geprobeerd worden om het aantal uitgevoerde instructies per kloktik op te schroeven.
Chipfabrikant Nvidia koos met de Tegra 3 voor een quadcore-ontwerp op basis van de al wat oudere Cortex A9-kern. Qualcomm mikt op de vernieuwde architectuur van de Krait-core en bakte daarmee de dualcore Snapdragon S4. Deze beide high-end chips zullen dit jaar hun weg naar talloze smartphones en tablets vinden.
Het system-on-a-chip-landschap wordt al met al steeds onoverzichtelijker - en dat is uiteraard prettig voor de marketingafdelingen, maar niet voor de consument. Tweakers.net wil gewoon weten met welke chip je beter af bent: welke is sneller? Hoe zit met het single- versus multithreaded berekeningen? En zit er verschil in warmteontwikkeling en energieverbruik? We pakten een HTC One S met een S4 en een HTC One X met een Tegra 3, en gingen op zoek naar de antwoorden.

Qualcomms Snapdragon S4-dualcore
Bijna alle smartphones en tablets die je op dit moment kan kopen zijn gebaseerd op de ARM-architectuur van chipontwerper ARM Holdings. Chipfabrikanten kunnen een licentie op een kant-en-klaar processorontwerp afnemen, en daarmee hun 'eigen' chips maken. Dit wordt onder meer gedaan door Samsung, Nvidia, Texas Instruments en Apple, die allemaal chips op basis van het Cortex A9-ontwerp van ARM produceren.
Qualcomm heeft ook een licentie op de ARM-architectuur genomen, maar de chip is geheel in eigen huis ontworpen. Dit bedrijf hoopt op die manier een beter geoptimaliseerde chip te kunnen maken. Bij de vorige generatie socs lukte dat niet helemaal: de Scorpion-processorkern kon zich niet meten met de prestaties per kloktik van het Cortex A9-ontwerp. Volgens de fabrikant zaten de prestaties van de Scorpion ergens tussen die van de Cortex A8 en de A9 in.
ARM heeft inmiddels zijn Cortex A15-ontwerp in de etalage liggen en Samsung, Texas Instruments en Nvidia zijn druk bezig om op basis daarvan nieuwe chips te maken. Qualcomm heeft wederom voor een eigen architectuur gekozen, die 'Krait' is gedoopt. In tegenstelling tot de Scorpion moet de Krait zich wel kunnen meten met het beste wat ARM te bieden heeft. Daarnaast wordt de chip met 28nm-procestechnologie gemaakt; daardoor zouden Krait-chips zuiniger zijn en minder warmte produceren.
Qualcomm beweert dat zijn concurrenten grote problemen hebben om het A15-ontwerp in quadcore-chips te verwerken, omdat de A15 simpelweg te warm wordt. De Krait zou hier geen last van hebben en voor het eind van dit jaar staat dan ook al een quadcore-versie op de planning. Samsung heeft overigens wel degelijk al een Exynos-quadcore op basis van de A15 aangekondigd en gedemonstreerd. De hardware die voor de demonstratie werd gebruikt, was echter verre van compact.
Krait nader bekeken
De eerste op Krait-gebaseerde soc waarmee Qualcomm naar buiten komt is de MSM8260A, ook wel bekend als S4. Deze soc bevat twee op 1,5GHz geklokte Krait-processorkernen en een Adreno 225-gpu. Ook heeft Qualcomm bijna alle technologie voor draadloze communicatie in de soc ondergebracht; 3g, gps, glonass, wifi, bluetooth en fm-radio. Er is ook een variant met ingebouwd lte-modem beschikbaar, de MSS8960. Het geheel wordt door TSMC met 28nm-technologie gebakken.
Ten opzichte van de vorige generatie Snapdragon-socs heeft Qualcomm een aantal radicale veranderingen doorgevoerd. Krait heeft een diepere pipeline, verbeterde floating-point-prestaties en volledige out-of-order-execution, en kan meer instructies per clock cycle decoderen. Daarnaast heeft de nieuwe geheugencontroller, die overweg kan met lpddr2 en ddr3, twee kanalen. Al deze wijzigingen zouden ervoor zorgen dat de Krait per kloktik zestig procent beter presteert dan de oude Scorpion-core.
Ook op het gebied van power gating is Krait een verbetering. Van bijna alle onderdelen op de soc kan de stroomtoevoer apart geregeld worden. Qualcomm zegt dat de individuele cores zo goed teruggeklokt kunnen worden, dat het ontwerp geen 'kleine' of 'companion' cores nodig heeft - en dat is uiteraard een sneer naar Nividia en het ontwerp van de Tegra 3.
De Adreno 225-gpu is een doorontwikkeling van eerdere gpu's in de 2xx-serie; aan de architectuur heeft Qualcomm niet gemorreld. Wel is het aantal shadercores verdubbeld en de kloksnelheid is verhoogd van 266MHz naar 400MHz. Dit moet er volgens de fabrikant voor zorgen dat de Adreno 225 vijftig procent sneller is dan de 220. Het lijkt er echter niet op dat Qualcomm overtuigd is van de kwaliteiten van de 225, want later dit jaar komt er al een Pro-editie van de MSM8260A uit, die een veel snellere Adreno 320-gpu aan boord zal hebben.
Nvidia's Tegra 3-quadcore
Een paar jaar geleden hield Nvidia zich nog uitsluitend bezig met videokaarten. In 2008 kondigde het bedrijf echter zijn eerste ARM-chip voor mobiele apparaten aan: de Tegra APX 2500. De eerste afnemer was Microsoft, dat de chip in zijn Zune HD-mediaspeler en later in de geflopte Kin-telefoons verwerkte.
De Tegra 2 bleek veel succesvoller. Dit was de eerste dualcore-soc die op het Cortex A9-ontwerp was gebaseerd, en nagenoeg alle fabrikanten die in de eerste helft van 2011 een Android-tablet uitbrachten, gebruikten deze chip. Daarnaast verscheen ook nog een handvol smartphones met de Tegra 2.
Terwijl die chips nog van de band rolden, was Nvidia alweer druk bezig met de opvolger, de Tegra 3-quadcore. In het najaar van 2011 kwam het eerste apparaat met de nieuwe chip uit: Asus' Transformer Prime. Het was Nvidia dus wederom gelukt om de eerste te zijn - quadcores van andere fabrikanten laten nog altijd op zich wachten.
Tegra 3 nader bekeken
Hoewel Tegra 3 in de praktijk een quadcore-soc genoemd wordt, zijn er feitelijk vijf processorkernen aanwezig. Naast de vier reguliere Cortex A9-kernen heeft Nvidia een vijfde core met een maximale kloksnelheid van 500MHz toegevoegd. Deze companion core wordt met een zuiniger type transistors gefabriceerd en verbruikt daardoor minder stroom dan de vier reguliere kernen. Bij taken die weinig rekenkracht vereisen, zoals het beluisteren van muziek en of het bekijken van video, is alleen deze vijfde core actief. Zo wil Nvidia het energieverbruik van de Tegra 3 binnen de perken houden.

Eén van de redenen dat Nvidia binnen relatief korte tijd een quadcore uit de grond kon stampen, is dat het Cortex A9-ontwerp opnieuw gebruikt is. De Cortex A9-kernen zijn echter niet identiek aan die van de Tegra 2: Nvidia heeft ondersteuning voor de NEON-instructieset toegevoegd, die toegespitst is op het verwerken van audio en video. Het decoderen van hd-video was de achilleshiel van Tegra 2; de chip kon streams met hoge bitrates simpelweg niet aan.
Aangezien het ontwerp van de processorkern nauwelijks gewijzigd is, moest de kloksnelheid worden opgevoerd - anders zou er alleen prestatiewinst zijn bij applicaties die alle vier de cores belasten. Bij de Tegra 3 kan een enkele kern maximaal op 1,5GHz draaien, maar in de praktijk zullen de kernen vaker op 1,4GHz draaien: dat is de maximale snelheid als ze alle vier de cores belast worden. De twee cores van de Tegra 2 hebben een topsnelheid van 1GHz.
Nvidia heeft ook de prestaties van de gpu verbeterd. De nieuwe mobiele GeForce-hardware beschikt over acht pixelshaders en vier vertexshaders. Van 'unified shaders', zoals gebruikelijk bij moderne videokaarten, is geen sprake. De gpu is volgens Nvidia drie keer krachtiger dan die in de Tegra 2, mede dankzij een hogere kloksnelheid.
Alle componenten zijn nog steeds via een single channel 32bits-geheugenbus met het werkgeheugen verbonden. Nvidia heeft wel ondersteuning voor sneller geheugen toegevoegd; lpddr2-ram kan op 1066MHz draaien, waar de Tegra 2 een plafond van 733MHz heeft. Ook is er nu ondersteuning voor low-voltage ddr3l-geheugen met een maximale klokfrequentie van 1,5GHz.
Benchmarks: twee of vier cores
Voor we overgaan tot het bespreken van de benchmarkresultaten zetten we nog een keer de belangrijkste specificaties van de twee chips op een rijtje.
Chip | Cores | Ontwerp | Snelheid | Geheugenbus | GPU | Procedé |
Snapdragon S4 |
2 |
Krait |
1,5GHz |
32bit, dual |
Adreno 225 |
28nm |
Tegra 3 |
4 |
Cortex A9 |
1,5GHz |
32bit, single |
Geforce ULP |
40nm |
Als er maximaal twee cores belast worden, zou de S4 in theorie een stuk sneller moeten zijn dan de Tegra 3. De prestaties per kloktik zijn beter en er is meer geheugenbandbreedte. Interessanter wordt het als de vier cores van de Tegra 3 allemaal aan het werk worden gezet. In hoeverre kan de dualcore S4 zijn concurrent dan nog bijbenen?
De testtoestellen zijn de HTC One X met een Tegra 3, en een HTC One S met de Snapdragon S4. Ter vergelijking vermelden we ook toestellen met andere socs. De Galaxy S II heeft een Exynos 4210, de op dit moment snelste dualcore. De Galaxy Nexus heeft de snelste chip van Texas Instruments aan boord en de Xperia S is voorzien van de Snapdragon S3, de voorganger van Qualcomms Krait-dualcore.
De processors
CaffeineMark maakt al tijden onderdeel uit van onze benchmarksuite omdat het draaien van Java-code een grote rol speelt - dat is belangrijk voor de snelheid van Android - en omdat de test volledig singlethreaded is. Zowel de S4 als de Tegra 3 draaien hier op 1,5GHz, maar de S4 is - zoals verwacht - flink sneller; het verschil bedraagt bijna een kwart. De S4 is bij dezelfde kloksnelheid zelfs bijna 74 procent sneller dan de MSM8260, een Qualcomm-dualcore die een generatie ouder is.
AnTuTu meet de prestaties van verschillende onderdelen van een smartphone, zoals de processor en het geheugen. De totaalscore moet daarmee een beeld geven van de algehele prestaties van een toestel. De One X verslaat de One S hier overtuigend omdat AnTuTu de vier processorkernen van de Tegra 3 goed weet te benutten.
We gebruiken Mandro al een tijdje niet meer voor onze reguliere reviews, onder andere omdat de test maximaal twee cores gebruikt. In dit geval is dat echter geen probleem, integendeel: zo kunnen we goed zien hoe goed twee Krait-cores het doen ten opzichte van twee A9-cores.
Van het beeld dat we bij Caffeinemark zagen, blijft niks over. Beide chips gebruiken in deze test evenveel cores met dezelfde kloksnelheid, en de S4 wint - maar het verschil bedraagt minder dan tien procent. De S4 zou een veel grotere voorsprong moeten nemen; het is ons onduidelijk waarom dat niet gebeurt.
De browser is een van de belangrijkste apps op een smartphone, niet alleen omdat mensen veel surfen, maar ook omdat veel apps tegenwoordig deels in html5 zijn geschreven. Onder andere Facebook en Twitter gebruiken de browserengine om delen van hun apps weer te geven.
BrowserMark test hoe snel de browser werkt en de Tegra 3 en S4 blijken nu nog meer aan elkaar gewaagd; het verschil is nog geen twee procent. De winst die Nvidia met zijn extra cores boekt, lijkt hier dus net op te wegen tegen de winst die Qualcomm door met zijn snellere ontwerp heeft.
Java-prestaties
Omdat de S4 in Caffeinemark zoveel beter scoort dan de Tegra 3, zijn we iets dieper in de Java-prestaties gedoken. De benchmark CFBench meet de prestaties van een toestel bij het draaien van native code, en voert dezelfde berekeningen dan nog eens uit met de Dalvik VM. Op die manier kunnen we zien hoe goed hoeveel van de theoretische kracht van een toestel overblijft bij het draaien van Android-apps, die immers grotendeels in Java geschreven zijn.
| HTC One S (S4) | HTC One X (Tegra 3) |
Efficiency MIPS |
62% |
21% |
Efficiency MSFLOPS |
99% |
45% |
Efficiency MDFLOPS |
99% |
56% |
Efficiency Memory Read |
19% |
11% |
Efficiency Memory Write |
87% |
99% |
De afname in prestaties bij het draaien van Java-code is bij de S4 vele malen kleiner dan bij de Tegra 3. Enkel bij het schrijven naar het geheugen weet de Tegra 3 de S4 te verslaan. In de praktijk leken veel applicaties op de HTC One S ook net even wat vlotter te draaien.
De Linpack-benchmarks lijken bovenstaande resultaten te onderschrijven. De makers van deze benchmark geven zelf aan dat de resultaten sterk afhankelijk zijn van de Dalvik VM.
Linpack - singlethreaded |
Telefoon / Tablet | SoC | GHz | Mflops, hoger is beter |
HTC One S |
MSM8260A |
1,5 GHz |
*********
102,60 |
Sony Xperia S |
MSM8260 |
1,5 GHz |
****
53,33 |
HTC One X |
Tegra 3 |
1,5 GHz |
****
52,57 |
Galaxy Nexus |
Omap4460 |
1,2 GHz |
****
43,17 |
Samsung Galaxy S II |
Exynos 4210 |
1,2 GHz |
***
41,71 |
Linpack - multithreaded |
Telefoon / Tablet | SoC | GHz | Mflops, hoger is beter |
HTC One S |
MSM8260A |
1,5 GHz |
*********
193,62 |
HTC One X |
Tegra 3 |
1,5 GHz |
******
139,67 |
Sony Xperia S |
MSM8260 |
1,5 GHz |
****
81,09 |
Galaxy Nexus |
Omap4460 |
1,2 GHz |
***
71,96 |
Samsung Galaxy S II |
Exynos 4210 |
1,2 GHz |
***
67,15 |
In de singlethreaded-test maakt de S4 gehakt van de Tegra 3. In de multithreaded-test is het verschil kleiner omdat de Tegra 3 twee extra processorkernen heeft, maar toch wint de S4 nog met veel gemak.
De grafische processor
GL Benchmark 2.1.2 - Egypt offscreen |
Telefoon / Tablet | SoC | GHz | Framerate in fps, hoger is beter |
HTC One X |
Tegra 3 |
1,5 GHz |
*********
64,0 |
HTC One S |
MSM8260A |
1,5 GHz |
********
57,0 |
Samsung Galaxy S II |
Exynos 4210 |
1,2 GHz |
*******
53,0 |
Sony Xperia S |
MSM8260 |
1,5 GHz |
*****
35,0 |
Galaxy Nexus |
Omap4460 |
1,2 GHz |
****
29,0 |
We gebruiken GL Benchmark om de grafische prestaties van de twee socs te meten. Omdat de One S en One X niet dezelfde schermresolutie hebben, draaien we de test op een vaste resolutie van 1280x720 pixels.
In het Egypt-onderdeel, de meest complexe test van de benchmark, komt de GeForce ULP van de Tegra 3 als beste uit de bus. De Adreno 225 is niet veel beter dan de Mali 400 van Samsungs Exynos 4210.
GL Benchmark 2.1.2 - PRO offscreen |
Telefoon / Tablet | SoC | GHz | Framerate in fps, hoger is beter |
HTC One S |
MSM8260A |
1,5 GHz |
*********
98,0 |
HTC One X |
Tegra 3 |
1,5 GHz |
********
92,0 |
Samsung Galaxy S II |
Exynos 4210 |
1,2 GHz |
*******
84,0 |
Sony Xperia S |
MSM8260 |
1,5 GHz |
*****
52,0 |
Galaxy Nexus |
Omap4460 |
1,2 GHz |
****
49,0 |
Het Pro-onderdeel is minder veeleisend en dat zien we ook terug in de framerates. De rollen zijn nu omgedraaid, al is het verschil wel kleiner dan bij de vorige test.
Later dit jaar kunnen we de eerste tablets met een resolutie van 1920x1200 pixels verwachten, en veel daarvan zullen een van deze twee socs aan boord hebben. Daarom hebben we GL Benchmark ook op deze resolutie gedraaid.
Gl Benchmark - Egypt 1200p |
Telefoon / Tablet | SoC | GHz | Framerate in fps, hoger is beter |
HTC One X |
Tegra 3 |
1,5 GHz |
*********
28,0 |
HTC One S |
MSM8260A |
1,5 GHz |
********
26,0 |
Samsung Galaxy S II |
Exynos 4210 |
1,2 GHz |
*******
23,0 |
Sony Xperia S |
MSM8260 |
1,5 GHz |
*****
16,0 |
Galaxy Nexus |
Omap4460 |
1,2 GHz |
****
13,0 |
Gl Benchmark - PRO 1200p |
Telefoon / Tablet | SoC | GHz | Framerate in fps, hoger is beter |
HTC One S |
MSM8260A |
1,5 GHz |
*********
47,0 |
Samsung Galaxy S II |
Exynos 4210 |
1,2 GHz |
*********
47,0 |
HTC One X |
Tegra 3 |
1,5 GHz |
********
46,0 |
Galaxy Nexus |
Omap4460 |
1,2 GHz |
*****
26,0 |
Sony Xperia S |
MSM8260 |
1,5 GHz |
*****
25,0 |
Op deze hogere resolutie zijn beide socs goeddeels aan elkaar gewaagd, de framerates zijn echter flink lager dan bij de 720p-test. Opvallend is dat de Galaxy S II met zijn Mali 400-gpu zich in de Pro-test tussen de One S en One X weet te wurmen.
Warmteontwikkeling en stroomgebruik
Qualcomm claimt dat de S4 door het 28nm-procedé zuiniger is en koeler blijft dan andere dualcores. Vergeleken met de Tegra 3 zou het verschil dus nog groter moeten zijn, omdat die over vier van zulke cores beschikt, die ook nog eens op een hoge kloksnelheid draaien. We hebben de HTC One S en de One X naast elkaar gelegd en warmtebeelden gemaakt terwijl de toestellen idle waren, en terwijl ze een 3d-game draaiden.

Als de telefoons niks te doen hebben, warmen beide chips nauwelijks op. De Tegra 3 spreekt zijn companion core aan en de S4 klokt zichzelf maximaal terug. Het verschil tussen beide toestellen bedraagt slechts 0,6 graden.

Als we de chips met de 3d-game ShadowGun belasten, verandert het beeld behoorlijk. Beide chips worden warmer, maar de mate waarin ze dat doen verschilt aanzienlijk: de temperatuur van de Tegra 3 stijgt met 8,9 graden, terwijl de S4 slechts 2,6 graden warmer wordt. Qualcomms bewering over de lage warmteproductie van de S4 lijkt geen grootspraak.
Stroomverbruik
Nvidia zegt dat de Tegra 3 vanwege de agressieve power gating en de companion core nooit lang op volle kracht zal draaien, zodat het stroomverbruik binnen de perken blijft. Qualcomm beweert dat zijn ontwerp zo energiezuinig is, dat een companion core niet nodig is. Dat vraagt natuurlijk om een test, maar dat is minder makkelijk dan het klinkt.
Het is niet mogelijk om hardware- of softwarematig het opgenomen vermogen van de soc uit te lezen. De enige mogelijkheid is om beide toestellen te belasten en de afname van het accupercentage bij te houden. Daarbij moeten de toestellen in de vliegtuigmodus worden gezet, met het scherm uit, zodat naast de soc zo weinig mogelijk andere componenten energie verbruiken. Het probleem daarbij is dat de meeste benchmarks het scherm ingeschakeld houden en stoppen zodra je op de aan-uitknop drukt.
De browser blijft echter doorwerken als het scherm zichzelf uitschakelt. We hebben daarom geprobeerd om onze browsertest te draaien - waar we normaal ook de accu mee testen - maar dan terwijl het scherm was uitgeschakeld. Na ongeveer 16 uur benchmarken bleek het accupercentage van de One S met 13 procent te zijn gedaald, maar bij de One X was het accuniveau echter maar met 2 procent teruggelopen. We vermoeden dat de test op de One X niet continu heeft gedraaid, en bij een tweede poging kregen we wederom rare resultaten te zien. Deze test gaf dus geen bruikbare resultaten.
We hebben natuurlijk ook onze reguliere accutests gedraaid: één waarbij continu gebrowsed werd, maar dan met scherm aan, en één waarbij continu video werd afgespeeld. In die twee tests won de One S het van de One X, maar er zijn te veel variabelen in het spel - voornamelijk het stroomverbruik van het beeldscherm - om die winst aan de Qualcomm S4-soc toe te schrijven.
Conclusie: goed en ook goed
Het is opvallend om te zien dat de prestaties van twee chips met verschillende architecturen, een verschillend aantal cores en verschillende gpu's elkaar in de praktijk zo weinig ontlopen. Het is daarom ook niet raar dat HTC in Amerika de lte-versie van de One X heeft uitgerust met de S4 in plaats van de Tegra 3.
De grote troefkaart van de S4 blijkt het werken met Java-code. Bij Caffeinemark, CFBench en Linpack weet Qualcomms nieuwste chip de Tegra 3 heel ver achter zich te laten. In Linpack weet de S4 zelfs de multicoretests te winnen, ook al heeft de Tegra 3 meer cores. Voor Android-apparaten, waarvoor het gros van de apps in Java wordt geschreven, heeft de S4 dus een flinke streep voor.
Bij het draaien van native code is de situatie anders. In situaties waar de vier cores allemaal belast worden, heeft de Tegra 3 duidelijk de overhand. Dat is bijvoorbeeld goed te zien in de AnTuTu-benchmark. Het is wel de vraag hoe vaak dat bij normaal gebruik zal voorkomen. Een benchmark als BrowserMark laat geen duidelijke winnaar zien.
Het 28nm-procedé blijkt een groot voordeel op het vlak van warmteproductie. In de One S blijft de S4 erg koel - dat betekent ook dat er nog speelruimte is om de kloksnelheid in de toekomst verder op te hogen. De gpu's lijken weer niet veel voor elkaar onder te doen.
Als we alleen naar de architectuur kijken, zouden we de S4 de betere chip noemen. Met zijn snelle verwerking van Java-code is hij bij uitstek geschikt voor Android en de geringe warmteontwikkeling biedt mogelijkheden voor het opschroeven van de kloksnelheid en het uitbreiden van het aantal cores. Nvidia zit echter niet stil en werkt momenteel aan een Cortex A15-quadcore, met companion core, en dat zou zelfs voor een Krait-quadcore nog wel eens flinke kluif kunnen zijn.
Dat is echter nog toekomstmuziek; we hebben nu te maken met de S4 en Tegra 3. En als we die vergelijken, zouden we S4 als winnaar aanwijzen - maar tegelijkertijd moeten we constateren dat beide chips zo goed presteren, dat we de keuze van een smartphone of tablet er niet van zouden laten afhangen.