Inleiding: vier generaties apu's
AMD heeft zijn aandacht in de laatste jaren vooral gericht op de ontwikkeling van zijn accellerated processing units, kortweg apu's. Apu's zijn processors met niet alleen cpu-cores aan boord, maar waarin de cpu-cores worden gecombineerd met gpu-cores. Zo kunnen de cpu- en gpu-cores ieder die rekentaken uitvoeren waarvoor ze het geschiktst zijn, respectievelijk seriële en parallelle taken. Bovendien kan een losse videokaart in veel gevallen achterwege blijven; de gpu is immers ingebakken.
De eerste apu's die het bedrijf uitbracht, waren de processors met codenaam Llano, die in 2011 verschenen. Daarna volgden de Trinity-apu's in 2012 en de derde generatie werd gevormd door de Richland-apu's. Inmiddels is AMD aan zijn vierde apu-generatie toe en het bedrijf heeft deze de codenaam Kaveri gegeven.

Grote verschillen tussen Kaveri en de voorgaande generatie apu's zijn in alle onderdelen terug te vinden. Zo zijn de processorcores vernieuwd, werden de gpu-cores voorzien van zogeheten graphics core next-technologie en werd AMD's 'heterogeneous computing technology' voor het eerst volledig geïmplementeerd.
In deze review van de Kaveri-apu's hebben we de prestaties van de AMD 7850K in een aantal benchmarks vergeleken met die van zijn voorganger, de Richland 6800K-apu. Daarnaast bekijken we de A8-7600, een Kaveri-apu die in de loop van dit kwartaal met een instelbare tdp geleverd wordt.
Voor deze review gaat onze dank uit naar webshop Alternate, die ons het reviewexemplaar van de A10-7850K ter beschikking heeft gesteld.
Heterogeneous computing in het kort
Met zijn apu's heeft AMD een specifiek doel voor ogen: de dominantie van de cpu-cores in processors verminderen om zo een snellere, efficiëntere en zuinigere processor te maken. De gpu moet in dat ontwerpstramien een grotere rol krijgen en gelijkwaardig aan de cpu worden. De cpu voert vooral seriële werklasten uit, terwijl de gpu-cores parallel werk uitvoeren. Dat moet worden geïmplementeerd met een drie-eenheid van technieken: hsa, huma en hq.
/i/1388749180.png?f=imagenormal)
Achtereenvolgens betekent dat heterogeneous system architecture, heterogeneous unified memory architecture en heterogeneous queuing. In het kort houdt het in dat cpu en gpu op gelijke voet staan met elkaar en het geheugen gelijkwaardig kunnen benaderen. Tot Kaveri was het altijd de cpu die dominant was en de werklasten verdeelde; met de hq-implementatie in Kaveri is dat niet langer het geval.
Op hardwaregebied is in de vier generaties apu's eveneens het een en ander veranderd. In de Llano-generatie werden K10-cores gecombineerd met Radeon HD 6000-cores. Voor de Trinity-generatie werden krachtigere Piledriver-cores gecombineerd met Radeon HD 7000-cores en in de Richland-apu werden enhanced Piledriver-cores gecombineerd met overwegend Radeon HD 8000-gpu-cores. Bovendien wordt Kaveri op het nieuwere 28nm shp-procedé gemaakt, wat iets zuinigere producten moet opleveren.
Generatie | Cpu-cores | Gpu-cores | Technologie | Procedé | Socket |
Llano |
K10 |
HD 6000 (vliw5) |
- |
32nm |
FM1 |
Trinity |
Piledriver |
HD 7000 (vliw4) |
hsa mmu |
32nm |
FM2 |
Richland |
Enhanced Piledriver |
HD 7/8000 (vliw4) |
hsa mmu |
32nm |
FM2 |
Kaver |
Steamroller |
GCN |
hsa, huma, hq |
28nm |
FM2+ |
Kaveri: de hardware
Kaveri wordt, net als de voorgaande generaties apu's uit AMD's stal, ontworpen met een evenwichtige verdeling tussen cpu- en gpu-rekenkracht als uitgangspunt. Een aanzienlijk deel van de die wordt daarbij gereserveerd voor de gpu. Bij Kaveri is dat 47 procent van de beschikbare oppervlakte.
AMD spreekt vanaf Kaveri niet langer van cpu-cores en de gpu, maar het bedrijf prijst zijn processors aan met het aantal 'compute cores' waarover deze beschikken. Dat wordt mogelijk gemaakt doordat de gpu is opgebouwd uit graphics core next-cores. Die gcn-cores, of 'compute units' zoals AMD ze noemt, bestaan uit eenheden met onder meer caches, registers, texture en scalar units, en de bekende vector units ofwel simd's. Van die laatste heeft elke compute unit er 64 stuks aan boord, gerangschikt in vier sets van zestien. Per Kaveri-apu zijn maximaal acht gpu-cores, dus 512 streamprocessors aanwezig.
/i/1389882052.png?f=imagenormal)
De overige compute cores worden gevormd door de cpu-cores, die per twee in modules worden ingezet. De cpu-cores bestaan uit Steamroller-modules, een verdere ontwikkeling van de Piledriver-architectuur. De Steamroller-architectuur maakt gebruik van modules, waarin twee integer-cores en een gedeelde floating point-core zijn ondergebracht. Vergeleken met de Piledriver-modules bieden de Steamroller-modules een gemiddelde verbetering in prestaties van ongeveer tien procent, met pieken tot twintig procent. Dat is voornamelijk te danken aan een beter cachegebruik, betere branche prediction en effectievere scheduling. Samen levert dat een ipc-winst van maximaal twintig procent op.
De Piledriver-modules communiceren via een geheugencontroller met ddr3-geheugen van maximaal 2133MHz, hoewel overklokken van de bus mogelijk is. AMD heeft zich veel moeite getroost ook de gpu-cores direct met het geheugen te laten communiceren, waarbij dezelfde fysieke en virtuele geheugenadressen zichtbaar zijn als waarvan de cpu-cores gebruikmaken. Op deze hsa-implementatie gaan we op de volgende pagina verder in.
Het principe achter hsa
Met de vierde generatie apu's heeft AMD zijn hsa-implementatie bijna gereed. Waar de eerste Llano-apu's nog gescheiden geheugenpartities voor de cpu en gpu hadden, kregen de tweede generatie Trinity en derde generatie Richland toegang tot het hele geheugen. Bovendien werd het energiebeheer van gpu en cpu gekoppeld, en werd het programmeren voor gedeelde werklasten makkelijker gemaakt.
/i/1389968613.png?f=imagenormal)
Met Kaveri is het volledige geheugen eveneens voor zowel cpu- als gpu-cores beschikbaar, met het belangrijke onderscheid dat steeds alle data voor beide typen cores beschikbaar is. Informatie van de cpu is dus direct voor de gpu beschikbaar en vice versa. AMD noemt deze unified address space-techniek, samen met gedeeld cache- en virtueel geheugen: huma, een afkorting voor heterogeneous unified memory architecture.
/i/1389968646.png?f=imagenormal)
Nu het geheugen en de data daarin voor zowel cpu als gpu toegankelijk zijn, heeft AMD er ook voor gezorgd dat de werklasten van het systeem beter verdeeld kunnen worden. Voorheen was de cpu 'de baas' en werden gpu-loads via software of driver door de cpu verdeeld. Met AMD's hq, onderdeel van hsa, kan software direct berekeningen door de cpu of de gpu laten uitvoeren. Dat vergt wel de juiste argumenten in de software, waardoor een efficiënte implementatie afhankelijk is van programmeurs.
/i/1389969747.png?f=imagenormal)
Naast de hsa-implementatie met huma en hq heeft Kaveri ook een aantal features gekregen die de apu's, of socs zoals AMD ze ook wel noemt, sneller en zuiniger maken. Zo kreeg Kaveri, net als de nieuwe Hawaii-videokaarten, TrueAudio-technologie aan boord voor betere geluidsweergave, werd de Video Coding Engine geüpdated naar versie 2 en de Unified Video Decoder naar versie 4, waarmee betere h264-ondersteuning en snellere codering en decodering mogelijk zijn.
/i/1389969776.png?f=imagenormal)
Op energieniveau is Kaveri verbeterd met niet alleen een kleiner en daarmee samenhangend zuiniger procedé van 32nm naar 28nm, het energiebeheer is dynamisch en kan de soc in S3-stand op 25mW schakelen. De apu's zijn op termijn verkrijgbaar met deels instelbare tdp's van 95W voor desktops via 35W voor laptops tot 15W voor serverchips.
In de toekomst moet Kaveri nog een update krijgen voor Mantle-ondersteuning. Vooral games zouden met dat DirectX-alternatief dankzij lagere overhead een stuk sneller moeten draaien. De opvolgers, Carizzo geheten, moeten vooral de gpu nog sneller maken, met onder andere preemptive multitasking.
Testsystemen en cpu's
De theorie achter hsa en de Kaveri-processor is interessant, maar we zijn natuurlijk ook benieuwd hoe die nieuwe ontwikkelingen zich vertalen in benchmarkresultaten. We tuigden daarom drie testsystemen op, waaronder een nieuw AMD-systeem.
Al ruim een halfjaar voor de komst van de Kaveri-apu bracht AMD de A88X-chipset uit, die ondersteuning biedt voor de nieuwe processors. Daarnaast biedt de nieuwe chipset ondersteuning voor pci-express 3.0, mits er een Kaveri-apu aanwezig is. Richland- en Trinity-apu's werken wel, maar kunnen op hetzelfde moederbord in niet meer dan pci-express 2.0 voorzien. Tijd voor een update van ons testsysteem dus. We wisselden ons Asus F2A85-M PRO-moederbord in voor Gigabytes G1.Sniper A88X.
Testsysteem | AMD A88X |
Processor |
AMD A10-7850K AMD A8-7600 (es) AMD A10-6800K AMD A10-6700 AMD A8-6500T AMD A10-5800K |
Moederbord |
Gigabyte G1.Sniper A88X |
Geheugen |
2x4GB Corsair Vengeance LP ddr3-1600MHz 2x4GB Corsair Vengeance ddr3-2133MHz |
Opslag |
Samsung 830 128GB |
Voeding |
Corsair HX850W |
De overige hardware in het oude FM2-systeem was ook aan een update toe. De 80GB grote Intel Postville-ssd is vervangen door de grotere en snellere Samsung 830 van 128GB. Het werkgeheugen is vergroot van 4GB naar 8GB en tikt nu op een ddr3-snelheid van 1600MHz. Voor enkele tests gebruiken we AMD-geheugen op 2133MHz.
Om een zo compleet mogelijk beeld te geven van de prestaties van de Kaveri-processors, nemen we zes AMD-apu's mee in de vergelijking. De 7850K en 7600 zijn Kaveri-chips, daarbij kan door middel van een bios-instelling de A8-7600 voldoen aan zowel een tdp van 45 watt als een van 65 watt. De processor presteert bij die laatste instelling uiteraard beter. Van de voorgaande Richland-generatie nemen we het topmodel, de 6800K met 100 watt tdp mee. Daarnaast hebben we gebruikgemaakt van de A10-6700, met 65 watt tdp en de extra zuinige A8-6500T met een tdp van 45 watt. Tot slot prikten we het topmodel van de eerste generatie apu's met FM2-voetje, de A10-5800K, in het nieuwe testsysteem.
Testsysteem | Intel Z87 / Z77 |
Processor |
Core i5-3470 Core i5-4570S Core i5-4670K |
Moederbord |
Asus Maximus VI Hero / MSI Z77A-GD65 |
Geheugen |
2x4GB Corsair Vengeance LP ddr3-1600MHz |
Opslag |
Samsung 830 128GB |
Voeding |
Corsair HX850W |
Tegenover het FM2+-systeem zetten we het Intel-testsysteem voor Haswell-processors en het Ivy Bridge-testsysteem met Z77-chipset. Op het moederbord en de processor na hielden we de hardware gelijk met die van het AMD-testsysteem. Ter vergelijking nemen we onder andere de Core i5-4670K mee. AMD demonstreerde op zijn eigen persconferentie dat de A10-7850K zich in verschillende benchmarks kan meten met de prestaties van de i5-4670K. Om een goed beeld te geven van de onderlinge prestaties hebben we ook de Core i5-4570S gebruikt, met een tdp van 65 watt en de Core i5-3470 van de Ivy Bridge-generatie.
AMD
Cpu | A10-7850K | A10-6800K | A10-5800K |
Codenaam |
Kaveri |
Richland |
Trinity |
Architectuur |
Steamroller |
Piledriver |
Piledriver |
Aantal cpu-cores |
4 |
4 |
4 |
Klokfrequentie/Turbo |
3,7/4,0GHz |
4,1/4,4GHz |
3,8/4,2GHz |
L2 cache |
4MB |
4MB |
4MB |
Geheugencontroller |
ddr3-2133 |
ddr3-2133 |
ddr3-1866 |
Gpu |
R7 |
HD 8670D |
HD 7660D |
Streamprocessors |
512 |
384 |
384 |
Gpu-frequentie |
720MHz |
844MHz |
800MHz |
Overig |
Mantle TrueAudio pci-e 3.0 |
pci-e 2.0 |
pci-e 2.0 |
Procédé |
28nm |
32nm |
32nm |
Tdp |
95W |
100W |
100W |
Socket |
FM2+ |
FM2 |
FM2 |
Cpu | A8-7600 (65/45W) | A10-6700 | A8-6500T |
Codenaam |
Kaveri |
Richland |
Richland |
Architectuur |
Steamroller |
Piledriver |
Piledriver |
Aantal cpu-cores |
4 |
4 |
4 |
Klokfrequentie/Turbo |
3,3/3,8GHz 3,1/3,3GHz |
3,7/4,3GHz |
2,1/3,1GHz |
L2 cache |
4MB |
4MB |
4MB |
Geheugencontroller |
ddr3-2133 |
ddr3-1866 |
ddr3-1866 |
Gpu |
R7 |
HD 8670D |
HD 8550D |
Streamprocessors |
384 |
384 |
256 |
Gpu-frequentie |
720MHz |
844MHz |
720MHz |
Overig |
Mantle TrueAudio pci-e 3.0 |
pci-e 2.0 |
pci-e 2.0 |
Procédé |
28nm |
32nm |
32nm |
Tdp |
65/45W |
65W |
45W |
Socket |
FM2+ |
FM2 |
FM2 |
Intel
Cpu | Core i5-4670K | Core i5-4570S | Core i5-3470 |
Codenaam |
Haswell |
Haswell |
Ivy Bridge |
Aantal cpu-cores/threads |
4/4 |
4/4 |
4/4 |
Klokfrequentie/Turbo |
3,4/3,8GHz |
2,9/3,6GHz |
3,2/3,6GHz |
Cache |
6MB |
6MB |
6MB |
Geheugencontroller |
ddr3-1600 |
ddr3-1600 |
ddr3-1600 |
Gpu |
HD 4600 |
HD 4600 |
HD 2500 |
Gpu-frequentie (max.) |
1,2GHz |
1,15GHz |
1,1GHz |
Pci-express |
3.0 |
3.0 |
3.0 |
Procédé |
22nm |
22nm |
22nm |
Tdp |
84W |
65W |
77W |
Socket |
1150 |
1150 |
1155 |
Benchmarks: Cinebench en PCMark
AMD legt met hsa de nadruk op het samenwerken van gpu en cpu, maar levert dat in de praktijk veel op? We draaiden verschillende benchmarks, waarbij in sommige tests de gpu zijn steentje kon bijdragen, terwijl in andere gevallen de nadruk op de cpu-kracht lag.
Cinebench 11.5 - Multi |
Systeemnaam | In punten, hoger is beter |
Intel Core i5 4670K |
*******
6,49 |
Intel Core i5 3470 |
******
5,64 |
Intel Core i5 4570S |
******
5,47 |
AMD A10-7850K (2133MHz) |
****
3,61 |
AMD A10-7850K |
****
3,61 |
AMD A10-6800K |
****
3,57 |
AMD A8-7600 (65W) |
****
3,38 |
AMD A10-6700 |
****
3,36 |
AMD A10-5800K |
****
3,29 |
AMD A8-7600 (45W) |
***
2,99 |
AMD A8-6500T |
**
1,98 |
Cinebench multi is ondertussen een bekende benchmark, waarin alleen cpu-cores worden ingezet om een complexe afbeelding te renderen. Alle geteste processors kunnen met vier threads tegelijk aan de afbeelding werken. Intels Ivy Bridge- en Haswellprocessors blijken in deze benchmark duidelijk sneller dan de AMD-processors, maar Kaveri is weer sneller dan zijn voorgangers.
Cinebench 11.5 - Single |
Systeemnaam | In punten, hoger is beter |
Intel Core i5 4670K |
*******
1,70 |
Intel Core i5 3470 |
******
1,52 |
Intel Core i5 4570S |
******
1,40 |
AMD A10-6800K |
*****
1,13 |
AMD A10-6700 |
*****
1,11 |
AMD A10-7850K |
****
1,03 |
AMD A10-7850K (2133MHz) |
****
1,02 |
AMD A10-5800K |
****
1,01 |
AMD A8-7600 (65W) |
****
0,95 |
AMD A8-7600 (45W) |
***
0,81 |
AMD A8-6500T |
***
0,80 |
In de single-test van Cinebench wordt dezelfde afbeelding gerenderd, maar dan wordt er gebruikgemaakt van één core. AMD's Richland-processors, van de vorige generatie dus, blijken opmerkelijk genoeg sneller dan de nieuwe Kaveri-apu's. De oorzaak moet vermoedelijk gezocht worden in de hogere turbosnelheid van de Richland-processors. De 6800K en 6700 doen respectievelijk 4,4GHz en 4,3GHz, terwijl het voor de 7850K bij 4,0GHz ophoudt.
Cinebench 11.5 - OpenGL |
Systeemnaam | Framerate in fps, hoger is beter |
AMD A10-7850K (2133MHz) |
*******
43,1 |
AMD A10-7850K |
******
36,7 |
AMD A10-6800K |
******
36,0 |
AMD A10-5800K |
******
35,3 |
AMD A8-7600 (65W) |
******
34,6 |
AMD A8-7600 (45W) |
******
34,4 |
AMD A10-6700 |
******
34,2 |
Intel Core i5 4670K |
*****
33,1 |
Intel Core i5 4570S |
*****
32,0 |
AMD A8-6500T |
*****
28,1 |
Intel Core i5 3470 |
**
12,2 |
In de OpenGL-test van Cinebench moet de ingebouwde gpu aan de slag en daarin blijkt de kracht van de AMD-apu's te zitten. Ze zijn ruim sneller dan de Intel Haswell-processors met HD 4600-gpu en de Ivy Bridge-cpu met HD 2500-gpu. De snelheid van het werkgeheugen blijkt ook een grote rol te spelen in de gpu-prestaties. Met 2133MHz-geheugen is de 7850K in deze test zeventien procent sneller dan met geheugen op 1600MHz.
PCMark 8
In Cinebench worden cpu en gpu 'gescheiden' getest. Het renderen van de afbeelding is vooral cpu-intensief, terwijl de OpenGL-test gpu-intensief is. In PCMark wordt in een verzameling van verschillende tests dagelijks gebruik gesimuleerd, waarbij zowel gpu als cpu aan de bak moet. Daarbij gaat het onder andere om webbrowsen, tekstverwerking, fotobewerking en casual gaming. In PCMark 8 is ook een OpenCL-benchmark opgenomen, waardoor de nieuwe AMD-processors van hsa kunnen profiteren.
PCMark 8 blijkt het goed te doen op de AMD-processors en opnieuw blijkt snel werkgeheugen een extra toename in prestaties op te leveren.
Vlak voordat deze review online werd gezet, kwam Futuremark met een nieuwe versie van PCMark 8. Daarin is een aantal tests toegevoegd. Onder andere aan de Home-benchmark is een fotobewerkingstest toegevoegd, die gebruikmaakt van OpenCL-versnelling. De tijd liet ons niet toe om alle processors opnieuw te testen, vandaar dat het resultaat van een aantal processors ontbreekt.
Opmerkelijk is dat de AMD-processors in versie 2 van PCMark 8 ruim hoger scoren dan de Intel-processors. De nieuwe Home-test hecht duidelijk meer waarde aan een krachtige gpu voor OpenCL-versnelling dan de vorige versie van de test, waardoor zelfs de A8-7600 met een tdp van 45 watt hoger scoort dan een Core i5-4670K.
Het verschil tussen de beide versies van PCMark illustreert mooi de potentie van de AMD-processors. Hoe meer de nadruk op de combinatie van cpu en gpu komt te liggen, des te beter zijn de prestaties van de apu's ten opzichte van de performance van de Intel-processors.
Praktijktests: Adobe, Handbrake en Multipar
Uit de synthetische benchmarks van Cinebench en PCMark blijkt dat AMD de cpu-kracht van de Kaveri-apu ten opzichte van Richland niet enorm heeft weten op te voeren, maar dat de gpu-kracht dat wel eens goed kan maken. We draaiden de gebruikelijke tests van Adobe, Handbrake en Multipar om te zien wat het snelheidsverschil in de praktijk is.
In geen van de tests is gebruikgemaakt van OpenCL-versnelling. Enerzijds is dat omdat we dan een nieuwe benchmark in elkaar moeten zetten, wat te veel tijd zou hebben gekost, anderzijds is de ondersteuning voor OpenCL in Photoshop en Premiere nog erg beperkt en is deze in Lightroom nog helemaal afwezig.
Photoshop - Retouch Artist - Tweaked |
Systeemnaam | in seconden, lager is beter |
Intel Core i5 4670K |
**
31,90 |
Intel Core i5 4570S |
**
35,80 |
Intel Core i5 3470 |
***
40,40 |
AMD A10-6800K |
*****
77,20 |
AMD A10-6700 |
*****
79,00 |
AMD A10-5800K |
*****
79,00 |
AMD A10-7850K (2133MHz) |
*****
85,10 |
AMD A10-7850K |
******
87,70 |
AMD A8-7600 (65W) |
******
91,40 |
AMD A8-7600 (45W) |
******
95,80 |
AMD A8-6500T |
*******
108,70 |
In Photoshop CS6 maken we gebruik van een vaststaande action, waarmee een aantal vaste bewerkingen op een afbeelding wordt toegepast. Het goede nieuws voor de Kaveri-processors is dat de A8-7600 met de tdp-instelling op 45W het een stuk beter doet dan de A8-6500T met een gelijkwaardig tdp. Het slechte nieuws is dat de snelste Kaveri-processor, de 7850K, het af blijkt te leggen tegen de 6800K en zelfs tegen de 5800K van twee generaties terug.
Lightroom - Exporteren |
Systeemnaam | in seconden, lager is beter |
Intel Core i5 4670K |
***
57,40 |
Intel Core i5 3470 |
***
64,00 |
Intel Core i5 4570S |
***
64,60 |
AMD A10-6800K |
*****
90,90 |
AMD A10-6700 |
*****
94,57 |
AMD A10-5800K |
*****
94,90 |
AMD A10-7850K (2133MHz) |
*****
95,60 |
AMD A10-7850K |
*****
98,10 |
AMD A8-7600 (65W) |
*****
102,70 |
AMD A8-7600 (45W) |
******
111,20 |
AMD A8-6500T |
*******
140,10 |
In Lightroom, dat net als Photoshop cpu-intensief is, zien we hetzelfde beeld; de Kaveri-apu's weten de snelste Trinity- en Richland-processors niet bij te benen.
Premiere Pro CS5 |
Systeemnaam | in seconden, lager is beter |
Intel Core i5 4670K |
**
159,70 |
Intel Core i5 4570S |
***
188,10 |
Intel Core i5 3470 |
***
192,70 |
AMD A10-7850K |
****
273,40 |
AMD A10-6800K |
****
286,50 |
AMD A8-7600 (65W) |
****
290,50 |
AMD A10-6700 |
****
304,20 |
AMD A10-5800K |
****
305,00 |
AMD A8-7600 (45W) |
*****
321,20 |
AMD A8-6500T |
*******
488,70 |
In Premiere laat Kaveri wel weer zien dat de nieuwe apu's sneller kunnen zijn dan de vorige generaties. De 7850K is de snelste en de A8-7600 is op beide tdp-instellingen sneller dan een Richland-processor met hetzelfde verbruik.
Handbrake en Multipar
In Handbrake converteerden we een filmfragment. We hebben de benchmark uitgevoerd met Handbrake-versie 0.9.8. We hebben nog geen gebruikgemaakt van de QuickSync- en OpenCL-ondersteuning van het programma, omdat die nog in het bètastadium verkeren.
Handbrake |
Systeemnaam | in seconden, lager is beter |
Intel Core i5 4670K |
**
63,00 |
Intel Core i5 4570S |
***
76,00 |
Intel Core i5 3470 |
***
79,00 |
AMD A10-7850K |
****
105,00 |
AMD A10-7850K (2133MHz) |
****
107,00 |
AMD A10-6800K |
****
113,00 |
AMD A8-7600 (65W) |
****
115,00 |
AMD A10-6700 |
****
119,00 |
AMD A10-5800K |
****
121,00 |
AMD A8-7600 (45W) |
*****
127,00 |
AMD A8-6500T |
*******
190,00 |
Net als in Premiere blijken de Kaveri-processors in Handbrake iets sneller dan hun voorgangers, hoewel het verschil niet enorm is. De 7850K is een procent of zeven sneller dan de A10-6800K.
Multipar |
Systeemnaam | in seconden, lager is beter |
Intel Core i5 4670K |
***
31,00 |
Intel Core i5 3470 |
***
33,00 |
Intel Core i5 4570S |
***
33,00 |
AMD A10-7850K |
****
45,00 |
AMD A10-6800K |
****
46,00 |
AMD A8-7600 (65W) |
****
47,00 |
AMD A10-6700 |
****
47,00 |
AMD A10-5800K |
*****
48,00 |
AMD A8-7600 (45W) |
*****
53,00 |
AMD A8-6500T |
*******
74,00 |
Ook in Multipar laten de Kaveri-apu's een kleine snelheidsverhoging zien ten opzichte van de Richland- en Trinity-processors.
De resultaten in de praktijkbenchmarks wisselen dus. In Photoshop en Lightroom is Kaveri trager dan zijn voorgangers, terwijl uit de overige tests blijkt dat de nieuwe processors iets sneller zijn. Het is in ieder geval wel duidelijk dat taken die puur de cpu-cores belasten, niet het sterkste punt zijn van de Kaveri-apu's.
Luxmark
Om de OpenCL-mogelijkheden van de AMD-processors extra te testen hebben we Luxmark gedraaid. Luxmark gebruikt ray tracing om een scène te renderen en maakt daarbij gebruik van OpenCL.
In Luxmark kunnen de cpu en de gpu ingezet worden bij het renderen. Als we van zowel cpu als gpu gebruikmaken, blijken de 7850K en de 7600 beide hoog te scoren. Met snel geheugen blijkt de 7850K iets sneller, net als in eerdere benchmarks.
Als we vervolgens de benchmark overdoen en daarbij alleen de cpu belasten, komt een heel ander beeld naar voren. De Steamroller-cpu-cores van de Kaveri-chips blijven achter bij de Trinity- en Richland-processors. Het is niet verrassend dat de Intel-processors in deze test het snelst zijn.
De hoge score van de Kaveri-processors in de gecombineerde test is dan ook vooral het resultaat van de krachtige gpu. Als we dezelfde test nog eens doen en daarbij alleen de gpu belasten, blijken de Kaveri-processors veruit de snelste te zijn.
Games: Grid 2 en Stalker
De apu's van AMD staan bekend om hun krachtige gpu en ook uit de synthetische benchmarks bleek dat al. We wilden daarnaast natuurlijk weten hoe de processors presteren als er 'echt' gegamed wordt. Daarom draaiden we 3DMark, Grid 2 en Stalker: Call of Pripyat.
De 3DMark-score wordt net als de PCMark-score opgebouwd uit verschillende testresultaten. De 4670K eindigt bovenaan, niet dankzij zijn snelle gpu, maar dankzij de processorkracht.
Grid 2 - 1280x720 - Medium - 0xAA |
Systeemnaam | GPU | Minimum- / gemiddelde framerate in fps, hoger is beter |
AMD A10-7850K (2133MHz) |
R7 |
*****
+
**
58,3 / 74,5 |
AMD A10-7850K |
R7 |
*****
+
**
52,4 / 67,6 |
AMD A10-6800K |
HD 8670D |
*****
+
*
52,3 / 66,6 |
AMD A10-5800K |
HD 7660D |
*****
+
*
51,4 / 65,6 |
AMD A10-6700 |
HD 8670D |
*****
+
*
52,7 / 64,3 |
AMD A8-7600 (65W) |
R7 |
*****
+
*
49,5 / 61,9 |
AMD A8-7600 (45W) |
R7 |
****
+
*
47,6 / 60,9 |
Intel Core i5 4670K |
HD 4600 |
****
+
*
46,9 / 58,1 |
Intel Core i5 4570S |
HD 4600 |
****
+
*
46,5 / 56,9 |
Intel Core i5 3470 |
HD 2500 |
**
+
*
19,3 / 23,9 |
Grid 2 vormt geen uitdaging voor de AMD-processors. Snel geheugen leidt in Grid 2 tot een tien procent hogere framerate.
Stalker: CoP - 1920x1080 - Medium - 0xAA |
Systeemnaam | GPU | Minimum- / gemiddelde framerate in fps, hoger is beter |
AMD A10-7850K (2133MHz) |
R7 |
*****
+
**
24,2 / 31,1 |
AMD A10-7850K |
R7 |
*****
+
*
22,2 / 27,8 |
AMD A8-7600 (65W) |
R7 |
****
+
*
19,2 / 25,2 |
AMD A8-7600 (45W) |
R7 |
****
+
**
19,0 / 24,9 |
AMD A10-6800K |
HD 8670D |
***
+
**
15,4 / 22,0 |
AMD A10-6700 |
HD 8670D |
***
+
*
15,6 / 21,7 |
AMD A10-5800K |
HD 7660D |
***
+
**
14,4 / 21,2 |
AMD A8-6500T |
HD 8550D |
***
+
*
14,9 / 18,9 |
Intel Core i5 4670K |
HD 4600 |
****
+
*
16,1 / 18,9 |
Intel Core i5 4570S |
HD 4600 |
***
+
*
15,8 / 18,4 |
Intel Core i5 3470 |
HD 2500 |
*
+
*
6,1 / 7,0 |
Stalker was in 2009 nog een uitdagende game voor de meeste videokaarten, maar ondertussen zijn sommige igp's in staat tot het soepel draaien van de game op een full-hd-resolutie. De Kaveri-gpu's zijn daar het beste in en een 7850K met snel geheugen weet gemiddeld meer dan 30fps neer te zetten. De meeste gamers zullen niet onder de indruk zijn van dergelijke resultaten, maar het betekent wel dat minder veeleisende games binnen het bereik komen van mensen die geen dure computer willen aanschaffen, maar toch af en toe willen gamen.
Energieverbruik
Met de overstap van Richland naar Kaveri is AMD ook afgestapt van het 32nm-productieproces en naar het 28nm-procedé gegaan. Dat laat op de die iets meer ruimte over voor de gpu en het energieverbruik zou ook iets afgenomen zijn. AMD geeft de 7850K een tdp van 95 watt mee, 5 watt minder dan de 6800K en de 5800K.
Of de processors in de praktijk ook zuiniger zijn geworden, hebben we gemeten in onze verbruikstests. We deden de energiemetingen met een Voltcraft 3500-energiemeter, waarbij we het opgenomen vermogen van het hele systeem hebben gemeten. Daarbij hebben we drie scenario's gebruikt: idle, volledige cpu-load en volledige cpu- en gpu-belasting.
Opgenomen vermogen - idle |
Systeemnaam | Vermogen in watt, lager is beter |
AMD A8-6500T |
*****
24,50 |
AMD A10-6800K |
******
26,30 |
AMD A10-6700 |
******
30,10 |
AMD A8-7600 (45W) |
******
30,20 |
AMD A8-7600 (65W) |
******
30,20 |
Intel Core i5 3470 |
*******
30,50 |
AMD A10-5800K |
*******
30,70 |
AMD A10-7850K |
*******
32,50 |
Intel Core i5 4570S |
*******
32,70 |
Intel Core i5 4670K |
*******
32,70 |
Bij de idle-test hebben we het testsysteem aangezet en gewacht totdat Windows volledig was gestart en de verbruiksmeter een constante waarde aangaf. De AMD- en Intel-systemen zitten beide rond de 30 watt. Uitschieter is AMD's A8-6500T, die een stuk zuiniger is dan de rest.
Opgenomen vermogen - load cpu |
Systeemnaam | Vermogen in watt, lager is beter |
AMD A8-6500T (45W) |
***
60,00 |
AMD A8-7600 (45W) |
*****
80,00 |
Intel Core i5 4570S (65W) |
*****
81,00 |
Intel Core i5 3470 (77W) |
*****
93,00 |
AMD A10-6700 (65W) |
******
101,20 |
Intel Core i5 4670K (84W) |
******
108,00 |
AMD A8-7600 (65W) |
******
109,00 |
AMD A10-7850K (95W) |
*******
117,20 |
AMD A10-6800K (100W) |
*******
123,50 |
AMD A10-5800K (100W) |
*******
123,50 |
Vervolgens hebben we alle processorcores met Prime 95 belast en keken we opnieuw naar de energieconsumptie van het volledige systeem. Het energieverbruik van de A8-6500T en A8-7600 blijkt bij dezelfde tdp-rating nog 20 watt uiteen te lopen. Blijkbaar zit de ene processor aan de ondergrens, terwijl de andere aan de bovengrens van de tdp-rating zit.
De Intel-processors lijken onder Prime-belasting zuiniger te zijn dan hun concurrenten van AMD, maar die vergelijking mag zo eigenlijk niet gemaakt worden, omdat er in beide systemen verschillende moederborden zitten, die een verschillende invloed op het verbruik hebben. De lagere tdp van de 7850K ten opzichte van zijn voorgangers zien we in ieder geval terug in de meting, onder Prime-belasting verbruikt de snelste Kaveri-apu 6 watt minder.
Opgenomen vermogen - load cpu + gpu |
Systeemnaam | Vermogen in watt, lager is beter |
Intel Core i5 3470 |
***
69,00 |
AMD A8-6500T |
***
73,10 |
Intel Core i5 4570S |
****
82,60 |
Intel Core i5 4670K |
****
85,90 |
AMD A8-7600 (45W) |
****
91,00 |
AMD A10-6700 |
*****
101,20 |
AMD A8-7600 (65W) |
*****
108,00 |
AMD A10-7850K |
******
126,00 |
AMD A10-6800K |
*******
146,00 |
AMD A10-5800K |
*******
152,00 |
Tot slot hebben we geprobeerd het onderste uit de kan te halen door Prime 95 te laten draaien, terwijl we ook de ingebouwde gpu onder druk zetten met Furmark. Bij Intel-processors stijgt het verbruik niet noemenswaardig of gaat het zelfs omlaag. Dat komt vermoedelijk doordat Furmark ook wat vrije cpu-cycles nodig heeft om te draaien, terwijl Prime alles opslokt, waardoor uiteindelijk geen van beide programma's de processor vol kan belasten.
Bij AMD-processors levert de combinatie van Prime en Furmark wel een hoger verbruik op, en daar zien we ongeveer dezelfde resultaten als in de test waarbij alleen de cpu wordt belast. De 7850K is zuiniger dan de 6800K en 5800K, terwijl de A8-7600 meer verbruikt dan zijn voorganger met een gelijkwaardige tdp.
Overklokken: de gpu en cpu versneld
AMD levert al geruime tijd Black Edition-processors. Deze processors, veelal de duurste modellen, hebben een multiplier die vrij instelbaar is. De A10-7850K heeft dat ook en we vroegen ons dan ook af of er meer dan 4,0GHz uit de nieuwe Kaveri-chip te halen is.
Daarnaast zijn niet alleen de cpu-cores, maar ook de gpu-cores overklokbaar. AMD demonstreerde bij de presentatie van Kaveri al dat de op 720MHz tikkende gpu overgeklokt kon worden naar meer dan 1GHz. Daarbij werd ongetwijfeld een speciaal geselecteerde processor gebruikt, die lekker overklokte. Daarom keken wij of een doorsnee-7850K uit de winkel ook dergelijke snelheden kan halen.
We installeerden een setje ddr3-2133MHz-geheugen en keken in eerste instantie hoe snel de cpu-cores wilden lopen. Daarvoor verhoogden we de multiplier uiteindelijk tot 42, met een spanningsverhoging van tien procent. Bij multipliers van 43 en 44 kwam het systeem wel in Windows, maar bleek de overklok niet stabiel. Terug naar 4,2GHz dus, waarbij we wel een Prime 95-stabiele overklok op alle vier de cores hadden.
/i/1390296219.png?f=thumb)
Het overklokken van de gpu ging in eerste instantie minder lekker dan het opvoeren van de cpu-frequentie. Met de cpu-cores op 4,2GHz bleken we geen hoge, stabiele gpu-overklok te kunnen realiseren. Op 4,1GHz lukte dat wel; de gpu kon van 720MHz naar 1025MHz. Met die klokfrequenties draaiden we enkele benchmarks.
Het 3DMark-resultaat van de overgeklokte processor laat zien dat de overklok een drie procent hogere score oplevert. Daarnaast is het interessant dat de overstap van geheugen op 1600MHz naar geheugen op 2133MHz een zes procent hogere score oplevert. Wie meer uit zijn Kaveri-apu wil halen, kan dus al een aardige prestatiewinst behalen door sneller geheugen te monteren.
Ook in Grid 2 zien we dat de overklok een iets hogere framerate oplevert, maar dat snel geheugen meer doet voor de framerates.
In Stalker blijkt een 300MHz overklok zelfs helemaal geen verschil te maken. De overgeklokte 7850K en de 7850K op standaardsnelheden scoren even hoog. We zijn dus onder de indruk van de prestatieverschillen die snel werkgeheugen oplevert en ook van het gemak waarmee we de multiplier en de gpu-snelheid konden aanpassen. Helaas leidt het ophogen van de gpu- en cpu-snelheid niet tot de prestatiewinst die we van een 42 procent hogere gpu-snelheid verwachtten.
Conclusie
Door te kiezen voor hsa heeft AMD met Kaveri een grote gok genomen. De nadruk lag bij de vorige generaties apu's al op de gpu en met de nieuwste generatie is dat alleen maar toegenomen. Het lijkt erop dat de ontwikkeling van de 'gewone' processorcores zelfs op een zijspoor is gezet, want in sommige cpu-intensieve benchmarks zijn de nieuwe Steamroller-cores langzamer dan de Piledriver-cores die AMD gebruikte in de Trinity- en Richland-apu's.
Daarbij moeten we wel aantekenen dat de lagere prestaties op cpu-gebied te wijten zijn aan de lagere kloksnelheid van de Steamroller-cores. Als we de prestaties per gigahertz berekenen, zijn de Kaveri-apu's wel sneller. In de traditionele reeks benchmarks is de A10-7850K gemiddeld negen procent sneller dan de A10-6800K. Met OpenCL-benchmark Luxmark meegerekend loopt die genormaliseerde winst op tot ruim 24 procent.
De gpu is dus de 'core-business' van Kaveri geworden en ook dat blijkt uit de testresultaten. Bij benchmarks die gebruikmaken van de OpenCL-capaciteiten van de nieuwe apu zijn de Kaveri-processors sneller dan een aantal veel duurdere processors van Intel. Ook in de gamebenchmarks die we draaiden, eindigen de AMD-processoren steevast bovenaan. Voor gebruikers die af en toe een spelletje spelen en niet al te hoge eisen aan de beeldkwaliteit stellen, is de Kaveri-processor, net als zijn voorganger, een interessante optie.
Een langzamere cpu dus, maar een snellere gpu. Is Kaveri een teleurstelling of juist de vernieuwing die hard nodig was bij AMD? Dat is op dit moment nog koffiedik kijken. Hsa heeft de potentie om veel applicaties te versnellen, maar nu is het aanbod nog niet groot. Bovendien gaat het in de meeste gevallen om specifieke functies binnen bepaalde software. In Calc, onderdeel van het LibreOffice-pakket, worden sinds kort meer dan honderd functies versneld met behulp van OpenCL en in Photoshop wordt een aantal filters met behulp van OpenCL versneld. AMD-apu's kunnen die functies allemaal versnellen, maar dat houdt wel in dat het momenteel nog om vrij specifieke gebruiksscenario's gaat.
Het succes van Kaveri hangt dus samen met het succes van OpenCL. Als ontwikkelaars en masse OpenCL-ondersteuning in hun software implementeren, zullen de Kaveri-processors steeds vaker duurdere Intel-processors voorbijstreven. Gebeurt dat niet, dan valt AMD's strategie in het water en gaat Kaveri de boeken in als een snelle gpu, gebundeld met een langzame processor. De potentie is er dus zeker, de prijs is met nog geen 160 euro scherp en de gpu is hoe dan ook snel. Of AMD met hsa op het juiste paard heeft gewed, moet de toekomst uitwijzen.