De Ryzen 7 5800X3D is AMD's poging om de titel 'snelste gamingprocessor' te claimen. Dat lukt in sommige games wel, maar gemiddeld blijven Intels snelste Alder Lake-processors in onze gameselectie toch wat sneller. AMD's aanpak met het verticaal stapelen van extra cachegeheugen is echter veel innovatiever en eleganter dan het opschroeven van de kloksnelheden zoals we Intel eerder met de 12900KS zagen doen. De 5800X3D is daardoor ongekend efficiënt tijdens het gamen. We belonen de 5800X3D daarvoor met een Innovation-award, maar toch zal hij door de wisselvallige prestaties in andere software en de hoge prijs voor weinig mensen een aantrekkelijke koop zijn.
Een week nadat Intel zijn koppositie verstevigde met de Core i9 12900KS, doet AMD een aanval op de titel 'snelste gamingprocessor'. Toeval bestaat niet, toch? AMD's aanpak lijkt echter een stuk interessanter. Waar Intel simpelweg de kloksnelheden opvoerde, past AMD voor het eerst zijn 3D V-Cache, kortgezegd een verlengstuk van de bestaande L3-cache, toe in een consumentenprocessor. Wij hebben de AMD Ryzen 7 5800X3D uitgebreid getest.
Bijna een jaar geleden stond Lisa Su op het podium met de eerste chip die beschikte over 3D V-Cache, verticaal gestapelde extra L3-cache. Toen hield ze nog een prototype gebaseerd op een Ryzen 9-chip in de lucht, een processor met twee die's dus, maar de processor die nu daadwerkelijk op de markt komt, is gebaseerd op de octacore-5800X. Omdat elke computedie over een gedeelde L3-cache beschikt, wordt er dus ook maar half zoveel cache toegevoegd als bij dat prototype.
Laten we eerst even de specificaties op een rijtje zetten. Zoals de naam al doet vermoeden, lijkt de Ryzen 7 5800X3D sterk op de normale 5800X. Hij heeft bijvoorbeeld evenveel cores en dezelfde tdp van 105W. Opvallend genoeg zijn de kloksnelheden juist lager: de singlecoreboost is 200MHz lager en bij de basesnelheid lever je zelfs 400MHz in. Aan de ene kant is dat nodig om het extra stroomverbruik van de 3D V-Cache binnen dezelfde tdp te laten passen, maar aan de andere kant lijkt ook de innovatieve productiemethode roet in het eten te gooien voor de mate waarin de kloksnelheid schaalt met spanning. Op de volgende pagina gaan we daar dieper op in.
De Ryzen 7 5800X3D heeft op papier dezelfde adviesprijs als de 5800X toen hij uitkwam, namelijk 449 dollar. In de tussentijd is niet alleen de euro wat weggezakt ten opzichte van de dollar, maar is ook de prijs van de 5800X flink gedaald. In de praktijk is er op het moment van introductie daarom sprake van een meerprijs van ongeveer 150 euro voor het model met 3D V-Cache, en dat is flink.
Het nut van meer L3-cache
Toen AMD zijn verticaal gestapelde cache wereldkundig maakte, zetten we de werking van cache nog eens uiteen in een achtergrondartikel. Kort samengevat heeft een moderne processor drie cacheniveaus: een supersnelle L1-cache die direct betrokken is bij de berekeningen die een cpu-core op dat moment uitvoert, een L2-cache (doorgaans eveneens per core) en een L3-cache, die meestal wordt gedeeld door een groep cores. Elk cacheniveau is groter, waardoor er meer data in past, maar ook langzamer. Worden de benodigde gegevens niet aangetroffen in L1, L2 of L3, dan moet die uit het werkgeheugen komen.
Cacheniveaus in een processor
Dat werkgeheugen is wel acht tot tien keer langzamer dan het hoogste cacheniveau, de L3-cache. Afhankelijk van de geheugensnelheid is een latency van 70 tot 90ns niet ongebruikelijk, terwijl de L3-cache in ongeveer 9ns bereikt kan worden. Bij de Ryzen 7 5800X3D is die L3-cache inherent langzamer door de verdrievoudiging van de capaciteit; het duurt nu eenmaal langer om een grotere cache te doorzoeken. Volgens AMD voegt dat ongeveer 3ns toe aan de latency, maar zelfs met die hogere latency blijft de cache enorm veel sneller dan het dram.
Latency
Ryzen 7 5800X
Ryzen 7 5800X3D
L3-cache
9-10ns
12-13ns
Dram
70-90ns
70-90ns
Meer cache, op welk niveau dan ook, betekent dat er meer data snel beschikbaar is en is dus een bewezen effectieve manier om de prestaties van een processor te verhogen. Waarom bevat dan niet elke processor een sloot extra cache? Lang niet alle software weet echt gebruik te maken van die grotere cache. Als de gegevens die nodig zijn voor de berekeningen al binnen de standaardgrootte van de L3-cache passen, heeft het toevoegen van meer cache geen zin. Het kan zelfs een licht negatief effect hebben op de prestaties, doordat de latency iets toeneemt.
De karakteristiek van de extra L3-cache is daardoor vergelijkbaar met dat van sneller geheugen installeren of meer cores toevoegen aan een processor. Het ene programma profiteert er enorm van, in het andere merk je amper verschil. In onze testsuite zullen we daar duidelijk voorbeelden van zien, maar het beste voorbeeld is zonder twijfel games, omdat de datastromen van veel spellen slecht voorspelbaar en groot zijn, al is het maar omdat je als speler zelf kan bepalen wat je volgende stap is. AMD gaat zelfs zo ver om de 5800X3D een 'gamingprocessor' te noemen.
De die met de extra L3-cache wordt letterlijk bovenop de bestaande ccd geplaatst, en is iets meer dan half zo groot. Links en rechts van de toegevoegde die wordt passief silicium geplaatst om de bovenkant vlak te houden.
Dat lang niet elke soort software zo goed schaalt met extra cache, is een belangrijke reden waarom de reguliere Ryzen 5000-processors niet met zo veel cache zijn uitgerust. Een andere belangrijke reden is het prijskaartje ervan. De sram-cellen waar cache uit bestaat, nemen enorm veel ruimte op de chip in beslag: elke bit kost zes transistors. Ter vergelijking, een normale Zen 3-ccd met acht cores en 32MB L3-cache is 81mm² groot, de extra 64MB L3-cache die AMD nu toevoegt meet met 41mm² meer dan de helft daarvan. De ccd's standaard met zo veel cache uitrusten zou ze dus de helft groter, duurder en vatbaarder voor defecten maken, en dat acht AMD de prestatiewinst in een beperkte hoeveelheid software nog niet waard.
De techniek achter 3D V-Cache
AMD gebruikt voor zijn processors met 3D V-Cache exact dezelfde ccd's als voor reguliere Zen 3-processors. Die blijken al sinds het begin over een extra dikke beschermlaag van ongebruikt silicium te beschikken, die deels kan worden afgeslepen om de hoogte zodanig te beperken dat de totale hoogte inclusief de 3D V-Cache gelijk blijft aan die van een normale Ryzen 5000-processor. Aan de heatspreader en koelers hoeft zodoende niets te worden veranderd.
Chip-on-wafer
Het technisch meest vernuftige aspect van de 3D V-Cache is de methode waarmee de extra cachedie bovenop de bestaande ccd wordt gestapeld. AMD heeft natuurlijk al lange tijd geen eigen fabrieken meer, maar laat zijn chips produceren bij TSMC, dat de gebruikte chip-on-wafer-techniek heeft ontwikkeld. In plaats van het gebruik van bolletjes (microbumps) om twee chips met elkaar te verbinden, zoals concurrent Intel doet met Foveros, worden de twee die's bij de TSMC-techniek direct op elkaar geplaatst.
Bij het verbinden van de die's komt geen lijm of soldeer ter sprake. Toch vallen ze niet van elkaar af als je de processordie op zijn kop zou houden. Voor de verbinding tussen de diëlektrische (slecht geleidende) buitenlagen past TSMC de vanderwaalskrachten toe, die ervoor zorgen dat perfect gladde oppervlakken van gelijksoortige moleculen zich aan elkaar binden als je ze tegen elkaar aan drukt. De koperen verbindingen tussen de through-silicon-via's, die aan de oppervlaktes van beide die's zitten, worden vervolgens tot stand gebracht door diffusiebinding, een combinatie van verhitting (maar onder het smeltpunt van de gebruikte materialen) en druk.
De extra cachedie wordt letterlijk bovenop de reguliere L3-cache gelegd, zodat de meer naar buiten geplaatste cores hun hitte niet door de extra cache heen hoeven kwijt te raken. Om de hoogte gelijk te houden, wordt op die plekken passief silicium aangebracht. De 64MB extra cache is verdeeld in acht slices van 8MB per stuk, die elk via duizend tsv's contact maken met een 4MB-slice op de originele die. Dat telt op tot een totaal van 8192 tsv's met een onderlinge afstand van 9 micrometer (0,009mm). Door het grote aantal connecties kan de kloksnelheid per verbinding omlaag ten opzichte van microbumps, wat de efficiëntie ten goede komt. Het energieverbruik zou slechts een derde zijn. Toch is er sprake van een totale bandbreedte van ruim 2TB/s full-duplex.
De verbindingen tussen de toegevoegde 3D V-Cache en de reguliere ccd. Bron: AMD tijdens ISSCC 2022, via Hardwareluxx
Overklokken vooralsnog niet mogelijk
TSMC's chip-on-wafertechniek heeft dus allerlei voordelen, maar vooralsnog ook een belangrijk nadeel, en dat is dat de spanning/kloksnelheid-schaling nog niet op het niveau van de reguliere packagingtechniek is. In vergelijking met een normale Ryzen 5000-chip wordt er eerder een spanning bereikt waarboven de kloksnelheid niet meer verder kan worden verhoogd. Daarom heeft AMD besloten om de mogelijkheden voor het aanpassen van de spanning en kloksnelheid van de Ryzen 7 5800X3D uit te schakelen: de standaardinstellingen zouden het 'potentieel reeds maximaal benutten'.
Toch houdt AMD de deur op een kier. In antwoord op vragen van Tweakers benadrukt technisch marketeer Robert Hallock dat het wel mogelijk is om het werkgeheugen en de Infinity Fabric-bus te overklokken, maar dat de cpu-snelheid en -spanning 'voor nu' is vastgezet. Door de interne koppelingen is ook undervolten en het gebruik van Curve Optimizer vooralsnog niet mogelijk, al kijkt AMD naar eigen zeggen wel naar mogelijkheden om dit in de toekomst toch beschikbaar te maken.
"We hebben intern gediscussieerd wat we wilden doen: wachten tot de technologie beter schaalt en volwassener wordt op dat punt, of bieden we de consument nu direct 15 procent betere gamingprestaties? Dat was in onze optiek een no-brainer, zeker als we kijken naar wat voor een bedrijf we willen zijn. Ook met chiplets, HBM en de multi-chip-modules van de eerste Threadrippers waren we er vroeg bij, dat zit in ons dna. Soms betekent dat dat we niet alle functies die beschikbaar zijn op andere producten, beschikbaar kunnen maken. Het komt erop neer dat de kloksnelheid die je terugkrijgt voor een hogere spanning nog niet op het niveau is van een traditionele Ryzen 5000-chip, maar we blijven eraan werken om dat te verbeteren. Dat is waar we nu staan." - Robert Hallock, Director of Technical Marketing, AMD
Overigens is de Ryzen 7 5800X3D niet de enige processor die wordt uitgerust met 3D V-Cache, want AMD verkoopt sinds kort ook enkele Epyc-modellen voor servers met de nieuwe technologie aan boord. Waar AMD het voor de consumentenchip bij één chiplet houdt, bestaan de vier aangekondigde Epyc-modellen allemaal uit acht chiplets, wat betekent dat er in totaal 768MB L3-cache aanwezig is.
Testverantwoording
We hebben alle courante, enigszins vergelijkbare processors pas opnieuw getest, onder andere voor deze review van de AMD Ryzen 7 5800X. Daarvoor hebben we uiteraard de nieuwste versies van alle software gebruikt, inclusief Windows 11, biosversies voor de moederborden en gpu-drivers.
De mainstreamplatforms geven we 16GB per geheugenkanaal, dus in totaal 32GB. De kloksnelheid stellen we in op de officiële maximumsnelheid, zoals opgegeven door AMD of Intel.
Bij processors met een geïntegreerde gpu draaien we het gros van onze benchmarks zonder extra videokaart, terwijl we cpu's zonder igpu, zoals de meeste AMD Ryzens en Intel F-modellen, combineren met een Nvidia GeForce GTX 1650.
Gametests
Alle gamebenchmarks draaien we in combinatie met een van de snelste videokaarten van dit moment: een AMD Radeon RX 6900 XT. Dat doen we primair in full-hd-resolutie, 1920x1080 pixels, met Medium- en Ultra-settings. We kiezen juist voor de relatief lage full-hd-resolutie om de cpu waar mogelijk de bottleneck te laten zijn. Dit blijft representatief als er in de toekomst snellere videokaarten verschijnen die het knelpunt naar de processor laten verschuiven. Bij hogere resoluties, zoals 4k, ligt de bottleneck doorgaans volledig bij de videokaart. Wel testen we op verzoek twee games ook op een resolutie van 2560x1440 pixels, om te kijken of er op die resolutie nog verschil is tussen processors.
Stroomverbruik
Uiteraard meten we ook het stroomverbruik van de processors. Onze meetmethode daarvoor is gebaseerd op de stroom die door de EPS- en ATX-kabels naar het moederbord loopt en die we onderscheppen met behulp van Tinkerforge-hardware. Door uitsluitend het vermogen van de processor te meten, geïsoleerd van de rest van het systeem, kunnen we een appels-met-appelsvergelijking maken. Daarbij rapporteren we de mediaan van zowel het verbruik via de EPS-kabels, cpu-only, als het totale verbruik inclusief het moederbord. We noteren het stroomverbruik idle, gemiddeld over vijf minuten, en tijdens drie soorten belasting: tijdens een Cinebench R23-run, multithreaded uiteraard, tijdens het renderen van een video in Adobe Premiere Pro en tijdens een game: Metro Exodus op 1080p-resolutie met Ultra-settings.
Welke testgegevens het relevantst zijn voor jou, verschilt naar gelang je gebruiksdoel. Installeer je als gamer bijvoorbeeld toch al een losse videokaart, dan is het vergelijken van alleen het cpu-verbruik de meest logische route. Zou je daarentegen genoeg hebben aan geïntegreerde graphics of moet je cpu's die dat niet hebben, voorzien van een videokaart om beeld te krijgen, dan kan het totale platformverbruik relevanter zijn.
Foto- en videobewerking
Fotobewerking testen we met het Adobe Photoshop CC-pakket, dat zo populair is dat 'fotoshoppen' als werkwoord de Van Dale heeft bereikt. We draaien een opgeslagen 'action', of 'handeling', in de Nederlandstalige versie, die diverse soorten effecten, bewerkingen en transformaties bevat.
In Adobe Premiere Pro CC renderen en exporteren we een videoproject. Het bronproject is een Tweakers Tech Hub-aflevering, bestaande uit 4k-camerabeelden, die we exporteren met een variabele bitrate van 20 tot 40Mbit/s. De speelduur van de video is 13 minuten en 51 seconden.
In DaVinci Resolve renderen we een video opnieuw naar 4k met de H.264-codec. De bronbestanden zijn vier streams van 1080p, die in een mozaïek worden samengevoegd tot een enkele 4k-stream. De bitrate ligt met 80Mbit/s flink hoger dan bij Premiere en uiteraard worden ook weer effecten als kleurcorrectie en camerastabilisatie toegepast.
In Photoshop is de 5800X3D enkele seconden sneller, in Premiere Pro is de winst ten opzichte van de 5800X met 8,3 procent het grootst. Daarentegen is de nieuwe chip in DaVinci Resolve juist langzamer dan de reguliere editie.
Video- en audiocodering
Op deze pagina vind je de prestaties tijdens het omzetten van video en audio. De H.264- en HEVC-codecs testen we met de StaxRip-encoder. In beide gevallen converteren we een 4k-mp4-video met een framerate van 60fps, een bitrate van 8Mbit en een bitdiepte van 8bit. In de tweede benchmark converteren we dezelfde video met behulp van de H.265-codec. Beide benchmarks voeren we drie keer uit, waarna we de gemiddelde score noteren. Voor de audioconversie zetten we een FLAC-bestand van een uur om in een WAVE en noteren we de tijd die dit kost.
De 5800X3D doet het flink sneller in de x264-test dankzij de toegevoegde L3-cache. Hij komt bijna tot 100fps, goed voor een plus van ruim 37 procent én bijna een evenaring van de prestaties van de Ryzen 9's met meer cores. x265-encoding lijkt minder gevoelig voor de extra cache en wordt er juist amper sneller op. De audioconversie verloopt zelfs duidelijk langzamer, wat vermoedelijk puur door de lagere single-coreturbo van de 5800X3D komt.
3d-rendering
Cinebench is de benchmarksoftware die hoort bij de Cinema4D-rendersoftware. Je kunt deze benchmark gratis downloaden en eenvoudig zelf draaien, in zowel single- als multithreaded modus. Mede daardoor is hij uitgegroeid tot een van de populairste cpu-tests. We draaien de nieuwste Cinebench 23.
In Cinebench is de extra cache niet voldoende om de lagere kloksnelheden van de 5800X3D te compenseren, waardoor hij terrein verliest ten opzichte van de 'normale' 5800X.
Blender is een opensource-renderengine. Met deze software renderen we het Italian Flat-project, dat je hier kunt downloaden en dat een stuk zwaarder is dan de Barcelona Pavilion-render die we voorheen draaiden.
Ook in Blender is de 5800X3D wat langzamer dan de 5800X.
Corona Renderer is een renderengine die beschikbaar is in Autodesk 3DS Max en Maxon Cinema 4D. Wij draaien de officiële Corona Benchmark, waarin een voorgedefinieerde scène wordt gerenderd. Je kunt de benchmark zelf gratis downloaden.
In de Corona-benchmark weet de 5800X3D wel nipt beter te presteren dan de 5800X, maar echt veel voordeel heeft de extra cache dus ook in deze test niet.
Compute en compile
We compileren de volledige Firefox-browser met behulp van MozillaBuild, aan de hand van de opensourcebroncode.
Sommige onderdelen van het compilatieproces lijken wel wat te kunnen met de extra cache, zo blijkt uit het feit dat de 5800X3D ondanks zijn lagere kloksnelheden toch sneller is dan de 5800X. Tot een echt substantiële prestatiewinst leidt het echter niet.
We draaien de AIDA64-benchmarksuite integraal. Daarin komen diverse soorten computeworkloads en encryptiemethoden voor. Waar mogelijk worden instructiesetuitbreidingen als SSE en AVX ingezet. Verder meet dit programma hoe snel SHA-3-hashes kunnen worden berekend. Het hele testparcours draaien we drie keer om eventuele variatie in resultaten op te vangen.
In de AIDA64-tests is de Ryzen 7 5800X3D consequent tussen de 4 en 7 procent langzamer dan de 5800X.
Webbrowsing en compressie
In de populairste webbrowser van dit moment, Google Chrome, draaien we de Jetstream 2-benchmark. Die kun je zelf terugvinden via browserbench.org. Vrijwel alle deeltests worden 120 keer gedraaid en de scores worden gemiddeld en gewogen. We voeren deze benchmark uit in Chrome 99.
De iets lagere singlecoreturbo leidt tot een eveneens iets lagere score in Jetstream 2.
Met 7-Zip comprimeren we 15GB, ruim drie keer zoveel als voorheen, aan willekeurig gegenereerde data met behulp van de 'fast compression'-instellingen tot een 7z-bestand en noteren we de tijd. We berekenen het gemiddelde van drie runs.
7-Zip weet wel flink te profiteren van de extra cache. Het inpakken is voltooid na 270 seconden, wat net zo snel is als op de 12-core-5900X. De 5800X3D weet exact 20 procent af te snoepen van de tijd die de 5800X nodig had, een mooie verbetering.
Games: Far Cry 6
Far Cry 6 is Ubisofts recentste firstpersonshooter in de Far Cry-serie, die al jarenlang draait op de Dunia-engine. Voor Far Cry 6 wordt daarvan versie 2.0 gebruikt.
De Ryzen 7 5800X3D presteert duidelijk beter dan de reguliere Ryzen 5000-processors. Op Medium-settings is hij bijna 25 procent sneller dan de 5800X, maar wel 19 procent langzamer dan de snelste Intel-processors. Ook op Ultra-settings houdt de 5800X3D het midden tussen de Alder Lakes en de rest van de Ryzen 5000-lineup.
Games: F1 2021
In F1 2021 zorgt de Ryzen 7 5800X3D voor een enorme prestatieboost. Op Medium-settings meten we 469fps, maar liefst 36 procent meer dan wat de 5800X wist te genereren én voldoende om de Core i9 12900KS van Intel te verslaan. Op Ultra-settings lukt dat dan weer niet en is de 5800X3D maar een paar procent sneller dan de bestaande cpu's.
Ook in Metro Exodus brengt de Ryzen 7 5800X3D het rode kamp terug naar de bovenkant van de grafieken. Eigenlijk was AMD in deze game al de snellere op de meeste settings, maar op 1080p met Medium-settings was Intel wel de snelste, tot nu dus.
We benchmarken Red Dead Redemption 2, gebruikmakend van de Vulkan-api. Dit is een van de games die we behalve in full hd ook in 1440p-resolutie draaien.