AMD’s RX 6000-serie videokaarten is gebaseerd op de nieuwe RDNA 2-architectuur. Zoals de naam al doet vermoeden, is dit een doorontwikkeling van de eerste RDNA-architectuur die gebruikt werd voor de RX 5000-serie (Navi 10). Bovendien wordt RDNA 2 ook gebruikt voor de socs in de nieuwe generatie consoles.
Een aantal zaken is gelijk gebleven aan de voorgangers, zoals de aanwezigheid van GDDR6-geheugen en het 7nm-productieproces dat bij TSMC wordt uitgevoerd. Desondanks claimt AMD het gestelde doel van 50 procent meer prestaties per watt te hebben overtroffen met RDNA 2.
Infinity Cache
De hoeveelheid veranderingen die RDNA 2 met zich meebrengt, bestaat echter uit een veel langere lijst. Met afstand de grootste wijziging ten opzichte van eerdere videokaarten is de toevoeging Infinity Cache, een cachegeheugen dat de geheugenbus moet ontlasten en de prestaties per watt moet verbeteren. Dit geheugen zit op de chip zelf (on-die), wat een van de redenen is dat de Navi 21-gpu flink groter is dan Navi 10.
Bestaande gpu-ontwerpen hebben op de die wel enkele megabytes aan cachegeheugen (L1 en L2), maar dit valt in het niet bij de vele gigabytes die de framebuffer (vram) van een moderne videokaart telt. De grote kloof tussen deze twee wordt met Infinity Cache als het ware opgevuld, als een L3-cache die beter in staat is de gpu van voldoende data te voorzien en minder druk zet op de framebuffer.
AMD stelt dat de gebruikte 128MB Infinity Cache in combinatie met een 256bit-geheugenbus, ruim twee keer zoveel bandbreedte levert als een 384bit-geheugenbus. Dit betekent dat AMD deze smallere (en dus goedkopere) geheugenbus kan gebruiken voor high-end kaarten zoals de RX 6900 XT, zonder in te boeten op prestaties. Tegelijkertijd kan AMD dankzij deze aanpak wel de voordelen van een lager energiegebruik benutten, want geheugencontrollers die er niet zijn, verbruiken uiteraard ook niets.
Een dergelijke grote hoeveelheid cachegeheugen vereist wel een behoorlijk aantal transistors op de chip, wat de die-size en daarmee de productieprijs van de gpu wel omhoog drijft. Opvallend is dat AMD niet alleen op de RX 6900 XT en 6800 XT, maar ook op de RX 6800 kiest voor de volledige 128MB Infinity Cache. Het laagst gepositioneerde model van dit trio heeft dus de volledige hoeveelheid cache én dezelfde 16GB geheugen op dezelfde snelheid als zijn grotere broers.
De compute-units in RDNA 2 zijn ook onder de loep genomen, om ervoor te zorgen dat de clock gating nauwkeuriger geregeld kan worden en de hoeveelheid te verplaatsen data wordt beperkt. De aanpassingen aan de CU’s moeten er volgens AMD voor zorgen dat elke compute-unit 30 procent efficiënter met energie omspringt dan RDNA 1 deed.
Daarnaast is de vernieuwde architectuur geoptimaliseerd voor hogere kloksnelheden. De nieuwe Radeons behalen bij hetzelfde verbruik een 30 procent hogere kloksnelheid dan hun voorganger, aldus de fabrikant.
Raytracing en DirectX Ultimate
De nieuwe RX 6000-kaarten krijgen ondersteuning voor geavanceerde features, waaronder raytracing in DirectX (DXR), variable rate shading, mesh shaders, sampler feedback en ondersteuning voor DirectStorage. Op die laatste na zijn dit stuk voor stuk features die vallen onder DirectX 12 Ultimate, strikt genomen featurelevel 12_2. Hoewel AMD met de Vega-architectuur nog wel kon meekomen in ondersteuning binnen DirectX 12, bleef Navi 10 op hetzelfde featurelevel 12_1 hangen als zijn voorloper, terwijl de concurrentie niet stilzat. Tijdens de presentatie werd kort een demo van Dirt 5 getoond waarin variable rate shading geactiveerd was en werd geïllustreerd. Ook werden van diverse nog te verschijnen games stukken gameplay afgespeeld met daarin raytracing geactiveerd, waaronder Godfall.
Omdat Nvidia met de RTX 3000-serie alweer aan zijn tweede generatie videokaarten met hardwarematige ondersteuning voor raytracing toe is, waren de ogen wat dit onderwerp betreft des te meer op AMD gericht voor RDNA 2. AMD gaf tijdens de presentatie geen details over hoe raytracing op de komende gpu’s exact zal worden berekend, maar hardwaresupport is aanwezig in de vorm van één ‘accelerator’ per compute-unit en vermoedelijk speelt het Infinity Cache hierbij eveneens een belangrijke rol.
Smart Access Storage
Een andere technologie die tijdens de presentatie kort werd aangestipt, is AMD Smart Access Memory. Als fabrikant van zowel processors als videokaarten wil AMD graag deze twee beter laten samenwerken. De details hierover zijn nog spaarzaam, maar de informatie tot dusver wijst erop dat Ryzen 5000-processors directer het videogeheugen van RX6000-serie videokaarten kunnen benaderen, wat voor een lagere fragmentatie van vram moet zorgen en de prestaties ten goede zou moeten komen.