De RTX 5090 maakt gebruik van een nieuwe GB202-chip, die aan het hart van de videokaart staat. De gpu is gebaseerd op de nieuwe Blackwell-architectuur en beschikt over 92,2 miljard transistors, een toename van een kleine 21 procent ten opzichte van de voorgaande RTX 4090. Die toename is overigens afkomstig van een toename in de diesize; de GB202 heeft een chipoppervlak van 750mm², waar de AD102 uit de RTX 4090 nog een toch al vrij groot oppervlak van 608,5mm² besloeg.
Nvidia maakt opnieuw gebruik van 4nm
Daaruit valt op te maken dat Nvidia opnieuw gebruikmaakt van TSMC’s 4nm-procedé, zoals de chipmaker zelf ook bevestigt, hoewel daarover wel onduidelijkheid bestaat. Nvidia sprak eerder over het gebruik van een verbeterd N4P-procedé ten opzichte van de RTX 40-generatie. Tegelijkertijd noemt een document voor de media dat de nieuwe gpu is gebaseerd op dezelfde TSMC 4N-node als de vorige generatie.
Dit alles zal waarschijnlijk betekenen dat de GB202-gpu meer stroom zal gebruiken en bovendien lastiger zal zijn om te produceren; grotere chips betekenen, zeker op hetzelfde procedé, dat de yields lager zullen zijn. Daarmee zullen, in ieder geval op dit moment, minder geslaagde exemplaren van TSMC’s lopende band rollen.
Meer CUDA-cores en nieuwe SM-indeling
In de gpu-architectuur zelf heeft Nvidia enkele wijzigingen doorgebracht aan de streamingmultiprocessors. Deze SM’s zijn een kerncomponent van Nvidia’s gpu-architectuur, waarin bijvoorbeeld de CUDA- en Tensor-cores zijn ondergebracht. De volledige GB202-gpu heeft 192 van die SM's, hoewel in de RTX 5090 daarvan 'slechts' 170 bruikbaar zijn. Daarmee krijgt de videokaart 21.760 CUDA-cores, 680 Tensor-cores en 170 raytracingkernen.
Ook aan die kernen zelf zijn de nodige wijzigingen doorgevoerd. Voortaan ondersteunen alle CUDA-cores bijvoorbeeld zowel fp32- als int32-instructies. Bij de voorgaande generatie kon de helft van de CUDA-cores binnen een SM die twee berekeningen allebei uitvoeren, terwijl de andere helft alleen fp32 ondersteunde. In de praktijk betekent dit dat het aantal int32-units wordt verdubbeld. Dat moet vooral voordelig zijn wanneer een workload ‘address-limited’ is.
Tegelijkertijd kunnen de cores, net als bij de voorgaande generaties, niet tegelijkertijd fp32- en int32-berekeningen uitvoeren binnen dezelfde kloktik. Eén int32-instructie zorgt ervoor dat alle 32 CUDA-cores binnen een cluster alleen maar int32-rekenwerk kunnen uitvoeren gedurende de kloktik.
Verder heeft Nvidia ook de hoeveelheid L1- en L2-cache opgehoogd ten opzichte van de RTX 4090. De nieuwe 5090 beschikt over 21.760kB aan L1-cache en een totaal aan 98.305kB aan L2-cache, in beide gevallen om een toename van ongeveer 33 procent. Dat is een minder grote stap dan die tussen de RTX 30- naar de RTX 40-serie, toen de hoeveelheid L2-cache bijvoorbeeld met ruim 10 keer werd opgehoogd, maar desalniettemin een flinke toevoeging die de prestaties moeten opkrikken.
GDDR7-vram: hogere bandbreedtes en efficiënter
Verder stapt Nvidia met de RTX 50-serie over op nieuw GDDR7-geheugen, waar de voorgaande generatie over GDDR6X-vram beschikte. Deze nieuwere geheugenstandaard leveren hogere bandbreedtes op, terwijl ook de efficiëntie moet toenemen ten opzichte van de voorgaande vram-generaties.
GDDR7 is de recentste vram-standaard van Jedec en is gericht op betere prestaties bij relatief gezien minder stroomgebruik. Het nieuwe vram-type gebruikt zogeheten pam3-codering voor de dataoverdracht, waarbij drie verschillende spanningsniveaus worden gebruikt voor de transmissie van het signaal. Volgens Nvidia levert dat een onder andere betere signaal-ruisverhouding en een hogere kanaaldichtheid op. Het geheugen in de RTX 5090 haalt 28Gbit/s per pin, wat in combinatie met de uitzonderlijk grote 512bit-geheugenbus neerkomt op een bandbreedte van 1792GB/s. Daarmee ligt de bandbreedte fors hoger dan bij de voorgaande RTX 4090, die 1002GB/s haalde.
Nieuwe displayfeatures: betere Nvenc-encoding en DisplayPort 2.1b
Ook nieuw in de Blackwell-gpu’s is betere encoding en decoding van videobeelden. Deze zesde generatie Nvenc is volgens de gpu-maker twee keer sneller bij het decoderen van H.264-beelden, waarmee dat even snel moet gebeuren als bij H.265- en AV1-footage. Nvidia introduceert ook een Ultra High Quality-modus voor AV1, die een betere beeldkwaliteit oplevert tegenover langere encodeertijden.
Bovendien ondersteunt de nieuwe Nvenc-encoder nu ook het encoderen en decoderen van H.264- en H.265-beelden met 4:2:2-chromasubsampling. Dat betreft een soort tussenstap tussen 4:2:0 en 4:4:4 qua kleurcompressie en bestandsgrootte. Nvidia zegt met 'alle grote' ontwikkelaars van videobewerkingssoftware te werken aan integratie daarvan, zoals Premiere Pro, DaVinci Resolve en CapCut.
Ook het aantal Nvenc-eenheden binnen een gpu wordt opgehoogd. De RTX 5090 krijgt er drie, waar het RTX 40-topmodel er twee had. Het aantal Nvenc-encoders neemt echter ook deze generatie af bij de lager gepositioneerde RTX 50-kaarten; de RTX 5080 heeft bijvoorbeeld twee Nvenc-encoders.
Verder krijgt de RTX 50-serie ondersteuning voor DisplayPort 2.1b. Dat levert een hogere bandbreedte op van maximaal 80Gbit/s bij gebruik van de UHBR 20-transmissiemodus in combinatie met een compatibele DP80LL-kabel. In de praktijk betekent dit dat de RTX 50-serie hogere resoluties en framerates ondersteunt. Zo ondersteunt deze gpu-generatie 4k-schermen op 240Hz, zonder dat daarvoor displaystreamcompressie nodig is. Voorheen was dsc wel nodig voor die combinatie van resolutie en refreshrate.