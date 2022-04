Nvidia heeft tijdens een virtuele Editors Day meer details gedeeld over de GeForce RTX 3000-videokaarten. De gpu-ontwerper kondigde zijn RTX 3070, 3080 en 3090 dinsdagavond aan, maar onduidelijk was nog hoe Nvidia het aantal cuda-cores had 'verdubbeld'.

Een grote verrassing was bij de aankondiging van dinsdagavond dat Nvidia beweerde dat al zijn nieuwe RTX-videokaarten dubbel zoveel cuda-cores zullen hebben als geruchten eerder voorspelden. Zelfs Nvidia's boardpartners waren daardoor verrast. De uitgebreide preview op Tweakers beschreef de mogelijke optie dat Nvidia de fp64-units van de servergerichte Ampere-variant een andere bestemming heeft gegeven. Uit nieuwe informatie van Nvidia blijkt dat het anders zit.

Nvidia heeft het overgrote deel van de fp64-rekeneenheden wel degelijk verwijderd uit de consumentenversie van Ampere, zoals het ook bij Turing deed. Dergelijke berekeningen komen in gamingworkloads ook slechts sporadisch voor. Wat Nvidia wel heeft gedaan, is het cluster shaders dat int32-berekeningen kan uitvoeren óók geschikt gemaakt voor fp32. Elke rekeneenheid in dat cluster kan elke kloktik dus óf een fp32-berekening, óf een int32-berekening uitvoeren.

Van links naar rechts: sm's van Turing, de server-Ampere (GA100) en de consumenten-Ampere (GA102/GA104).

Hierin vindt Nvidia de rechtvaardiging om het aantal cuda-cores dat het opgeeft in de specificaties te verdubbelen: daarvoor hanteert het de definitie 'aantal fp32-eenheden'. De helft daarvan dient echter ook beschikbaar te zijn voor int32-instructies en bovendien treden er tal van andere bottlenecks op als je plots de fp32-rekenkracht verdubbelt. Gebruikers hoeven dus geen verdubbeling van de prestaties te verwachten, wat het verdubbelde aantal cores zou kunnen doen vermoeden. Hoewel de intensiteit van de diverse typen instructies volgens Nvidia flink varieert van game tot game, liet het zich op vragen van Tweakers toch een uitspraak ontlokken over de gemiddelde prestatiewinst. Die zou 'across the board' ruim 30 procent zijn ten opzichte van een ontwerp waarbij de int32-cores in z'n geheel geen fp32-instructies kunnen verwerken, zoals Turing.

Verder gaf Nvidia een officiële foto van het pcb van de RTX 3080 Founders Edition vrij. Dat is bijzonder kort: de stroomaansluiting die op de complete videokaart ongeveer in het midden zit, is aan het uiteinde van de grillig gevormde printplaat geplaatst. Hoe dan ook is er flink gepropt om alles passend te krijgen, getuige bijvoorbeeld de diagonaal geplaatste condensators, waarbij ook plaats moest worden gevonden voor tien gddr6x-geheugenchips. Eerdere AMD-kaarten met korte pcb's, zoals de Fury Nano, hadden onboard hbm-geheugen.

Tot slot sorteerde Nvidia vast voor op een matige verkrijgbaarheid van de nieuwe videokaarten, toch op zijn minst in het begin. Pas vorige week zijn de eerste productie-gpu's aan de diverse videokaartfabrikanten geleverd. Nvidia gaf aan dat de productie nu op volle toeren draait, maar het veel vraag verwacht.