Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door Tomas Hochstenbach en Reinoud Dik

Nvidia RTX 3070, 3080 & 3090 Preview

Alles over de nieuwe generatie Nvidia GeForce

Ampere voor gamers: 10.000+ cores?

Het kloppend hart van de videokaarten uit de RTX 3000-serie is uiteraard de Ampere-architectuur. Niet geheel nieuw voor de complete gpu-markt, want we zagen Ampere al eerder in Tesla-kaarten voor servers, wel komt Ampere nu voor het eerst uit in GeForce-producten.

Verbeterde sm's, rt-cores en tensor-cores

De beloftes met de RTX 3090, 3080 en 3070 zijn groot: tot tweemaal de prestaties en 1,9 keer de efficiëntie van Turing-gpu’s. De tweede generatie RTX moet dit bereiken door de verbeteringen die een nieuwe generatie sm’s, rt-cores en tensor-cores hebben gekregen. Met technische details was Nvidia dinsdag nog spaarzaam.

Twee nieuwe gpu's: GA104 en GA102

We noemden eerder al dat de drie videokaarten die Nvidia vandaag heeft aangekondigd gebaseerd zijn op twee gpu’s: GA104 en GA102, waarbij de G en A respectievelijk staan voor GeForce en Ampere. Er is nog een grotere chip, de A100, die Nvidia vooralsnog niet in consumentenproducten toepast, maar die eerder dit jaar wel al in de Tesla A100 zat.

Als we de specificaties vergelijken, valt ten eerste op dat de GA102-gpu een stuk kleiner is dan GA100: hij bevat bijna de helft minder transistors. Dat komt enerzijds doordat hij minder streaming multiprocessors (sm’s) bevat, namelijk 82 in plaats van 108, maar ook doordat Nvidia de hbm2e-geheugencontroller heeft vervangen door een exemplaar dat met goedkoper gddr6x-geheugen werkt, waarover later meer.

GA100 GA102 GA104 TU102
Toegepast in Tesla A100 RTX 3080, RTX 3090 RTX 3070 RTX 2080 Ti
Productieproces 7nm TSMC 8nm Samsung 8nm Samsung 12nm TSMC
Transistors 54 miljard 28 miljard n.n.b. 18,6 miljard
Die size 826 mm² 627 mm² n.n.b. 754 mm²
Cuda-cores 6912 5248* 2944* 4352
TGP 400W 350W 220W 260W
Geheugen HBM2e gddr6x gddr6 gddr6

Tegen alle geruchten en zelfs specificaties van videokaartfabrikanten in beweert Nvidia dat de GA102- en GA104-gpu’s dubbel zoveel cuda-cores bevatten, namelijk 10496 stuks in GA102 en 5888 stuks in GA104. Op de conventionele manier is dat onmogelijk: zowel qua tdp als die size als transistors passen zo veel cuda-cores niet in de genoemde gpu’s.

De belangrijkste clue voor wat er aan de hand is, vinden we op een specificatiepagina die Nvidia na afloop van de stream online heeft gezet. Daarop staat dat de sm’s van de RTX 3000-serie elk twee fp32-rekeneenheden bevatten, ten opzichte van één bij alle voorgaande generaties.

In de documentatie van de A100-gpu vinden we een blokdiagram dat de interne structuur van een Ampere-sm toont. Voor een totaal van 64 fp32-units, vaak simpelweg shader units genoemd, zitten er vier clusters met elk zestien van die fp32-eenheden in één sm. Per cluster zijn er echter ook acht fp64-units geplaatst. Zeer waarschijnlijk heeft Nvidia die fp64-units uitgerust met de mogelijkheid om ook als dubbele fp32-unit te dienen, waardoor er effectief geen zestien maar 32 fp32-units per cluster aanwezig zijn, oftewel 128 stuks per SM.

Een Ampere-sm met 16x fp32 en 8x fp64 per cluster (links) versus een Turing-sm met alleen 16x fp32 (rechts).

Als deze hypothese klopt, beschikken de Ampere-gpu’s voor gamers over een enorme sloot fp32-rekenkracht. Een verdubbeling van de prestaties lijkt te optimistisch, aangezien andere delen van de chip (dispatcher, scheduler, caches, geheugenbandbreedte) vermoedelijk een forse bottleneck zullen opleveren, maar in potentie zouden we wel eens héél indrukwekkende gamingprestaties kunnen gaan zien.

Lees meer


Apple iPhone SE (2020) Microsoft Xbox Series X LG CX Google Pixel 4a CES 2020 Samsung Galaxy S20 4G Sony PlayStation 5 Nintendo Switch Lite

'14 '15 '16 '17 2018

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2020 Hosting door True