Software-update AMD bevestigt mogelijke specificaties Navi 32- en Navi 33-gpu's

Een update voor AMD's ROCm-software heeft het mogelijke aantal compute units van AMD's komende Navi 32- en Navi 33-gpu's bevestigd. Deze gpu's zijn gebaseerd op de RDNA 3-architectuur en worden naar verwachting gebruikt in lager gepositioneerde RX 7000-videokaarten.

Het aantal compute-units in AMD's komende RDNA 3-gpu's staat in de broncode van een nieuwe AMD ROCm-update, merkte Twitter-gebruiker Kepler_L2 op. Hieruit blijkt dat de Navi 32-gpu beschikt over maximaal 60 compute units, zo is te zien in AMD's ROCm-repository op GitHub. Dat komt neer op 3840 streamprocessors. De Navi 33-chip moet 32 cu's krijgen, wat gelijkstaat aan 2048 streamprocessors.

Navi 32- en Navi 33-specs in ROCm

Eerder dit jaar gingen al geruchten rond over de Navi 32- en Navi 33-gpu's. Angstronomics, die vaker informatie over nieuwe AMD-producten deelt, stelde in augustus al dat de twee gpu's respectievelijk 60 en 32 cu's krijgt. Dat lijkt nu indirect bevestigd te zijn door AMD. Angstronomics stelde ook dat de Navi 32-gpu beschikt over 64MB Infinity Cache en een 256bit-geheugenbus. De Navi 33-chip zou 32MB cache en een geheugenbus van 128bit krijgen. Deze specificaties worden niet vermeld in de ROCm-update.

AMD kondigde eerder dit jaar zijn eerste RDNA 3-desktopvideokaarten aan. De AMD Radeon RX 7900 XT- en XTX-videokaarten krijgen een Navi 31-gpu, de hoogst gepositioneerde RDNA 3-chip die AMD uitbrengt. Die gpu heeft maximaal 96 compute units en 6144 streamprocessors. AMD heeft nog geen lager gepositioneerde videokaarten met Navi 32- of 33-gpu aangekondigd. Naar verwachting verschijnen die videokaarten vanaf volgend jaar.

Het is nog niet bekend in welke videokaarten de Navi 32 en Navi 33-chips gebruikt zullen worden. In de huidige generatie beschikken de Radeon RX 6900- en RX 6800-desktopvideokaarten over een Navi 21-gpu. De RX 6700-serie heeft een Navi 22-gpu. Lager gepositioneerde Radeon RX 6600-videokaarten hebben een Navi 23-chip.

Een Navi 31-gpu. Bron: AMD
Specificaties AMD RDNA 3-gpu's (Navi 32 en 33 op basis van geruchten)
Gpu Navi 31 Navi 32 Navi 33
Architectuur RDNA 3 RDNA 3 RDNA 3
Procedé TSMC N5 (gpu)
TSMC N6 (mcd's)
TSMC N5 (gpu)
TSMC N6 (mcd's)
TSMC N6 (gpu)
Compute units (max.) 96 60 32
Streamprocessors (max.) 6144 3840 2048
Geheugen 384bit (GDDR6) 256bit (GDDR6) 128bit (GDDR6)
Infinity Cache 96MB 64MB 32MB

Door Daan van Monsjou

Redacteur

26-11-2022 • 12:54

44 Linkedin

Reacties (44)

44
44
16
2
0
23
Wijzig sortering
meer betekent niet altijd beter. op deze manier houden ze wel de stroomverbruik binnen beperken.
meer betekent wel beter. Meer CUs op lagere clock is vaak efficenter dan weing CU op hogere core clock.

Kleinere dies op met weinig cores en hogere clocks is meestal vanwege kosten, niet zozeer vanwege efficientie. Een duurdere kaart met meer cores kan je vaak terugklokken, undervolten etc. Dan is die veel efficienter voor dezelfde performance dan een goedkopere kaart.

Een kleinere die met weinig cus heeft gewoon een beperkter performance ceilling maar is wel goedkoper te fabriceren.

[Reactie gewijzigd door PjotterP op 26 november 2022 14:24]

Nou nee eerder ergens is omslagpunt en of ze ideale,punt gekozen hebben geen idee.
Je kan helaas alleen met andere keuze vergelijken.
Als 4060 het beter doet dan mogelijk de chip te klein gekozen. Als de klok flink omhoog moet buiten sweetspot.
Neem de AMD 6000 serie als voorbeeld. De RX6800 is een relatief laag geklokte maar met veel CU’s uitgeruste kaart.

De RX6700 kwam hier op gepaste afstand onder te staan. Echter werd het gemis aan CU’s gecompenseerd met een flink hogere kloksnelheid. Onder de streep ontliepen de kaarten elkaar qua verbruik een stuk minder dan dat je aan de hand van het prestatieverschil zou mogen verwachten.

AMD is ook gewoon een bedrijf. Niet ieder product is even goed als het andere, maar het gamma moet toch gevuld worden.
Waar ik vooral benieuwd naar ben, is welke kaarten van deze 7000-serie 16 PCIe stroken (lanes) hebben?

Bij AMD zag je bij de 6000-serie dat je dat pas had vanaf de 6700 XT en hoger, 66xx XT hadden er maar 8. Met een MoBo met PCIe 4.0 is dat geen probleem, maar met 3.0 wel.

Dus ik hoop dat ik mijn B450 MoBo nog niet hoef te vervangen. Met PCIe 3.0 x16 kun je nog prima de krachtigste kaarten gebruiken met een minimale impact op de beeldsnelheid.
Het grappige is dan in de praktijk PCIe 3.0 en 4.0 niks tot nauwelijks verschil geven op videokaarten.
Bij die heel "smal aangebonden" 6500 en ook de 6600-kaarten had je toch juist wel verschil?
Bij de 6500xt met pcei x4 was het wel een probleem. Bij de overige kaarten <3% van wat ik gezien heb.

https://www.tomshardware....-xt-pcie-gen3-gen4-tested
Hangt van het spel af, maar bij de 6600XT is PCIe 3.0 x8 ook een beperkende factor van meer dan een paar procent bij sommige spellen, hoewel dat nog redelijk binnen de perken blijft, dus met PCIe 3.0 zou men die kaart nog kunnen overwegen. Bij snellere kaarten kan het een groter probleem worden.
Vooral de 6500 en 6500 waar het echt heel erg is op pci 3.0, de 6600 valt nog mee, daar heb je het over een paar procent.
Dat is als je pci x16 hebt, amd gebruikt voor zijn midrange pci 8x, dat geeft op de 6600xt al een kleine bottleneck, dus als de 7600xt sneller is en ook pci 8x heeft, zal die bottleneck enkel groter worden.
Bijna alle high end draaien ook op x8 omdat al die mobos bifurcation doen omdat er in het systeem 2x nvme zit met een pcie interface
Dat klopt gewoonweg niet. De meeste moederborden doen 1x M.2 van de CPU (waar dedicated lanes voor aanwezig zijn) en 1-3x M.2 vanaf de chipset (wederom met dedicated lanes). Een minderheid van moederborden kan bifurcation tussen 2 (fysieke) x16 slots maar er zijn erg weinig moederborden op die je die primaire x16 slot kunt delen met M.2 slots. Dat gebeurt pas in de ultra-high-end waar je 5 of meer M.2 slots hebt. Gangbare middenklasse tot high-end moederborden met 2-4 M.2 Slots hebben er steevast 1x van de CPU en 1-3x van de Chipset. Over budgetmodellen niet eens te beginnen.
Zolang er 16 lanes gebruikt werden niet nee, maar bij die 8 lane kaarten maakte het wel wat uit.
Ja nee klopt, maar als het 16 lanes 3.0 of 4.0 is maakt het niks uit.
Het gaat ook niet om 3.0 vs 4.0 maar om 8 lanes op 3.0 en 16 lanes op 4.0, dat is een fors verschil (factor 4)
Nu is het met een 6600xt en pci 3.0 nog niet een probleem te noemen, je verliest een paar procent performance.
Heb zelf ook een b450 icm met een 6600XT, haal alsnog 11k timespy score, had zelfs de hoogste timespy score voor mijn combinatie van cpu en gpu ( ryzen 5 5600, 6600xt) ondanks de pci 3.0 8x ''bottleneck''.

Ik hoop wel dat de 7600xt 16 pci lanes krijgt, want die zal wel aanzienelijk gebottlenecked worden op pci 3.0 8x, aangezien de 6600xt al net minimaal gebottlenecked wordt op pci 3.0 8x
Op pcie 4.0 schakelde de firmware naar x8.
Op pcie3.0 schakelde de firmware keurig naar 3.0.

We de bandbreedte op x16 vast zetten in bios met aspm on.
Anders heb je x8 3.0 wat amper goed werkt
Hmm, navi 23 > 33 blijft op 32 cus, dus de 7600xt moet het dan puur uit architectuur en clocks halen...
Navi 23 heeft ook 32 cu's, maar amd heeft de cores aangepast voor dubbel zoveel FP32, net als nvidia gedaan heeft met ampere. In de praktijk gaat alles hier natuurlijk niet 2x zo hard van, maar AMD claimt 60% meer RT performance per CU, dus als raster daar enigszins in de buurt van zit dan gaat N33 het wel prima doen. Ben benieuwd.
Oooh nice, das dan weer mooi
Raster lijkt (gebaseerd op eerste resultaten) meer winst te hebben behaald dan RT, dus dat zit we snor :)
De extra shaders hebben geen eigen schedulers, wat betekent dat ze niet optimaal gebruikt kunnen worden. Ze zullen relatief vaak stilliggen omdat er geen geschikt werk voor ze klaarstaat. Dit is ook de reden waarom de verdubbeling van het aantal shaders een relatief lage prestatiewinst geeft.

Deze opzet is trouwens wat Nvidia ook heeft en wat AMD vroeger ook had. Ze zijn naar dat ontwerp teruggegaan, want blijkbaar is een niet-optimale benutting van de shaders voordeliger dan extra chip-ruimte opofferen aan schedulers.

[Reactie gewijzigd door Ludewig op 27 november 2022 11:25]

En TDP en snelheid van de I/O natuurlijk. Het is gewoon een zaak van bottlenecks er uit halen en afwachten waar nieuwe bottlenecks ontstaan.

Veel gebakken lucht in dit artikel. Dus de goedkopere kaarten worden minder krachtig? Veel verwachtingen die ik zonder glazen bol ook wel kan voorspellen. Ik vind concrete producten die te koop zijn interessanter. Het lijkt Tesla wel...
Nou busbreedte is wel een onderdeel wat belangrijk is bij 4K, deels een reden waarom Nvidia toch iets beter doet.
Nou nee infinity cache laat zien dat rauwe bandbreedteenorme energie verspilling kan zijn. Dat 4K wel sweetspot bij wat grotere cache zit omdat data textures ook mipmap groter hebben. Mogelijk dat de huidige infinity cache genoeg is om sweetspot aan de onderkant te benaderen , maar zou mogelijk wel wat groter kunnen .
Maar ja zou navi31 in 8K zonder upscaling zonder rt ook aardig meekomen.
Dat nv het beter doet in 4k 8k kan ook zijn dat nv het juist slechter doet in cpu bound omdat schadular software matig is. Tenzij verbeterd in rtx40 architectuur.
Maar ja is reviews afwachten.
Bamdbreedte is op zichzelf geen energieverspilling. Bandbreedte en cache zijn niet mutually exclusive. Doe mij maar liever beide
Gelukkig, de wattages in de 6000 serie zijn hoog zat, ik zat niet te wachten op een 200 watt 7600xt.
Eens, ik heb met de 6600 voor mezelf redelijk een sweet-spot gevonden, 100w voor de GPU, en nog ~30 ruimte voor geheugen etc... meer warmte en stroomverbruik hoef ik eigenlijk ook niet. Wat dat betreft had ik eigenlijk ook liever gezien dat ze de winst van de tsmc 6N node hadden omgezet in meer transistors, dan er gewoon meer clocks/voltage tegen aan te gooien. Transistors schalen lineair, clocks in principe ook, maar stroomverbruik stijgt kwadratisch met voltage..
hier idem, mijn 6600xt staat op 0.925mv 2350mhz, daarbij gebruikt die precies 102 watt onder full load.
Netjes hoor, mijn 6600 draait gewoon stock, misschien moet ik voor de grap eens kijken wat ik er uit kan krijgen kwa undervolt
undervolten is veilig en met de stresstest die in de AMD drivers ingebouwd zit kun je ook makkelijk uitproberen tot hoever je kunt gaan.
In mijn geval betekende het dat verbruik en temperatuur omlaag gingen, terwijl de clock speed automatisch omhoog ging.
Dank voor de tip, maar weet ik :) Mijn RX570 hiervoor draaide ook met uit mn hoofd bijna -150mv, en iets hogere clocks dan stock. Bij de 6600 heb ik de noodzaak nog niet zo gevoeld, en ik was er ook een beetje van uit gegaan dat navi 2 iets minder belachelijk uit de fabriek kwam dan polaris :)
Klopt wat opzich prima kan gezien de aanpassingen. De 7900XTX is vooral tdp limited qua clocks dus ik verwacht best aardige cloxksnelheden van de N33 chip moet toch wel 10-20% hoger kunnen dan de N31 nu laat zien. Dan heb je het over 2550-2700MHz wat ook wat sneller is dan de 6650XT nu dst samen met een betere architectuur moet voor leuke winst kunnen zorgen.
Ik hoop dat ze flink sub 400 Euro met navi 33 kunnen gaan.
Ik mag het hopen, navi33 wordt nauwelijks groter dan navi23 (RX 6600 t/m RX 6650XT) en wordt op TSMC 6nm gebakken, wat niet veel duurder is dan de 7nm waarop de navi33 wordt gebakken. Dat in tegenstelling tot navi31 en navi32, die flink meer CU's krijgen en op een duurder procedé worden gebakken (5nm) dan de vorige generatie. Al met al zal de prestatiesprong bij navi33 dus niet groot zijn, dus ik mag hopen dat de prijs ook niet veel hoger ligt dan die van de huidige RX 6600's.

Maar je weet maar nooit welke prijzen hardware-bakkers vragen...
Ze moeten sub 300 euros. Maar dat is wensen tegenwoordig.
Laat die 'midrange' van de 7000 serie maar snel komen, hopelijk dan wel beter dan een 3080 etc.
Waarom maken ze geen speciale fast lanes voor de snelle data en langzamere lanes voor de langzame data?
omdat dat de opzet van het protocol nodeloos ingewikkeld maakt. "Snelle lanes" kunnen perfect "trage" data versturen, dus waarom de boel complexer maken dan het al is |:(
Nou ja, complexer maken voor energie rendement natuurlijk.
een kaart trekt maar zoveel stroom als dat ze nodig heeft en het optimaliseren ervan zijn ze heel hard mee bezig. Er zijn in de pci-express standaard ook x8 x4 x2 en zelfs x1 sloten voorzien.
Ik bedoelde meer binnen de NAVI GPU architectuur. Maar ook die zullen wel veel slimmere oplossingen hebben dan dat ik even uit mijn onkundige mouw schudde. :)
Hoe moeilijk is het om een fatsoenlijk zuinig kaartje uit te brengen wat een upgrade is tegenover de oude series? Mensen gaan geen moederbord upgraden om een low budget kaart volledig te benutten.... Toch raar dat een 1030/1050 nauwelijks ingehaald zijn (*prijs meegenomen)

[Reactie gewijzigd door wortelsky op 27 november 2022 09:51]

Op dit item kan niet meer gereageerd worden.

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee