Samsung toont GDDR7-vram met snelheden tot 42,5Gbit/s

Samsung deelt details van een verbeterde GDDR7-geheugenchip voor videokaarten. De modules moeten een bandbreedte van maximaal 42,5Gbit/s per pin halen. De capaciteit van de chips is 24Gbit, ofwel 3GB. De productie van het videogeheugen moet begin 2025 van start gaan.

SAmsung gddr7Het is volgens Samsung voor het eerst dat een fabrikant 24Gbit-GDDR7-ram ontwikkelt en het is voor zover bekend ook de hoogste snelheid die momenteel met GDDR7-vram gehaald kan worden. Het bedrijf zegt dat de standaardsnelheid van 40Gbit/s gehaald kan worden dankzij three-level pulse-amplitude-modulation. De vermelde snelheid van 42,5Gbit/s kan alleen gehaald worden 'afhankelijk van de omstandigheden', maar wat die omstandigheden zijn vermeldt de Zuid-Koreaanse techgigant niet.

Samsung 'valideert' het ontwerp van het videogeheugen dit jaar met klanten, ofwel gpu-fabrikanten, en is van plan om begin volgend jaar met de productie van de chips te beginnen. SK hynix begint overigens dit jaar al met de massaproductie van vergelijkbaar geheugen.

Het betreffende 24Gbit-geheugen maakt gebruik van dram dat op het 10nm-procedé gemaakt is. Een eerdere versie van dit procedé gebruikte Samsung ook al voor de huidige GDDR6-geheugenmodules, maar de vijfde generatie van dat productieproces moet volgens het bedrijf voor een 50 procent hogere dichtheid van de cellen zorgen. Verder past het bedrijf naar eigen zeggen verschillende technieken toe om de energiezuinigheid van de chips te verbeteren, waaronder 'clockcontrolemanagement, dual-Vdd-ontwerp en het verminderen van het stroomgebruik'. De energie-efficiëntie van het GDDR7-geheugen moet met 30 procent omhoog gaan.

Samsung en SK hynix demonstreren al langer varianten van het aankomende GDDR7-geheugen, tot dusver met een iets lagere geheugenbandbreedte. De standaard voor GDDR7-vram werd in maart van dit jaar vastgelegd en de eerste producten met het geheugen worden begin 2025 verwacht. Het grafische geheugen is bedoeld voor gpu's, zoals de vermeende RTX 5000-serie videokaarten, en voor AI-accelerators.

Update, 14.10: Samsungs statement over celdichtheid is aangescherpt, hier stond eerder GDDR5 vermeld, maar dit klopte niet.

Door Yannick Spinner

Redacteur

17-10-2024 • 13:55

26

Submitter: JWL92

Reacties (26)

26
26
19
4
1
5
Wijzig sortering
Dit zijn wel interessante chips, 3GB en 40 Gb/s met een 32-bit bus geeft 160 GB/ per chip. Oftewel:
  • 128-bit bus: 12GB met 640 GB/s
  • 192-bit bus: 18GB met 960 GB/s
  • 256-bit bus: 24GB met 1280 GB/s
  • 384-bit bus: 36GB met 1920 GB/s
  • 512-bit bus: 48GB met 2560 GB/s
Vul zelf maar in waar je de 70, 80 en 90 series zou kunnen plaatsen, en je ziet de potentie van deze chips!
De 5070 komt met 192-bit bus en 12GB (dus 2GB modules)
De 5080 komt met 256-bit bus en 16GB
De 5090 komt met 512-bit bus en 32GB.

Echter, het gat tussen 5080 en 5090 is zo groot (praktisch factor 2) dat daar nog wel een modelletje tussen past.
Dit zijn nog steeds geruchten, dus de specificaties zoals bus breedte moet je met een korreltje zout nemen.

Er zijn geruchten dat NVIDIA twee varianten van de 5080 wil gaan introduceren, waarbij de tweede variant een 384-bit bus en 24 GB zou hebben.

Persoonlijk lijkt me dat een idioot idee, gezien de verwarring die dat met zich meebracht toen ze 2 RTX 4080s wilden lanceren.

Hopelijk is het een incorrect bericht en is het bijvoorbeeld een RTX 5080Ti of RTX 5070Ti als ze dit pad willen bewandelen.
Ik denk dat het zal afhangen van de yields wat we krijgen.

Als de yield van de 5090 goed zijn lijkt mij een 5080 met 384-bit bus oninteressant vanuit nVidia's perspectief . Want daar moeten ze dan een 5090 voor opofferen. In dat geval lijkt me dat een 5080 met 256-bit bus met deze nieuwe GDDR7 chips realistischer is. Je krijgt dan een 256-bit bus met 1280 GB/s en 24GB VRAM. Misschien dat dat dan een 5080 Super wordt ofzo.

Als de yields van de 5090 tegenvallen dan lijkt me de 5080 met 384-bit bus wel een goede kans maken, maar dan zullen ze daar waarschijnlijk niet deze nieuwe snelle 3GB chips opzetten. Dus uiteindelijk zal die dan ook wel op 24GB uitkomen zoals je zelf ook al schreef. Aangezien het een afgedankte 5090 is kunnen ze dan ook wat meer cores activeren, dus dan voorspel ik dat dit een 5080 Ti zou worden.

Edit: bovenstaande gaat er vanuit dat de geruchten kloppen dat de 5090 een 512-bit bus zou krijgen.

[Reactie gewijzigd door frozen_fire op 17 oktober 2024 17:20]

Je kijkt er sowieso verkeerd naar, want GPU fabrikaten doen qua fabben niet aan xx80, xx70, etc, maar aan onderliggende chips, waar afhankelijk van yields steeds meer kernen uitgeschakeld zijn.

Dit maakt op de onderste rang van een chip gaan zitten vaak voordelig. Bijvoorbeeld de 3060Ti in de GA104 chipreeks. Dit omdat ze er wel minder geheugenchips op kunnen solderen, maar de geheugenbus is intrinsiek aan het chipdesign.
Ik weet niet meer welke reeks het was, maar om dezelfde reden was er een Radeon kaartreeks waar een paar er echt tussenuit sprongen als uitblinkertjes.

Turing
  • TU117: RTX 2050
  • TU106: RTX 2060, RTX 2060 SUPER, RTX 2070
  • TU104: RTX 2070 SUPER, RTX 2080, RTX 2080 SUPER
  • TU102: RTX 2080 Ti
Ampere
  • GA106: RTX 3050, RTX 3060
  • GA104: RTX 3060 Ti, RTX 3070, RTX 3070 Ti
  • GA102: RTX 3080, RTX 3080 Ti, RTX 3090
Ada
  • AD107: RTX 4050, RTX 4060
  • AD106: RTX 4060 Ti
  • AD103: RTX 4070, RTX 4080 8)7
  • AD104: RTX 4070 Ti
  • AD102: RTX 4080 Ti, RTX 4090

[Reactie gewijzigd door Halfscherp op 18 oktober 2024 19:42]

RTX5085 lets go!
Zijn de nieuwste M2 ssd's niet al sneller dan dit? Ik zie daar snelheden van +10GB/s en het memory is "maar" +40Gbit/s is ongeveer 5GB/s.
Wat mis ik hier? Kan de SSD dit maar heel kort of is het de random read/write of de latency die bij een SSD roet in het eten gooit?

Edit:
Dank voor het commentaar :) weer wat geleerd :)

[Reactie gewijzigd door RagEnigma op 17 oktober 2024 15:59]

Het is 40/42.5 Gbit/s per pin. Ik neem toch aan dat zo'n DRAM chip meer dan 1 datapin heeft. ;)
Per chip heb je meestal 32 datapins, dus 1280 tot 1380 GBits/s per device. Maar deze chips worden meestal in groepen aan een GPU gekoppeld. Dus de GPU heeft een databus met meerdere chips.

Op dit moment meestal tussen 128 bits tot 384 bits (oftwel 4 chips tot 12 chips)

Dus met deze nieuwe chips en een 384 bits bus tussen VRAM en GPU kom je dan op een theoretische bandbreedte van 15360 tot 16560 Gbits/s.

Oftwel 1920 GBytes/s tot 2070 GBytes/s.
Klopt. En de geruchten gaan dat de RTX 5090 een 512 bit geheugenbus krijgt. Dus deze kan in theorie 48 GB geheugen met een bandbreedte van 2720 GB/s krijgen.

[Reactie gewijzigd door Roland78 op 17 oktober 2024 21:11]

Ik vermoedt dat dat eerder een workstation GPU zal worden. Daar zie je VRAM sizes van 48 GB nu al met de ada varianten.

Ik weet dat er een vocale minderheid is die roept dat 16 GB te klein is, maar een GPU met 48 GB is zwaar overdreven voor het gaming segment. Ik denk eerder dat we richting de 32 GB gaan voor de high end en dat 24 GB de plaats in gaat nemen waar nu 16 GB gebruikt wordt.

Natuurlijk kan het ook zijn dat NVIDIA conservatief is en voor deze generatie op de 16/24 sizes blijft zitten.

Hopelijk zijn ze in ieder geval wel zo slim om niet meer met 8GB en 12 GB te werken in het middensegment.
Aaaaahhhh

Ik dacht al: er bestaan netwerkconnecties die sneller zijn; dat betekent dat er geheugen moet bestaan dat sneller is. :+
Ssd's werken met meerdere kanalen om dat te halen. Dat zal een gpu ook gaan doen. Dus 8 van deze chips om 24Gb aan vram te hebben. Daarnaast is de latency van ssds in microseconde en van dram.in nanoseconden , dus ook dat is een flink verschil.
Op dit moment hebben de top of the line consumer GPUs (RTX 4090/ RX 7900XTX) een bus met 384 bits.

Met de huidige VRAM component (GDDR6X voor de RTX 4090 en GDDR6 voor de RX 7900XTX) komt dat neer op een bandbreedte tussen VRAM en GPU van 1.01 Terabytes/s en 960.0 Gigabytes/s.

Dat is vele male wat een SSD kan presteren.

Sterker nog, als je gaat kijken naar data center GPU's dan gaan de VRAM bandbreedtes naar 2+ Terabytes/s (die gebruiken HBM geheugen chips met zelfs 1024 bits per device)
Een eerdere versie van dit procedé gebruikte Samsung ook al voor de huidige GDDR6-geheugenmodules, maar de vijfde generatie van dat productieproces moet voor een 50 procent hogere dichtheid van de cellen zorgen vergeleken met GDDR5
50% ten opzichte van GDDR5? Hoeveel ten opzichte van GDDR6? Of is dit een typfout?

En even ter bevestiging: Betekent een 50% hogere dichtheid een dichtheid van 1.5x, oftewel een oppervlak per cel (of cel + tussenruimte) van 2/3 ten opzichte van de eerste generatie?

[Reactie gewijzigd door Mitsuko op 17 oktober 2024 14:05]

Die zin is aangescherpt. Samsung refereert hier simpelweg naar de stijging van 16Gbit van GDDR6 naar 24Gbit van GGDR7. Beetje verwarrend aangezien die twee op papier allebei op 10nm gemaakt werden.
Die regel _gaat_ over GDDR6, niet 7 ;)
Dat wordt smullen met de 5090
Als die deze chips krijgt, maar lijkt me onwaarschijnlijk?
Volgens geruchten komt die kaart begin 2025 uit, en deze chips worden begin 2025 gemaakt volgens artikel...
Ik vermoed dat ze in de super/ti varianten zullen verschijnen
Och, Nvidia krijg thet vast voor elkaar met samsung voor hun 5090 release @ CES 25 ...
Die kaart is natuurlijk voor de happy few, maar je hebt zeker gelijk. Maar wat niet onbelangrijk is, is dat deze chip ook gewoon met goedkopere gpu’s gebruikt kan worden. Juist een kaart met een minigeheugenbus (denk in de categorie RX 6300) heeft er enorm veel profijt van als de geheugenchips in ieder geval snel zijn.
Dat is een klasse kaart waar alles zo goedkoop moet. Het nieuwste van het nieuwste gaat daar niet gebeuren, zelfs 3GB (het minimum bij deze chip) gaat daar niet gebeuren.
Mwa, het duurt nog wel eventjes voor er weer iets in dat segment komt. De RX 7300 schijnt 6GB op een 96-bit bus te krijgen, dus die wordt véél dikker dan de 6300.

Tegen de tijd dat er weer iets uitkomt met een 32-bit geheugenbus, zijn dit soort chips misschien wel een stuk voordeliger.
(verwijderd)

[Reactie gewijzigd door SubSpace op 18 oktober 2024 10:43]

Ik heb diverse videokaarten, die met ggdr6 geheugen zijn standaard het energie efficiëntst bij mijn gebruik.
De ggdr6x geheugens lock ik vaak op nvidia's factory testsetting van 5000 MHz, met een rtx 4070 of kaart met grotere busbandbreedte kun je dan nog steeds prima gamen, maar is de kaart koeler en vaak wel 40% energievriendelijker.

Ik ben benieuwd of ggdr7 adaptieve snelheids optimalisatie gaat krijgen.

Op dit item kan niet meer gereageerd worden.