Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

SK Hynix ontwikkelt tweede generatie hbm2 met 50 procent hogere bandbreedte

SK Hynix heeft zijn hbm2e-dram aangekondigd. Deze opvolger van high bandwidth memory 2 biedt een vijftig procent hogere bandbreedte en een dubbel zo hoge capaciteit als hbm2. Niet bekend is wanneer de dram-generatie in massaproductie gaat.

SK Hynix' hbm2e biedt een snelheid van 3,6Gbit/s per pin voor een totale bandbreedte van 460GB/s per stack. De Koreaanse fabrikant stapelt acht 16Gbit-chips verticaal voor een stack, die daarmee een capaciteit van 16GB biedt. SK Hynix meldt dat het videogeheugen onder andere bedoeld is voor high-end gpu's, supercomputers, machine learning en systemen voor kunstmatige intelligentie.

Wanneer de Koreaanse geheugenfabrikant de massaproductie en levering van hbm2e start is niet bekend. In maart kondigde concurrent Samsung al zijn hbm2e-module aan. Deze heeft een wat lagere bandbreedte dan het aanbod van SK Hynix. AMD maakt voor zijn Vega-gpu's gebruik van hbm2 van SK Hynix. Nvidia gebruikt hbm2 voor zijn gpu's voor datacenters.

Hbm2e is een extensie van de hbm2-standaard. De specificatie van opvolger hbm3 moet nog dit jaar verschijnen en die standaard zou volgens SemiEngineering een bandbreedte van 512GB/s of meer bieden. De Jedec-standaardisatieorganisatie voor halfgeleiders werkt ook aan de hbm3+- en hbm4-standaarden, die waarschijnlijk in respectievelijk 2022 en 2024 gepubliceerd worden.

hbm2(e)-aanbod
SK Hynix hbm2e SK Hynix hbm2 Samsung hbm2e (Flashbolt) Samsung hbm2 (Aquabolt)
Capaciteit 16GB 8GB 16GB 8GB
Bandbreedte per pin 3,6Gbit/s 2,4Gbit/s 3,2Gbit/s 2,4Gbit/s
Bandbreedte per stack 460GB/s 370GB/s 410GB/s 307,2GB/s

Door Olaf van Miltenburg

Nieuwscoördinator

12-08-2019 • 11:12

28 Linkedin Google+

Reacties (28)

Wijzig sortering
Zijn er nog veel situaties waar videokaarten (waar ik dit geheugentype het eerst verwacht) echt sterk beperkt worden door geheugenbandbreedte?

De verschillen in prestaties tussen GPU’s lijken meestal niet verklaarbaar uit het feit dat de ene meer geheugenbandbreedte heeft dan de andere.

Op zich een mooie ontwikkeling hoor, maar ik vermoed dat we de vruchten er pas van gaan plukken als GPU’s op andere vlakken eerst weer grote stappen hebben gemaakt.
De Zen architectuur is ontworpen met HBM's in het achterhoofd. Als AMD het zover krijgt zou dat een flinke slag kunnen maken op gebied van laptops. Nvidia zou het dan nog wel eens lastig kunnen krijgen.
Navi bedoel je? Zen is een CPU architectuur daar beconcurreren amd en Nvidia elkaar niet echt.
Zen APU's zouden mogelijk in de toekomst HBM's onboard krijgen:

https://www.extremetech.com/computing/283668-amd-wont-launch-a-chiplet-based-apu-on-ryzen-matisse

Dat zou een videokaart overbodig maken, het enige minpunt van APU's is nu nog geheugen bandbreedte.
Geheugenbandbreedte moet meegroeien met de GPU. Net zo met geheugengrootte, het heeft (voor het renderen van games) geen zin een instap GPU uit te rusten met 16GB HBM2, die kan dat nooit benutten.

Als je kijkt naar de x80 Ti kaarten van Nvidia van de laatste jaren, kun je zien dat geheugenbandbreedte elke keer omhoog is gegaan. Van 336 GB/s (980 Ti) over 484 GB/s (1080 Ti) naar 616 GB/s (2080 Ti).

En of er recente voorbeelden zijn van videokaarten die sterk beperkt worden door geheugen, maar dat zit dan vooral in de low-end. Nvidia heeft de GT 1030 in varianten met GDDR5 geheugen en DDR3 geheugen. GDDR5 heeft veel meer bandbreedte, en je ziet dat ook aan de prestaties, de variant met DDR3 is veel trager ook al is het dezelfde GPU, het komt helemaal door de geheugenbandbreedte.
Goed voorbeeld!

Ik denk echter dat het nog wel even zal duren voor we hbm op het gt1030 prijspeil tegen gaan komen.

Op de high end heb ik niet het idee dat de prestaties beperkt worden door geheugenbandbreedte hoewel dat natuurlijk wel zo zou zijn als de bandbreedte niet mee zou groeien met de prestaties.

In elk geval goed dat deze ontwikkeling zorgt dat de prestaties de komende tijd ook niet door gebrek aan bandbreedte beperkt hoeven te worden.
Ik heb ooit begrepen dat de snelheid van het geheugen een bottleneck is in datacenters bij het doorladen van grote hoeveelheden data.
De 448 en de 512 bit kaarten van Nvidia vroeger hadden een aanzienlijk betere prestatie. Echter waren de kosten van deze bus behoorlijk hoog.
Ik denk dat dit geheugen heel veel potentie in zich heeft icm de juiste GPU.

Ik ben zeker geen Nvidia aanhanger, maar AMD heeft alles behalve de snelste GPU's.
Ik vermoed als Nvidia dit geheugen had gebruikt bij de ontwikkeling van hun GPU's, er meer uit was gehaald dan AMD op het moment kan.
Ik denk dat dat best wel meevalt. Een RTX 2080 Ti heeft ruim 600GB/s aan memory bandwidth, en als ik hier zie dat een enkele 16GB stack 'maar' 460GB/s doet, zit je nog zeker niet op extreme hoeveelheden. Dan is de vraag of het nodig is nog niet beantwoord, maar vaak zie je dat prestaties toch aardig verbeteren als je de snelheid nog wat opkrikt. Logisch ook; los van of de bandbreedte de bottleneck is, gaan bij het verhogen van de kloksnelheid en verder gelijke omstandigheden de latencies ook naar benden. Minder wachten is meer performance.

De vraag is natuurlijk of nVidia voor hun 3000-series voor dit geheugen kiest, en ook wat AMD gaat doen, maar voor gaming is er in ieder geval zeker wel vraag naar hogere bandbreedtes. Ik denk dat we over 2 generaties van GPUs de grens van 1 TB/s wel gaan slechten, en dan zou 2 stacks van 8GB van dit snelle HBM2e geheugen best interessant kunnen zijn.

[Reactie gewijzigd door A Lurker op 12 augustus 2019 12:40]

Meer bandbreedte is altijd nodig alleen al om het processor geweld ten goede te laten komen.
Er zijn fabrikanten zoals Nvidia en amd waar om de zoveel tijd meer gpu cores in de gpu's komen.
Meestal een verdubbeling of een flinke toename ervan.Alleen daarom al heb je meer bandbreedte nodig.
Want de software moet met meer gpu's gaam comuniseren.En iets op het scherm toveren.
Ik vind het best goed dat ze daar om de zoveel tijd met iets nieuws komen.Men kan in computerland niet stilzitten.Stilzitten is achteruitgang.macpoedel heeft gelijk.
En als je meer bandbreedte hebt gaat dat allemaal sneller.

[Reactie gewijzigd door rjmno1 op 12 augustus 2019 13:19]

Voor datacenter GPU's is dit erg interessant.
Zie bv Vega 20 met 4 stacks en nVidia's V100 heeft er ook 4.

Voor gaming was het nut beperkt al liet Radeon VII wel mooie winst zien tov Vega 64 dat kwam grotendeels door de hogere clockspeeds en kleine andere tweaks. Nu was Vega sowieso op aardig wat plaatsen bottelnecked.
Met RDNA heeft AMD dat op kunnen lossen. Echter was Vega net als Fiji meer gericht op het datacenter en compute workloads. HBM2 zorgde ook voor een lager verbruik (met GDDR5X/6 was het nog meer geweest dan het al was) En qua compute power doet Vega 10 het erg goed. Vega 20 helemaal qua FP64 en ook andere zaken zijn sneller dan bij Vega 10 (volgens mij ook wat instructies voor Int4/8 zijn toegevoegd aan Vega 20).

Voor gaming kaarten is dit geheugen eigenlijk te duur. Alleen voor de snelste en duurste kaarten is het interessant. Dat was ook een beetje het probleem van Vega 10 het geheugen was gewoon eigenlijk te duur voor de gaming prestaties van de GPU.
Kan iemand mij het volgende uitleggen:

De Koreaanse fabrikant stapelt acht 16Gbit-chips verticaal voor een stack, die daarmee een capaciteit van 16GB biedt.

8x16GB = 16GB ?

Bedoelen ze niet 8x 2GB? Of begrijp ik het niet goed.

Edit: AH, mijn fout, verkeerd gelezen 8)7 . Ik las Gigabyte. Thanks voor alle reacties :D

[Reactie gewijzigd door soundvision op 12 augustus 2019 13:06]

1Gbit is een Gigabit. Er zitten acht bits in een byte, dus 8x16Gbit=16GB of 16 Gigabytes.
1 byte = 8 bit
8 * 16 giga bits = 16 GB
Gbit != GB. 16Gbit is gelijk aan 2GB. Uiteindelijk komt het neer op 8 x 2GB.

[Reactie gewijzigd door UnsteadyWind op 12 augustus 2019 12:36]

Je haalt zoals zovelen bits en bytes door elkaar. Gb = GigaBit, en GB = GigaByte = 8 Gb. Elke chip heeft een capaciteit van 16 Gb = 2 GB.
8Gbit = 1 GByte
dus inderdaad 8x2.
De Radeon 7 heeft toch ook twee stacks van elk 8GB en een gecombineerde bandbreedte van 1TB/s?

Thanks RShunter :)

[Reactie gewijzigd door procyon op 12 augustus 2019 12:00]

Nee, de Radeon VII heeft vier stacks van 4GB. https://i.redd.it/b5py4x766l921.png
De originele Vega-kaarten hadden er inderdaad twee, aan de linkerkant op de die maar die konden dus maar tot 8GB en een bandbreedte van 483.8 GB/s.
Betekend dit dat niet, hoe meer stacks hoe beter?
HBM stacks nemen ook plaats in, als je afbeeldingen van Vega 64 vergelijkt met Vega VII, dan zie je dat ze die extra HBM2 stacks alleen in dezelfde package hebben gekregen omdat de GPU gekrompen is (proces ging van 14nm naar 7nm): reviews: AMD's plannen voor 2019 - Vega en Ryzen op 7nm en meer laptops.

GDDR5/6 wordt elders op het PCB geplaatst en elektrisch verbonden, dat heeft ook nadelen maar het PCB kun je wel uitbreiden.

En zoals gezegd, het package groter maken, dat zal de consument moeten betalen. Sowieso is de Vega VII wel een voorbeeld van meer bandbreedte dan nodig om games te renderen.
Vega 7 is dan ook Radeon Instinct kaart met een bios voor consumenten, tezamen met een manier om een scherm op aan te sluiten.
Hoe meer stacks, hoe meer geheugen je maximaal kunt hebben en ook hoe meer bandbreedte, correct. Onthoud alleen wel dat HBM écht heel duur is in vergelijking tot GDDR5/5X/6, dus meer is niet altijd beter voor de portefeuille van de consument ;)
Is het ze ook al wat gelukt de productiekosten te verlagen? Zou mooi als het binnenkort op een prijspunt kan komen dat het ook toepasbaar word op de betaalbare videokaarten.
Ik ben bang dat dit voor een gedeelte een kip-ei probleem is. Het blijft erg duur tot het veel wordt gebruikt (kleine oplages maken is duur + de research kosten moeten nog betaald worden). Het wordt natuurlijk pas veel gebruikt als de prijs omlaag gaat.

[Reactie gewijzigd door MetalfanBlackness op 12 augustus 2019 18:18]

Maar zoals ik het begrijp zit de hoge prijs van HBM niet alleen in de oplage toch? Als dat het enige probleem was hadden we hetzelfde moeten zien met GDDR5x en GDDR6, want toen dat nieuw was begon het ook met een oplage van 0.
Bericht aangepast-

[Reactie gewijzigd door soundvision op 12 augustus 2019 13:07]


Om te kunnen reageren moet je ingelogd zijn


OnePlus 7 Pro (8GB intern) Nintendo Switch Lite LG OLED C9 Google Pixel 3a XL FIFA 19 Samsung Galaxy S10 Sony PlayStation 5 Smartphones

'14 '15 '16 '17 2018

Tweakers vormt samen met Tweakers Elect, Hardware Info, Autotrack, Nationale Vacaturebank, Intermediair en Independer de Persgroep Online Services B.V.
Alle rechten voorbehouden © 1998 - 2019 Hosting door True