Nvidia toont roadmap met AI-gpu's, Rubin-architectuur met HBM4 komt in 2026 uit

Nvidia-ceo Jensen Huang heeft tijdens Computex zijn nieuwe roadmap voor datacenterproducten aangekondigd. Het bedrijf is van plan om in 2026 met een nieuwe architectuur voor AI-gpu's te komen, genaamd Rubin. Die moet de recent aangekondigde Blackwell-gpu's opvolgen.

Tijdens zijn Computex 2024-keynote deelde Huang live Nvidia's datacenterline-up voor de komende jaren. Hij kondigde in eerste instantie aan dat Nvidia volgend jaar met een Blackwell-refresh komt. Die versie ondersteunt twaalf HBM3e-stapels, waar dat er momenteel acht zijn. Deze Blackwell Ultra-refresh moet dan ook een grotere geheugencapaciteiten gaan ondersteunen ten opzichte van de eerste Blackwell B200-gpu, die later dit jaar op de markt verschijnt en 192GB aan HBM3e-geheugen biedt.

De topman kondigde daarnaast zijn plannen voor 2026 en 2027 aan. Huang bevestigde dat de volgende generatie datacenter-gpu's van Nvidia de codenaam Rubin meekrijgt. De architectuur wordt vernoemd naar astronoom Vera Rubin. De fabrikant deelt vooralsnog weinig details over de nieuwe Rubin-gpu's, aangezien de huidige Blackwell-kaarten nog niet eens op de markt zijn. De fabrikant bevestigt wel dat de Rubin-gpu ondersteuning krijgt voor sneller HBM4-geheugen. Dat betreffen dan acht HBM4-stapels. Een jaar later, in 2027, volgt Rubin Ultra met twaalf HBM4-geheugenstapels voor een grotere totaalcapaciteit.

Huang bevestigde verder de komst van een nieuwe processor voor datacenters, die de huidige Grace-Arm-cpu's van het bedrijf moet gaan opvolgen. Ook van deze processors, die de codenaam Vera dragen, zijn nog weinig details bekend. Er komt daarnaast een Vera Rubin-superchip, in de praktijk een pcb waarop twee Rubin-gpu's worden gecombineerd met een Vera-processor, zoals het chipbedrijf eerder deed met zijn Grace Hopper-superchip. Dat platform krijgt ook ondersteuning voor nieuwe NVLink 6-switches, die bandbreedtes van 3,6TB/s moeten bieden.

Nvidia deelt geen concrete releasedata voor de nieuwe producten. Er gingen eerder al wel geruchten over de komst van een Rubin-gpu als opvolger voor Blackwell. Die geruchten stelden dat de chips eind 2025 in productie zouden gaan. Analist Ming-Chi Kuo meldde dat de gpu's geproduceerd worden op TSMC's N3-node, hoewel Huang dat zondag niet bevestigde in zijn keynote.

Nvidia Rubin Computex 2024
Nvidia-ceo Jensen Huang kondigt het Rubin-platform aan voor release in 2026. Foto: Tweakers

Door Daan van Monsjou

Nieuwsredacteur

02-06-2024 • 16:43

29

Lees meer

Reacties (29)

29
29
11
0
0
15
Wijzig sortering
De 1e Blackwell consumenten GPU's zijn nog niet eens aangekondigd of men praat alweer over een refresh en zelfs volgende generatie (Rubin).. Vooral gericht aan investeerders etc denk ik dan.. Voor ons als consumenten tweakers is nieuws over de nieuwe RTX 5000 Balckwell serie veel interessanter.. Hopelijk horen we daar ook snel wat over vanuit Nvidia zelf..
Als we de geruchten over AMD's RDNA4 moeten geloven dan heeft Nvidia daar voorlopig niks van te vrezen.. Intel loopt sowieso ook nog behoorlijk achter.. Helaas voor de concurrentie in de (highend) consumenten GPU markt en dus prijzen voor ons vrees ik.. Toch heb ik nog kleine hoop dat de RTX 50-serie een redelijk goede prijs/prestatie verhouding zal bieden.. Dat was namelijk met de vorige 30-serie ook zo na de eveneens te dure 20-serie (helaas gooide toen de cryptomining hype roet in het eten).. Als dat zogenaamde Nvidia tick-tock verhaal zou kloppen zouden we nu een beter betaalbare 50-serie moeten gaan krijgen..
30-serie was ook al overpriced hoor.
30-serie ook overpriced? Vind je? De RTX 3080 had een adviesprijs van €719,- bij launch, dat was niet overpriced imho.. Ik heb die in december 2020 nog kunnen kopen voor iets meer dan €800,-, nog net op tijd voordat de cryptomining waanzin begon met volkomen idiote prijzen als gevolg.. Er waren alleen tekorten vanaf het begin waardoor je wel wat moeite moest doen om er één te kunnen krijgen ergens, maar de adviesprijs was gewoon "normaal".. Vergeleken met wat ze daarna voor de RTX 4080 durfde vragen (verdubbeling in prijs, schandalig).. Ik verwacht niet dat de RTX 5080 straks ook voor rond de 700-800 te krijgen zal zijn zoals de 3080 bij launch, maar rond of zelfs onder de 1000 hoop ik wel op.. Vrees dat het ongeveer de prijs van de 4080 Super zal worden, dus rond de €1100..
Vergeet niet dat ook inflatie de prijs omhooggooit. Het geld watwe hebben is simpelweg minder waard, waardoor we dus meer moeten betalen voor hetzelfde.
ga er maar niet van uit dat de prijzen van vroeger ooit terug komen.
in plaats daarvan moet je maar hopen dat de loon net zo snel stijgt als de inflatie.
De inflatie is niet meer geweest dan 20% van 2020 naar nu, dus een grotere prijsstijging is daarmee niet goed te praten..
Dat kwam uiteindelijk door de opgeblazen prijzen vanwege tekorten en een crypto hype. Puur kijken naar de adviesprijzen en de performance was dat echt heel goed.

Een RTX3070 die qua performance vergelijkbaar was met een RTX2080ti voor 40% van de prijs.

[Reactie gewijzigd door MazeWing op 22 juli 2024 14:11]

.. Als dat zogenaamde Nvidia tick-tock verhaal zou kloppen zouden we nu een beter betaalbare 50-serie moeten gaan krijgen..
Tick-Tock was het proces van Intel (het ene jaar een kleiner productie proces en het andere jaar een verbeterde architectuur): Wikipedia: Tick-Tock (Intel)
[side note] De Engelse wiki heeft een beter overzicht met de tick-tocks: Wikipedia: Tick–tock model.

NVIDIA heeft net aangekondigd elk jaar een nieuwe architectuur te willen uitbrengen:
nieuws: Nvidia gaat jaarlijks nieuwe architectuur voor gpu's en AI-chips uitb...

[Reactie gewijzigd door djwice op 22 juli 2024 14:11]

jij voegt consumer GPU en server AI platformen als zijnde 1 geheel en gerelateerd? ik denk dat je wat enterprise informatie mist.....

de gaming platformen zijn RDNA, de enterprise zijn CDNA
https://www.amd.com/en/technologies/cdna.html
AMD is maar een speldenprik op de kaart van NVIDIA wat GPU's betreft.
nvidia 87% en amd 10% dat is niet echt een speldenprik...
AMD is maar een speldenprik op de kaart van NVIDIA wat GPU's betreft.
Gewoon een commentaar om maar te kunnen commenten? Zoals de vorige Hoe groter hoe beter, lekker stil? Zeg dan niks.
Het (extreem) grote geld zit in AI. Wat voor ons interessant is qua gaming GPU's is dat voor Nvidia en de investeerders al lang niet meer. Het zal me niks verbazen als ze het een tandje terug doen en we voorlopig nog niks in de RTX 5xxx series gaan zien. Zeker gezien AMD ook nog niet echt uit de verf komt met de 8xxx series.
Het zal me niks verbazen als ze het een tandje terug doen en we voorlopig nog niks in de RTX 5xxx series gaan zien.
Welke redenering zit daar achter? Alsof nvidia de gaming markt wil verliezen aan AMD en Intel door bewust wat terug te schakelen?

Heel de AI innovatie gaat gaming chips net een ongeziene boost geven. De volgende generatie consoles zullen RTX4090+ prestaties kunnen bieden in een kleinere koelbare chip.

Zo kan de PS6 in 2027/28 zonder veel problemen 10x sneller zijn dan de PS5. En dat is ruwe kracht, daar komt nog eens de AI generated frames bij, raytracing etc.

Dat wil zeggen dat we sinds lange tijd de meest merkwaardige game GPU upgrades gaan zien die vele mensen ooit in hun leven hebben meegemaakt.

En daar stopt het niet. Games zullen zelf AI infused worden. Denk aan levels die instant dor AI gegenereerd worden. Het einde van de campaign games die keer op keer een vast stramien volgen. Voor het eerst ga je in game kunnen communiceren met AI karakters.

Dus nee, ik denk niet dat Nvidia de (boomende) gaming business uit handen wil geven. AMD levert al alle consoles gpu’s dus wees maar zeker dat Nvidia ook niet de pc-gaming markt wil verliezen door ‘terug te schakelen’.

[Reactie gewijzigd door Coolstart op 22 juli 2024 14:11]

Kijk eens naar de omzetcijfers van Nvidia. 'PC' is maar 10% van de omzet. Waarbij Quadro en Geforce/RTX en PC-software helaas samengevoegd zijn. Dus het de werkelijke omzet voor RTX is nog kleiner, alleen hebben we geen exacte getallen nu. Dit toont wel aan dat gaming verre van 'booming' is voor Nvidia. Dat is AI en datacenters, dat is al jaren zo.

Gaming is een branche met verhoudingsgewijs veel mondige en veeleisende klanten met relatief weinig opbrengst. Dus vandaar dat het me niks zal verbazen als ze het op een lager pitje zetten of zelfs afstoten naar een andere BV. Zeker gezien de concurrentie op high-end niet in de buurt komt. Dat bij deze presentatie, bij een beurs die traditiegetrouw toch best veel gaming nieuwtjes showed niks wordt genoemd over RTX vind ik ook tekenend.
Dat is geen logisch argument. Wat wel een logisch argument zou zijn is dat Nvidia de beschikbare chips niet voor gaming doeleinden wil inzetten on zo de winsten van AI te maximaliseren want daar brengt dezelfde chip meer op.

Dat kan zeker maar dan moet Nvidia toezien dat andere spelers op de markt terrein gaan winnen op midagrange en high-end. Dat gaan ze goed maken op AI maar eens je terugschakeld en een markt uit handen geeft heeft uw merk wel imagoschade opgelopen.

Het ziet er toch gewoon naar uit dat de nieuwe RTX5000 op de markt komt begin 2025 en dat ze niets terugschakelen. Het is en blijft een markt van 2,6miljard Dollar.

Zeker nu AMD met de RDNA 4 architectuur de midrange gaming markt wil aanvallen met veel fps per $ zou het voor Nvidia heel slecht uitkomen om terug te schakelen.
Nvidia heeft zelf al gezegd geen 'graphics company' te zijn maar een 'AI company'. Ook niet heel verwonderlijk, zeker gezien de cijfers.

Chips verkopen als AI chips levert meer geld op dan de beste chip op de desktop hebben. Er wordt niet teruggeschakeld, de prioriteit ligt gewoon ergens anders. Nvidia verliest de gaming markt maar wat graag als het ze miljarden meer oplevert met verkoop aan bedrijven. Ik zou er zelf niet verbaasd van staan kijken als ze dat gewoon uit eigen beweging doen op de wat langere termijn. Of alleen AI chips maken en ontwerpen en de brakke ontwerpen, slecht gebinde en te veel afgelaserde chips dumpen als desktop GPU.

Wat betreft "Games zullen zelf AI infused worden. Denk aan levels die instant dor AI gegenereerd worden. Het einde van de campaign games die keer op keer een vast stramien volgen. Voor het eerst ga je in game kunnen communiceren met AI karakters."

Diablo 2 kon er al wat van, iedere dungeon anders, net als Elite, No Mans Sky, etc. Geen AI nodig. Campaign games hadden veelal al dynamisch verloop, zie Arma 2/3, IL-2, Ostfront, DCS, etc. Welk groot voordeel heeft AI hier? Sneller gegenereerd? Lekker belangrijk. Communiceren als in LLM? Vergeet niet dat je dat ook moet draaien.

[Reactie gewijzigd door lezzmeister op 22 juli 2024 14:11]

Nvidia verliest de gaming markt maar wat graag als het ze miljarden meer oplevert met verkoop aan bedrijven. Ik zou er zelf niet verbaasd van staan kijken als ze dat gewoon uit eigen beweging doen op de wat langere termijn.
Straffe taal. Technisch kan dat natuurlijk zijn maar dat is gewoon heel erg onwaarschijnlijk om voor de AI hype cycle uw bestaande gaming markt kapot te maken om op de korte termijn meer geld te verdienen.

Nu is de vraag groter dan het aanbod maar de AI-markt gaat sowieso ooit verzadigen. Intel, Microsoft, AMD, Apple, Tesla etc gaan sowieso goedkopere alternatieven zoeken, zelf bouwen of zelf op de markt zetten om de woekerwinsten van Nvidia te temperen.

Buiten het feit dat Nvidia veel aandacht schenkt aan AI zijn er wel 0,0 bewijzen dat ze de gaming markt gaan verlaten of verwaarlozen.
Er wordt niet teruggeschakeld, de prioriteit ligt gewoon ergens anders.
Raar, er wordt volgens u niet teruggeschakeld. Wat is het verschil tussen terugschakelen en de prioriteiten anders leggen? 2 lijnen verder ga je er wel vanuit dag ze die die afdeling wel gaan opdoeken als AI meer opbrengt. Wat is het nu?

Toch allemaal wat fuzzy als je het mij vraagt. Ik begrijp dat je twijfels hebt dat Nvidia nog gaming gpu’s gaat leveren maar tot hiertoe is daar nog geen echte indicatie van.
Een roadmap geven is toch niet zo heel bijzonder?
Ik ben geheel met je eens dat het niet interessant is voor de gaming consumenten, maar wel weer voor de mensen die bezig zijn met AI op dit niveau.
Vooral gericht aan investeerders etc denk ik dan..
Ik denk niet zo zeer investeerders, die hebben ondertussen wel so iets van "Shut up and make me MORE money!", dat vertrouwen mag er ondertussen wel zijn. Ik verwacht dat dit eerder voor de daadwerkelijke toekomstige (en huidige) klanten gaat zijn, welke oplossingen gaan bouwen op grote schaal met dit toekomstige product.

Je wil ruim van te voren weten welke design richting ze op gaan, zodat je je software daar alvast op kan gaan schrijven, zij het op veel langzamere hardware, tegen de tijd dat de software klaar is, is er hardware waarop het kan draaien. Dit lijken me ook de klanten die ruim voor release samples krijgen om mee te testen, voordat ze er duizenden van gaan bestellen...

En dan natuurlijk nog de andere hardware fabrikanten en solution spelcialisten, welke hardware en infra gaan maken voor dergelijke power blokken.
Hebben ze iets gezegd over consumentenGPU's? Ik zou die voor datacenters niet meer GPUs noemen, maar AI-versnellers.
Er zijn nog steeds een hoop GPU toepassingen in het datacenter die uitdrukkelijk niet AI zijn!
Het grote geld is in datacenters te verdienen. Zou mij niks verbazen als Nvidia hun consumenten-elektronica eens afschaalt/verkoopt.
Ik heb inderdaad al eens geruchten gehoord dat Nvidia misschien de GeForce afdeling zou kunnen afstoten. Probleem is dat GeForce in steeds grotere mate gebaseerd is op de datacenter kaarten...
Daarom heeft AMD 2 "GPU" "afdelingen" CDNA en RDNA om het gemakkelijk tehouden voor de ontwikkelaars.
GPUs zijn een miljardenbusiness voor Nvidia en ze hebben Gamestream draaiende te houden. Het lijkt me onwaarschijnlijk dat ze zich van die markt terug zullen trekken.
Dat ze een miljarden business hebben, is niet zo relevant. Vele bedrijven splitsen zich om zo beter te kunnen focussen op hun kernactiviteit.
Ik denk dat dit gaat gebeuren als ze niet abrupt gewoon stoppen met leveren voor de desktop.

Om zich te kunnen focussen op de kernactiviteit dat is 1, maar een grote 2e is 'unlocking shareholder value' zoals dat heet. Je gaat in plaats van 1 AI bedrijf met als nevenactiviteit GPU naar 2 bedrijven met 1 als maker van AI chips die toevallig ook goed zijn voor de desktop, en 1 die de resten van deze chips opkoopt (meer dan de helft onbruikbaar en onverkoopbaar aan de ChatGPT's, zuipt te veel bij x aantal Ghz, etc) en ze dan vervolgens als referentieontwerp zelf slijt en de chips slijt aan Sapphire, XFX etc. Dit zag je bij Paypal/eBay, CSC, HP, etc. Als het genoeg oplevert dan wordt het gedaan.

Op dit item kan niet meer gereageerd worden.