Nvidia presenteert tijdens CES 2026 een nieuw platform dat de populaire Blackwell-chips voor AI-datacenters moet opvolgen. Het zogenoemde Rubin-platform bestaat uit zes nieuwe chips, waaronder een Vera-cpu en een Rubin-gpu. De AI-supercomputer moet in de tweede helft van 2026 op de markt komen.
Het Rubin-platform bestaat uit zes chips, namelijk de Vera-cpu, Rubin-gpu, de NVLink 6-switch, de ConnectX-9 SuperNIC, een BlueField-4-dataprocessor en de Spectrum-6-ethernetswitch. Nvidia claimt dat het platform vergeleken met Blackwell tot tien keer minder tokens vereist voor AI-inferenceopdrachten, ofwel het toepassen van een getraind model op nieuwe data, en tot vier keer minder gpu's vereist om bepaalde taalmodellen te trainen.
Volgens Nvidia is een dergelijk systeem in staat om met een Rubin-gpu een rekenkracht van 50 petaflops te behalen voor AI-inference tegenover 10Pflops met Blackwell. Dat is wel op basis van het eigen NVFP4-floatingpointformat. AI-training zou met 35Pflops mogelijk zijn tegenover 10Pflops met Blackwell, wederom op basis van het eigen dataformat. Een Rubin-gpu heeft een bandbreedte van 3,6TB/s en heeft 336 miljard transistors. Ter vergelijking: een RTX 5090 heeft een geheugenbandbreedte van 1,8TB/s en ongeveer 92 miljard transistors.
De Vera-cpu's van Nvidia bestaan uit 88 Olympus-cores gebaseerd op Arm64-architectuur. Deze processor heeft 227 miljard transistors en ondersteunt een geheugenbandbreedte tot 1,2TB/s, het dubbele ten opzichte van de voorgaande Grace-cpu's. Daarnaast wordt tot 1,5TB Lpddr5x-geheugen ondersteund, wat een verdrievoudiging is. De cpu ondersteunt PCIe Gen6- en CXL3.1-geheugen.
Racks en datacenters
De eerste cloudproviders moeten in de loop van 2026 toegang krijgen tot de nieuwe Vera Rubin-systemen van Nvidia. Onder meer Amazons AWS, Google Cloud en Microsoft gaan de nieuwe AI-datacenterproducten van Nvidia gebruiken.
Het gaat in het geval van Microsoft om een Vera Rubin NVL72-systeem, wat een unified datacenterrack is dat onder meer uit 72 Rubin-gpu's en 36 Vera-cpu's bestaat. Dit systeem heeft een totale gpu-geheugenbandbreedte van bijna 260TB/s en ondersteunt 800Gb/s via Nvidia's InfiniBand-ethernet.
Er komt ook een HGX Rubin NVL8-platform beschikbaar. Dit noemt Nvidia een serverboard met acht Rubin-gpu's dat via NVLink 6 moet werken met x86-gebaseerde AI-platforms.
:strip_exif()/i/2007968282.jpeg?f=imagenormal)
/i/2007968570.png?f=imagemedium)
/i/2007968568.png?f=imagemedium)
:strip_exif()/i/2007968298.jpeg?f=imagenormal)