AMD introduceert een nieuwe versie van zijn MI300X-accelerator voor datacenters. Het bedrijf komt dit jaar met een MI325X-refresh, met sneller HBM3E-geheugen. Daarnaast verschijnt er volgend jaar een Instinct-gpu op basis van een nieuwe CDNA 4-architectuur.
De AMD Instinct MI325X-accelerator beschikt over 288GB geheugen, zo bevestigt AMD tijdens zijn Computex 2024-keynote. Dat is 50 procent meer dan de bestaande MI300X-gpu, die AMD vorig jaar introduceerde met 192GB vram. Ook de bandbreedte is met 30 procent opgehoogd naar 6TB/s, dankzij het gebruik van HBM3E-geheugen in plaats van HBM3. Daarbij claimt AMD dat de MI325X tot 30 procent sneller is dan de Nvidia H200 in fp16- en fp8-rekenwerk. Nvidia heeft inmiddels overigens al de opvolger van de H200 aangekondigd.
Volgens AMD kunnen fabrikanten tot acht MI325X-accelerators met elkaar combineren op een enkel serverplatform. Dat is volgens AMD goed voor ongeveer 10,4 petaflops aan fp16-rekenkracht. Daarmee ondersteunt een enkele server bovendien tot 2,3TB aan HBM3E-vram. De gpu's kunnen onderling met elkaar verbonden worden met een Infinity Fabric-verbinding met 896GB/s-bandbreedte.
AMD deelt tijdens een pre-briefing met journalisten geen details over hoeveel gpu-cores de chip beschikt. Mogelijk blijft dat aantal ongewijzigd ten opzichte van de huidige Instinct MI300X. Die heeft 304 compute-units, wat gelijkstaat aan 19.456 streamprocessors. De MI300X-chip bestaat uit acht CDNA3-gpu-chiplets die gebakken worden op TSMC's 5nm-node, met twee onderliggende I/O-dies op 6nm.
AMD zegt daarnaast dat het volgend jaar met een volgende generatie Instinct-gpu komt. Deze ondersteunt wederom tot 288GB HBM3E-geheugen, maar wordt geproduceerd op een 3nm-procedé. Daarbij krijgt die serverchip ondersteuning voor fp4- en fp6-rekentaken.