AMD kondigt zijn Instinct MI200-serie accelerators voor datacenters en supercomputers aan. Deze chips zijn gebaseerd op de CDNA 2-architectuur en beschikken over 128GB HBM2e-geheugen. Het zijn daarnaast de eerste gpu's met een multi-chip module-ontwerp.
AMD brengt aanvankelijk twee accelerators uit in zijn MI200-serie, zo maakte het bedrijf maandagavond bekend tijdens zijn datacenterlivestream. Het bedrijf komt met een AMD Instinct MI250x en MI250, die verschillen in het aantal compute units. De chips maken gebruik van de CDNA 2-architectuur, die is bedoeld voor gebruik in datacenters en supercomputers. AMD brengt later ook een MI210-gpu met PCIe-formfactor uit, hoewel daarvan nog geen specificaties bekend zijn.
De Instinct MI250-accelerators zijn de eerste gpu's met een zogeheten mcm-ontwerp, oftewel multi-chip module. Daarbij worden meerdere compute dies gecombineerd op een enkele chip. De MI250x en MI250 beschikken ieder over twee van deze CDNA2-dies, die worden geproduceerd op TSMC's 6nm-node.
MI200: 128GB HBM2e en maximaal 220 compute units
De MI250x beschikt over twee computemodules die ieder beschikken over 110 compute units, voor een totaal van 220 cu's. De MI250 krijgt op zijn beurt twee modules met 104 cu's, wat in totaal neerkomt op 208 compute units. Dit wordt op beide chips aangevuld met 128GB HBM2e-ecc-geheugen. De maximale kloksnelheid van beide varianten bedraagt 1,7GHz.
De accelerators krijgen daarnaast ieder vier HBM2e-controllers met een totale geheugenbandbreedte van 3,2TB/s. De MI200-gpu's krijgen verder acht Infinity Fabric-links van de derde generatie, die gebruikt worden om chips met elkaar te verbinden en memory coherence tussen verschillende cpu's en gpu's mogelijk maken.
De MI200-gpu's beschikken daarnaast over de tweede generatie Matrix-cores AMD, die bedoeld zijn voor het uitvoeren van fp64- en fp32-matrix-berekeningen voor hpc- en AI-toepassingen. Volgens de fabrikant zijn deze Matrix-cores tot vier keer sneller dan AMD's voorgaande Instinct MI100-accelerators. De MI250x krijgt in totaal 880 Matrix-cores en bij de MI250 ligt dat aantal op 832.
AMD Instinct MI250x en Instinct MI250 | ||||||||
Model | Compute units | Stream processors | Geheugen | Bandbreedte | FP64/FP32 vector | FP64/FP32 matrix | FP16/BF16 | Formfactor |
AMD Instinct MI250x | 220 | 14.080 | 128GB HBM2e (ecc) | 3,2TB/s | Tot 47,9Tflops (piek) | Tot 95,7Tflops (piek) | Tot 383Tflops (piek) | OAM |
AMD Instinct MI250 | 208 | 13.312 | 128GB HBM2e (ecc) | 3,2TB/s | Tot 45,3Tflops (piek) | Tot 90,5Tflops (piek) | Tot 362,1Tflops (piek) | OAM |
Piekprestaties: 'maximaal 47,9Tflops bij fp64'
Volgens AMD is de MI200-serie hiermee aanzienlijk sneller dan de eerste generatie Instinct MI100-gpu's, en ook sneller dan de concurrentie. De MI250x haalt FP64 Vector-prestaties tot 47,9Tflops. Nvidia's A100 zou bij dergelijke FP64-berekeningen bijvoorbeeld een rekenkracht van maximaal 9,7Tflops halen. Het bedrijf spreekt ook over FP64 en FP32 Matrix-piekprestaties tot 95,7Tflop/s en FP16- en BF16-prestaties van maximaal 383Tflops.
De eerste MI200-accelerators worden momenteel al geleverd aan het het Oak Ridge National Laboratory van het Amerikaanse ministerie van energie. De chips zullen gebruikt worden in de Frontier-exascalesysteem. Naar verwachting haalt die supercomputer piekprestaties van 'meer dan 1,5 exaflops'. Thomas Zacharia van het Oak Ridge National Laboratory vertelt dat een enkele MI200-gpu krachtiger is dan een volledige node uit de Summit-supercomputer. Hij meldt daarbij dat Frontier momenteel geïnstalleerd wordt en 'begin volgend jaar' online komt.
AMD kondigde zijn Instinct MI200-serie op maandagavond aan, gelijktijdig met zijn nieuwe EPYC Milan-X-serverprocessors met 3D V-cache. Het bedrijf gaf op maandag ook een voorproefje van zijn Zen 4-architectuur, die gebaseerd zal zijn op TSMC's 5nm-node en beschikbaar komt in EPYC-cpu's met verschillende core-types.