Gerucht: AMD Instinct MI250X-accelerator krijgt 110 compute units en 500W-tdp

AMD komt mogelijk met twee varianten van zijn komende Instinct-accelerator op basis van de CDNA2-architectuur. Een van die varianten, de MI250X, zou beschikken over 110 compute units en een tdp van 500W.

ExecutableFix, een leaker die vaker correcte informatie over AMD-producten deelt, schrijft op Twitter dat AMD met Instinct MI250- en MI250X-accelerators komt. Die chips worden beide gebaseerd op de Aldebaran-gpu, op basis van de CDNA2-architectuur. De accelerators krijgen daarnaast een MCM-ontwerp, oftewel een Multi-Chip-Module. Daarbij worden meerdere chips gecombineerd, net als bij de chiplets met cpu-cores in AMD's Ryzen-processors.

De Twitteraar deelt verder de mogelijke specificaties van de MI250X-variant. Deze accelerator zou beschikken over 110 CDNA2-compute units per die. De chip zou verder een boostclock van 1,7GHz en 128GB HBM2e-geheugen krijgen. Er wordt ook een tdp van 500W genoemd en de MI250X zou wederom geproduceerd worden op 7nm. Er zijn nog geen specificaties bekend van de reguliere Instinct MI250, maar vermoedelijk zou dat model lagere kloksnelheden en minder compute units krijgen.

Volgens de leaker haalt de MI250X verder een F64-rekenkracht van 47,9Tflops en FP16- en BFloat16-prestaties van 383Tflops. VideoCardz schrijft op zijn beurt dat de chip ook een FP32-rekenkracht van 47,9Tflops biedt, maar ExecutableFix bevestigt dat niet concreet. Ter illustratie: de huidige Instinct MI100-accelerator haalt een FP64-rekenkracht van 11,5Tflops en FP16-prestaties van 185Tflops. Die chip is gebaseerd op de eerste generatie CDNA en beschikt over 120 compute units.

Er gaan al langer berichten rond over AMD's komende CDNA2-accelerators. Het Australische Pawsey Supercomputing Centre kondigde in juli aan dat het werkt aan een nieuwe supercomputer met MI-next-gpu's van AMD. Vermoedelijk gaat dat om de komende Instinct MI250-chips. Deze instantie meldde daarbij al dat de accelerators zouden beschikken over 128GB aan geheugen per gpu.

Het is nog niet bekend wanneer de nieuwe accelerators precies verschijnen. De AMD CDNA2-architectuur staat op de roadmap voor 2022, maar er is nog geen concrete releasedatum. De chips zijn bedoeld voor datacenters en supercomputers en zijn niet in te zetten als reguliere videokaart.

AMD Instinct Accelerators + Nvidia A100
Accelerator-naam	AMD Instinct MI100	AMD Instinct MI250X	AMD Instinct MI250	Nvidia A100
Architectuur	7nm, CDNA1	7nm, CDNA2	7nm, CDNA2	8nm, Ampere
Gpu-naam	Arcturus	Aldebaran (MCM)	Aldebaran (MCM)	GA100
Compute units	120 (7680 stream processors)	110	Minder dan 110(?)	108 sm's (6912 CUDA-cores)
Gpu-boostclock	~1500MHz	~1700MHz	Nnb	~1410MHz
FP16 Compute	185Tflops	383Tflops	Nnb	78Tflops
FP32 Compute	23,1Tflops	47,9Tflops(?)	Nnb	19,5Tflops
FP64 Compute	11,5Tflops	47,9Tflops	Nnb	9,7Tflops
Formfactor	PCIe 4.0	OAM	Nnb	PCIe 4.0 + SXM4
Tdp	300W	500W	Nnb	PCIe 40GB: 250W PCIe 80GB: 300W SXM4: 400W
Vram	32GB HBM2	128GB HBM2e	Nnb	40GB: HBM2 80GB: HBM2e
Geheugenbandbreedte	1,230TB/s	Nnb	Nnb	PCIe 40GB: 1,555TB/s PCIe 80GB: 1,935TB/s MXM4 40GB: 1,555TB/s MXM4 80GB: 2,039TB/s
Introductiedatum	November 2020	2022	2022	April 2020

Reacties (35)

NBAasDOGG 24 oktober 2021 16:21

Is het mogelijk om op deze kaarten te game? Gaat het dan beter performen in vergelijking met bijvoorbeeld een RTX3090 of RX 6900XT?

wildhagen

Datacenter

@NBAasDOGG • 24 oktober 2021 16:30

Een datacenter computing kaart heeft doorgaans geen aansluiting voor video-out, dus dat gaat niet werken.

Daarnaast lijkt het me financieel niet aantrekkelijk, met prijzen die voor soort kaarten op 5.000 tot 13.000 euro liggen.

Dit soort kaarten zijn niet voor de consument bedoeld, maar voor rekencentra en datacentra.

HollowGamer @wildhagen • 24 oktober 2021 17:57

Verder lijkt me 500W-tpd ook niet erg geschikt om zelf te koelen en van een goede (consument) PSU te voorzien.

Is 500W-tpd overigens hoog of laag voor deze compute units? Vind het nog vrij hoog, maar als je ziet dat het meerdere chips zijn, valt het weer mee.

[Reactie gewijzigd door HollowGamer op 26 juli 2024 21:03]

wildhagen

Datacenter

@HollowGamer • 24 oktober 2021 18:10

Is 500W-tpd overigens hoog of laag voor deze compute units? Vind het nog vrij hoog, maar als je betekend dat het meerdere chips zijn, valt het weer mee.

Durf ik niet te zeggen. Ik weet alleen dat de Nvidia A100-kaarten van hetzelfde type een TDP van 250 tot 400 Watt hebben, afhankelijk van welke versie je gebruikt.

Dit is de enige soortgelijke kaart waar ik ervaring mee heb, ik kan niks zeggen over de oudere MI100 of MI6/8 serie kaarten van AMD.

HollowGamer @wildhagen • 24 oktober 2021 19:20

Is het ook niet moeilijk te vergelijken met andere fabrikanten? Intel en AMD hebben dacht ik verschillende manieren hebben om de TDP te bepalen. Van Nvidia weet ik het niet - gebruiken die niet ARM? Die zijn over het algemeen altijd wat zuiniger.

Darkstriker @HollowGamer • 25 oktober 2021 10:07

nVidia gebruikt voor deze kaarten zeker geen ARM. Dit zijn dezelfde cores en architectuur als ook in je GPU zit. Heeft met ARM verder niks te maken aangezien dat een architectuur voor CPUs is.n

En wat betreft efficientie zie je juist de afgelopen generaties (RDNA+) dat AMD voorloopt op nVidia. Gedeeltelijk ook door het betere procede natuurlijk (TSMC 7nm is beter dan Samsung 8nm wat dat betreft)

[Reactie gewijzigd door Darkstriker op 26 juli 2024 21:03]

youridv1

@HollowGamer • 25 oktober 2021 11:37

hoezo? 500 watt gpu is dik prima te poweren met een consumenten psu. Er zijn gewoon kwaliteit 1200 watt voedingen te krijgen voor normale bedragen.

koelen kan prima. Water is een optie bijvoorbeeld. Goedkoop? Nee, maar moet dat ook met zo'n kaart? Mensen die waterkoeling te duur vinden, hebben ook geen budget voor dit ding.

Vroeger had je ook 3x Titan X SLI, die produceerden met zn 3en veel meer hitte en verbruikten veel meer elektriciteit. Dat kon ook prima met genoeg radiatoren en een soortvan high end voeding.

Beide opstellingen zijn ongeveer even exotisch lijkt me

[Reactie gewijzigd door youridv1 op 26 juli 2024 21:03]

Damic @wildhagen • 24 oktober 2021 17:15

Virtueel gamen misschien?

TStick @Damic • 24 oktober 2021 17:52

Dacht ik ook meteen aan. Hangen dit soort units niet in de rekencentra van Stadia, bijvoorbeeld ?

wildhagen

Datacenter

@TStick • 24 oktober 2021 18:08

Stadia gebruikt inderdaad dit soort apparaten, custom-made door AMD, zie dit artikel.

Wat Stadia gebruikt lijkt gebaseerd te zijn op de RX Vega 56-serie uit 2017, maar dan dus custom made specifiek voor Google Stadia.

TStick @wildhagen • 25 oktober 2021 16:31

Dan even theoretisch, en totaal niet economisch relevant, zou je in een machine met deze compute unit dan niet een game kunnen streamen, vanuit een virtual machine, naar de machine zelf, en via de stream kunnen gamen op dezelfde machine ?

vliegendehommel @wildhagen • 24 oktober 2021 18:10

Prima antwoord, maar ik denk dat hij iets anders bedoelt.
Een situatie waarin er dus wél een video-out is en goed werkende drivers zijn.

whiner @wildhagen • 24 oktober 2021 19:47

4080 gaat door skalpers al 2000 euro kosten

. Die prijzen vallen dan wel mee

uiltje @wildhagen • 25 oktober 2021 01:18

Bij Linus op YouTube had Antony een interessante truck: je kan de output van je moederbord gebruiken door een driver voor een notebook te gebruiken (waarbij de discrete GPU vaak ook via de geïntegreerde moet, bij normaal gebruik wordt de integrated graphics gebruikt om stroom te besparen). Maar dat was voor een mining GPU die van een basismodel was afgeleid. Of dat ook lukt met zo'n specialistische kaart, ik vermoed van niet.

__Rza @wildhagen • 25 oktober 2021 14:23

Nvm het gebrek aan video-out. CDNA heeft geen grafische pipeline, enkel compute shaders. Hier kun je geen games op draaien.

Pianist1985 @wildhagen • 25 oktober 2021 14:44

Fout.

Je kunt met een APU de output van je moederbord gebruiken als passthrough. Er zijn ook talloze video's te zien op Youtube waar mensen allerlei kaarten, inclusief Tesla-GPU's maar ook diverse modellen mining-kaarten, met succes aan de praat krijgen om games mee te spelen.

Het gaat dan in de regel om NVIDIA-kaarten, en NVIDIA's drivers zijn méér dichtgetimmerd dan die van AMD. Het is dus absoluut mogelijk om het voor elkaar te krijgen, en een kwestie van tijd eer het gebeurt, al is het met 'gewoon omdat het kan' als reden.

dasiro @NBAasDOGG • 24 oktober 2021 16:27

Nee, dit zijn compute kaarten zonder video-output of driver-support voor games en de benaming gpu misstaat dan ook in het artikel

jordynegen11 @NBAasDOGG • 24 oktober 2021 16:28

Op dit soort kaarten zit na mijn weten geen video output. Ook zullen er geen (game ready)drivers voor zijn.

Toettoetdaan @NBAasDOGG • 24 oktober 2021 16:54

Met wat hacks moet het kunnen, maar de prestaties per watt zijn voor games niet zo best. Het is een beetje als gamen op een 64-core CPU, best prima, maar op een 8-core met hogere clocks gaat het veel beter.

_Dune_ Moderator OeB

@NBAasDOGG • 24 oktober 2021 20:12

Al je het artikelen had gelezen, dan had je het antwoord al gehad, voodat je de vraag stelde, quote:

Het is nog niet bekend wanneer de nieuwe accelerators precies verschijnen. De AMD CDNA2-architectuur staat op de roadmap voor 2022, maar er is nog geen concrete releasedatum. De chips zijn bedoeld voor datacenters en supercomputers en zijn niet in te zetten als reguliere videokaart.

Pianist1985 @_Dune_ • 25 oktober 2021 14:51

Blijkbaar ben je vergeten dat het wel degelijk mogelijk is gebleken om compute-kaarten zonder output in te zetten voor 3D-accelleratie. Je moet alleen een moederbord met display output en een APU bezitten.

Verwijderd @NBAasDOGG • 24 oktober 2021 20:47

Bij de CDNA kaarten hebben ze alles dat verantwoordelijk was voor grafische taken zoals, gaming, video acceleratie en toestanden eruit gesloopt, zelfs niet eens een video output. Je kunt er niet op gamen want je hebt geen output. Dit zijn kaarten puur bedoeld voor compute gerelateerde taken.

De 500W en de passieve aansluiting daartoe is puur afgaande van de enorme lucht die door een server kastje geperst wordt.

Laurens-R 24 oktober 2021 15:32

Gewoon. Vanuit nieuwsgierigheid; wat kost zo’n compute kaart eigenlijk?

wildhagen

Datacenter

@Laurens-R • 24 oktober 2021 15:42

De voorloper van dit model, de MI100 dus, kostte bij introductie zo'n 6400 dollar, oftewel ongeveer 5500 euro, per stuk. Van deze MI250 kon ik nog geen prijzen vinden, maar ik vermoed dat het in dezelfde orde van grootte zal zijn.

Dat is vrij goedkoop, als je het vergelijkt met een concurrent als de Nvidia A100, waar je afhankelijk van de versie tussen de 9000 en 13000 euro per stuk voor mag betalen.

[Reactie gewijzigd door wildhagen op 26 juli 2024 21:03]

Bruin Poeper 24 oktober 2021 16:53

Het is een beetje oppassen met die flops. Dr zijn nogal wat soorten zoals F64-, en FP16- en BFloat16-.
Mijn laptopcomputer Intel(R) Core(TM) i5-6300HQ CPU @ 2.30GHz [Family 6 Model 94 Stepping 3] doet 13.49 Gflops. (based on Whetstone benchmarks)
https://setiathome.berkeley.edu/cpu_list.php

Hoeveel laptops gaan er in een AMD Instinct MI250X? Is dat circa 1000?

[Reactie gewijzigd door Bruin Poeper op 26 juli 2024 21:03]

Damic @Bruin Poeper • 24 oktober 2021 17:23

Ik dacht dat Whetstone FP16 was dus 383/0.01349=28391,4 meer

*0 verkeerd gezet

[Reactie gewijzigd door Damic op 26 juli 2024 21:03]

Bruin Poeper @Damic • 24 oktober 2021 17:36

Als je bedoelt 383Tflops/13,49Gflops, dan is dat =383Tflops/0,01349Tflops =28391

Dat maakt mijn laptop nog eens10x zieliger

Overigens heb ik aanwijzingen dat whetstone double precision is (64 bits)
http://web-hou.iapc.net/~MMC/Whetstone/Dwhet.f
Dan wordt de verhouding 47,9/0,01349 =3550

Maar ik zie ook dat whetstone niet bestaat uit de simpelste FP operaties: hij berekent log, sqr, exp, sin, cos, tan enzo. Dat is ander werk dan een simpele FP vermenigvuldiging.
Of je de whetstone Gflops dan nog 1 op 1 mag vergelijken met de Tflops die AMD Instinct MI250X-accelerator opgeeft...?

[Reactie gewijzigd door Bruin Poeper op 26 juli 2024 21:03]

Damic @Bruin Poeper • 24 oktober 2021 17:44

Ja had een 0 teweinig getypt

een AMD 3950X (5950x staat nog niet in de lijst) doet het beter dat is maar 2181 keer trager.

[Reactie gewijzigd door Damic op 26 juli 2024 21:03]

Damic 24 oktober 2021 15:17

Mmmh nieuwe kaart interface voor datacenter. Ha als ik het opzoek gebruikt nVidia dat al voor hun datacenter mppu's

https://146a55aca6f00848c...4f772f89584006f81f01f.pdf

Toettoetdaan @Damic • 24 oktober 2021 16:53

Dus kunnen we die nu mixen en matchen? Ik zie dat het een open standaard is, maar het fijne weet ik er niet van.

Damic @Toettoetdaan • 24 oktober 2021 17:12

In de toekomst misschien, weet niet 100% of nvidia deze standaard al gebruikt of een afgeleide ervan waarbij de connectoren verder of dichter bij elkaar staan of zelfs ander lay-out hebben.

In ieder geval gaat Intel met hun Ponte Vecchio van OAM conrectoren voorzien https://www.tomshardware....o-600w-oam-liquid-cooling

webgangster 24 oktober 2021 21:24

Is het niet zo dat ze dit soort kaarten inzetten voor firewalls? Dacht dat VMware hier mee bezig was.

Verwijderd @Err0r88 • 24 oktober 2021 20:47

Ja joh.

De hele enterprise markt bestaat uit Minen natuurlijk.

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (35)

Sorteer op:

Weergave: