Gerucht: AMD Instinct MI250X-accelerator krijgt 110 compute units en 500W-tdp

AMD komt mogelijk met twee varianten van zijn komende Instinct-accelerator op basis van de CDNA2-architectuur. Een van die varianten, de MI250X, zou beschikken over 110 compute units en een tdp van 500W.

ExecutableFix, een leaker die vaker correcte informatie over AMD-producten deelt, schrijft op Twitter dat AMD met Instinct MI250- en MI250X-accelerators komt. Die chips worden beide gebaseerd op de Aldebaran-gpu, op basis van de CDNA2-architectuur. De accelerators krijgen daarnaast een MCM-ontwerp, oftewel een Multi-Chip-Module. Daarbij worden meerdere chips gecombineerd, net als bij de chiplets met cpu-cores in AMD's Ryzen-processors.

De Twitteraar deelt verder de mogelijke specificaties van de MI250X-variant. Deze accelerator zou beschikken over 110 CDNA2-compute units per die. De chip zou verder een boostclock van 1,7GHz en 128GB HBM2e-geheugen krijgen. Er wordt ook een tdp van 500W genoemd en de MI250X zou wederom geproduceerd worden op 7nm. Er zijn nog geen specificaties bekend van de reguliere Instinct MI250, maar vermoedelijk zou dat model lagere kloksnelheden en minder compute units krijgen.

Volgens de leaker haalt de MI250X verder een F64-rekenkracht van 47,9Tflops en FP16- en BFloat16-prestaties van 383Tflops. VideoCardz schrijft op zijn beurt dat de chip ook een FP32-rekenkracht van 47,9Tflops biedt, maar ExecutableFix bevestigt dat niet concreet. Ter illustratie: de huidige Instinct MI100-accelerator haalt een FP64-rekenkracht van 11,5Tflops en FP16-prestaties van 185Tflops. Die chip is gebaseerd op de eerste generatie CDNA en beschikt over 120 compute units.

Er gaan al langer berichten rond over AMD's komende CDNA2-accelerators. Het Australische Pawsey Supercomputing Centre kondigde in juli aan dat het werkt aan een nieuwe supercomputer met MI-next-gpu's van AMD. Vermoedelijk gaat dat om de komende Instinct MI250-chips. Deze instantie meldde daarbij al dat de accelerators zouden beschikken over 128GB aan geheugen per gpu.

Het is nog niet bekend wanneer de nieuwe accelerators precies verschijnen. De AMD CDNA2-architectuur staat op de roadmap voor 2022, maar er is nog geen concrete releasedatum. De chips zijn bedoeld voor datacenters en supercomputers en zijn niet in te zetten als reguliere videokaart.

AMD Instinct Accelerators + Nvidia A100
Accelerator-naam AMD Instinct MI100 AMD Instinct MI250X AMD Instinct MI250 Nvidia A100
Architectuur 7nm, CDNA1 7nm, CDNA2 7nm, CDNA2 8nm, Ampere
Gpu-naam Arcturus Aldebaran (MCM) Aldebaran (MCM) GA100
Compute units 120 (7680 stream processors) 110 Minder dan 110(?) 108 sm's
(6912 CUDA-cores)
Gpu-boostclock ~1500MHz ~1700MHz Nnb ~1410MHz
FP16 Compute 185Tflops 383Tflops Nnb 78Tflops
FP32 Compute 23,1Tflops 47,9Tflops(?) Nnb 19,5Tflops
FP64 Compute 11,5Tflops 47,9Tflops Nnb 9,7Tflops
Formfactor PCIe 4.0 OAM Nnb PCIe 4.0 + SXM4
Tdp 300W 500W Nnb PCIe 40GB: 250W
PCIe 80GB: 300W
SXM4: 400W
Vram 32GB HBM2 128GB HBM2e Nnb 40GB: HBM2
80GB: HBM2e
Geheugenbandbreedte 1,230TB/s Nnb Nnb PCIe 40GB: 1,555TB/s
PCIe 80GB: 1,935TB/s
MXM4 40GB: 1,555TB/s
MXM4 80GB: 2,039TB/s
Introductiedatum November 2020 2022 2022 April 2020

Door Daan van Monsjou

Redacteur

24-10-2021 • 15:09

35 Linkedin

Reacties (35)

35
33
24
2
0
6
Wijzig sortering
Is het mogelijk om op deze kaarten te game? Gaat het dan beter performen in vergelijking met bijvoorbeeld een RTX3090 of RX 6900XT?
Een datacenter computing kaart heeft doorgaans geen aansluiting voor video-out, dus dat gaat niet werken.

Daarnaast lijkt het me financieel niet aantrekkelijk, met prijzen die voor soort kaarten op 5.000 tot 13.000 euro liggen.

Dit soort kaarten zijn niet voor de consument bedoeld, maar voor rekencentra en datacentra.
Verder lijkt me 500W-tpd ook niet erg geschikt om zelf te koelen en van een goede (consument) PSU te voorzien. :)

Is 500W-tpd overigens hoog of laag voor deze compute units? Vind het nog vrij hoog, maar als je ziet dat het meerdere chips zijn, valt het weer mee.

[Reactie gewijzigd door foxgamer2019 op 24 oktober 2021 19:17]

Is 500W-tpd overigens hoog of laag voor deze compute units? Vind het nog vrij hoog, maar als je betekend dat het meerdere chips zijn, valt het weer mee.
Durf ik niet te zeggen. Ik weet alleen dat de Nvidia A100-kaarten van hetzelfde type een TDP van 250 tot 400 Watt hebben, afhankelijk van welke versie je gebruikt.

Dit is de enige soortgelijke kaart waar ik ervaring mee heb, ik kan niks zeggen over de oudere MI100 of MI6/8 serie kaarten van AMD.
Is het ook niet moeilijk te vergelijken met andere fabrikanten? Intel en AMD hebben dacht ik verschillende manieren hebben om de TDP te bepalen. Van Nvidia weet ik het niet - gebruiken die niet ARM? Die zijn over het algemeen altijd wat zuiniger.
nVidia gebruikt voor deze kaarten zeker geen ARM. Dit zijn dezelfde cores en architectuur als ook in je GPU zit. Heeft met ARM verder niks te maken aangezien dat een architectuur voor CPUs is.n

En wat betreft efficientie zie je juist de afgelopen generaties (RDNA+) dat AMD voorloopt op nVidia. Gedeeltelijk ook door het betere procede natuurlijk (TSMC 7nm is beter dan Samsung 8nm wat dat betreft)

[Reactie gewijzigd door Darkstriker op 25 oktober 2021 10:08]

hoezo? 500 watt gpu is dik prima te poweren met een consumenten psu. Er zijn gewoon kwaliteit 1200 watt voedingen te krijgen voor normale bedragen.

koelen kan prima. Water is een optie bijvoorbeeld. Goedkoop? Nee, maar moet dat ook met zo'n kaart? Mensen die waterkoeling te duur vinden, hebben ook geen budget voor dit ding.

Vroeger had je ook 3x Titan X SLI, die produceerden met zn 3en veel meer hitte en verbruikten veel meer elektriciteit. Dat kon ook prima met genoeg radiatoren en een soortvan high end voeding.

Beide opstellingen zijn ongeveer even exotisch lijkt me

[Reactie gewijzigd door youridv1 op 25 oktober 2021 11:40]

Virtueel gamen misschien?
Dacht ik ook meteen aan. Hangen dit soort units niet in de rekencentra van Stadia, bijvoorbeeld ?
Stadia gebruikt inderdaad dit soort apparaten, custom-made door AMD, zie dit artikel.

Wat Stadia gebruikt lijkt gebaseerd te zijn op de RX Vega 56-serie uit 2017, maar dan dus custom made specifiek voor Google Stadia.
Dan even theoretisch, en totaal niet economisch relevant, zou je in een machine met deze compute unit dan niet een game kunnen streamen, vanuit een virtual machine, naar de machine zelf, en via de stream kunnen gamen op dezelfde machine ?
Prima antwoord, maar ik denk dat hij iets anders bedoelt.
Een situatie waarin er dus wél een video-out is en goed werkende drivers zijn.
4080 gaat door skalpers al 2000 euro kosten :+ . Die prijzen vallen dan wel mee
Bij Linus op YouTube had Antony een interessante truck: je kan de output van je moederbord gebruiken door een driver voor een notebook te gebruiken (waarbij de discrete GPU vaak ook via de geïntegreerde moet, bij normaal gebruik wordt de integrated graphics gebruikt om stroom te besparen). Maar dat was voor een mining GPU die van een basismodel was afgeleid. Of dat ook lukt met zo'n specialistische kaart, ik vermoed van niet.
Nvm het gebrek aan video-out. CDNA heeft geen grafische pipeline, enkel compute shaders. Hier kun je geen games op draaien.
Fout.

Je kunt met een APU de output van je moederbord gebruiken als passthrough. Er zijn ook talloze video's te zien op Youtube waar mensen allerlei kaarten, inclusief Tesla-GPU's maar ook diverse modellen mining-kaarten, met succes aan de praat krijgen om games mee te spelen.

Het gaat dan in de regel om NVIDIA-kaarten, en NVIDIA's drivers zijn méér dichtgetimmerd dan die van AMD. Het is dus absoluut mogelijk om het voor elkaar te krijgen, en een kwestie van tijd eer het gebeurt, al is het met 'gewoon omdat het kan' als reden.
Nee, dit zijn compute kaarten zonder video-output of driver-support voor games en de benaming gpu misstaat dan ook in het artikel
Op dit soort kaarten zit na mijn weten geen video output. Ook zullen er geen (game ready)drivers voor zijn.
Met wat hacks moet het kunnen, maar de prestaties per watt zijn voor games niet zo best. Het is een beetje als gamen op een 64-core CPU, best prima, maar op een 8-core met hogere clocks gaat het veel beter.
Al je het artikelen had gelezen, dan had je het antwoord al gehad, voodat je de vraag stelde, quote:
Het is nog niet bekend wanneer de nieuwe accelerators precies verschijnen. De AMD CDNA2-architectuur staat op de roadmap voor 2022, maar er is nog geen concrete releasedatum. De chips zijn bedoeld voor datacenters en supercomputers en zijn niet in te zetten als reguliere videokaart.
Blijkbaar ben je vergeten dat het wel degelijk mogelijk is gebleken om compute-kaarten zonder output in te zetten voor 3D-accelleratie. Je moet alleen een moederbord met display output en een APU bezitten.
Bij de CDNA kaarten hebben ze alles dat verantwoordelijk was voor grafische taken zoals, gaming, video acceleratie en toestanden eruit gesloopt, zelfs niet eens een video output. Je kunt er niet op gamen want je hebt geen output. Dit zijn kaarten puur bedoeld voor compute gerelateerde taken.

De 500W en de passieve aansluiting daartoe is puur afgaande van de enorme lucht die door een server kastje geperst wordt.
Gewoon. Vanuit nieuwsgierigheid; wat kost zo’n compute kaart eigenlijk?
De voorloper van dit model, de MI100 dus, kostte bij introductie zo'n 6400 dollar, oftewel ongeveer 5500 euro, per stuk. Van deze MI250 kon ik nog geen prijzen vinden, maar ik vermoed dat het in dezelfde orde van grootte zal zijn.

Dat is vrij goedkoop, als je het vergelijkt met een concurrent als de Nvidia A100, waar je afhankelijk van de versie tussen de 9000 en 13000 euro per stuk voor mag betalen.

[Reactie gewijzigd door wildhagen op 24 oktober 2021 15:44]

Het is een beetje oppassen met die flops. Dr zijn nogal wat soorten zoals F64-, en FP16- en BFloat16-.
Mijn laptopcomputer Intel(R) Core(TM) i5-6300HQ CPU @ 2.30GHz [Family 6 Model 94 Stepping 3] doet 13.49 Gflops. (based on Whetstone benchmarks)
https://setiathome.berkeley.edu/cpu_list.php

Hoeveel laptops gaan er in een AMD Instinct MI250X? Is dat circa 1000?

[Reactie gewijzigd door Bruin Poeper op 24 oktober 2021 16:55]

Ik dacht dat Whetstone FP16 was dus 383/0.01349=28391,4 meer

*0 verkeerd gezet :(

[Reactie gewijzigd door Damic op 24 oktober 2021 17:44]

Als je bedoelt 383Tflops/13,49Gflops, dan is dat =383Tflops/0,01349Tflops =28391

Dat maakt mijn laptop nog eens10x zieliger :(

Overigens heb ik aanwijzingen dat whetstone double precision is (64 bits)
http://web-hou.iapc.net/~MMC/Whetstone/Dwhet.f
Dan wordt de verhouding 47,9/0,01349 =3550

Maar ik zie ook dat whetstone niet bestaat uit de simpelste FP operaties: hij berekent log, sqr, exp, sin, cos, tan enzo. Dat is ander werk dan een simpele FP vermenigvuldiging.
Of je de whetstone Gflops dan nog 1 op 1 mag vergelijken met de Tflops die AMD Instinct MI250X-accelerator opgeeft...?

[Reactie gewijzigd door Bruin Poeper op 24 oktober 2021 18:13]

Ja had een 0 teweinig getypt :(

een AMD 3950X (5950x staat nog niet in de lijst) doet het beter dat is maar 2181 keer trager.

[Reactie gewijzigd door Damic op 24 oktober 2021 17:47]

Mmmh nieuwe kaart interface voor datacenter. Ha als ik het opzoek gebruikt nVidia dat al voor hun datacenter mppu's

https://146a55aca6f00848c...4f772f89584006f81f01f.pdf
Dus kunnen we die nu mixen en matchen? Ik zie dat het een open standaard is, maar het fijne weet ik er niet van.
In de toekomst misschien, weet niet 100% of nvidia deze standaard al gebruikt of een afgeleide ervan waarbij de connectoren verder of dichter bij elkaar staan of zelfs ander lay-out hebben.

In ieder geval gaat Intel met hun Ponte Vecchio van OAM conrectoren voorzien https://www.tomshardware....o-600w-oam-liquid-cooling
Is het niet zo dat ze dit soort kaarten inzetten voor firewalls? Dacht dat VMware hier mee bezig was.
Ja joh.

De hele enterprise markt bestaat uit Minen natuurlijk.

Op dit item kan niet meer gereageerd worden.

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee