AMD brengt hoger geklokte Epyc-serverprocessor met 64 cores uit

AMD komt met de Epyc 7H12, een variant van de 7742-serverprocessor met 64 cores. De nieuwe variant heeft een tdp van 280W in plaats van 225W. De baseclock is daardoor 2,6GHz in plaats van 2,25GHz. Atos gaat de chip gebruiken in supercomputers.

De nieuwe cpu is de vierde Epyc-serverprocessor met 64 cores. Drie daarvan kondigde AMD ruim een maand geleden al aan. Het nieuwe model heeft een hogere tdp en daardoor een hogere baseclock, maar de maximale turbofrequentie is met 3,3GHz iets lager dan de maximale snelheid van de Epyc 7742, die tot 3,4GHz gaat. AMD geeft in de aankondiging geen verklaring voor dat verschil. Vermoedelijk is de all core turbo van de 7H12 wel hoger dan die van de 7742, maar AMD specificeert die snelheid niet.

Volgens metingen uitgevoerd door Atos doet de Epyc 7H12 het 11 procent beter dan de Epyc 7742 in de Linpack-benchmark. Atos gaat de 7H12 gebruiken in zijn BullSequana XH2000-platform voor supercomputers. Waterkoeling is vereist om de maximale prestaties uit de chip te halen, zegt AMD. De fabrikant maakt geen prijs bekend van de Epyc 7H12-variant. De Epyc 7742 die eerder werd uitgebracht heeft een adviesprijs van 6950 dollar.

Processor Cores/threads Kloksnelheid Max turbo L3-cache Tdp Prijs (per 1000)
Epyc 7H12 64 / 128 2,60GHz 3,30GHz 256MB 280W ?
Epyc 7742 64 / 128 2,25GHz 3,40GHz 256MB 225W $6950
Epyc 7702 64 / 128 2,00GHz 3,35GHz 256MB 180W $6450
Epyc 7702P 64 / 128 2,00GHz 3,35GHz 256MB 200W $4425

AMD Epyc 7H12

Door Julian Huijbregts

Nieuwsredacteur

18-09-2019 • 16:12

35

Reacties (35)

35
35
14
5
2
20
Wijzig sortering
Ik heb niet veel verstand van servers, maar dan is de 7742 toch alsnog een betere keus? Heeft een hogere boost, lagere tdp (dus minder warmte) en evenveel cores/threads. Dat de baseclock dan lager ligt zou geen verschil moeten maken omdat indien nodig er bij zware processen er toch geboost wordt naar een hogere clock. Of zie ik het helemaal verkeerd?
Corrigeer me als ik het verkeerd heb, maar: een base kan vastgehouden worden op alle cores onder een zware load, terwijl een boost alleen gedaan kan worden als één of enkele cores een zware load hebben en de anderen cores niet.

[Reactie gewijzigd door MaestroMaus op 23 juli 2024 13:11]

Boost is inderdaad 'onder voorbehoud', Anandtech heeft er net een heel stuk over getikt, vooral omdat AMD en Intel wat verschillend zijn hierin.

Zo lang de koeling en voeding strekt kan de turbo aan, en aangezien deze nieuwe chips een veel hogere TDP hebben, hebben ze ook meer marge om voor meerdere cores de turbo aan te zetten. Aangezien je server-CPUs niet koopt voor single-threaded performance, is dat een voordeel. Hoe hoog de precieze turbo-frequentie is die op de doos staat is dan minder interessant.

De base-frequency wordt in alle gevallen (gegarandeerd) gehaald (bij gespecificeerde TDP), en geeft een ruwe indicatie (baseline) wat je mag verwachten.
Daarnaast nog een leuk verschil tussen AMD en Intel. Een TDP is geen standaard. Amd lijtk te adverteren met de TDP op boost niveau waar intel dat op base niveau doet.

Nu weet ik niet hoe dat bij servers is.
Zover ik weet (maar ben niet helemaal zeker) geven beide TDP bij 'base clocks', maar hanteert Intel een 'gemiddelde belasting', en gaat AMD voor totale max. Linkje wederom naar de overburen, die hier ook Intel aan het praten hebben.

In het geval van Intel kun je er zelfs op 'stock' goed overheen gaan (met coins minen bijvoorbeeld) maar in alle gevallen heeft je CPU meer speling dan de TDP, zeker voor korte tijd. (bij Intel ingesteld op je moederbord via PL2)
Dit is Intel beschrijving van TDP:
Thermal Design Power (TDP) represents the average power, in watts, the processor dissipates when operating at Base Frequency with all cores active under an Intel-defined, high-complexity workload
Wat Intel daar meet is geen gemiddelde belasting, maar de gemiddelde warmte afgifte tijdens een complexe workload die alle cores belast op inderdaad de baseclock.

Bij AMD's bepaling van het TDP komt belasting (of verbruik) niet eens voor.

Dit is hoe AMD's Robert Hallock hun huidige TDP formule uitlegt:
TDP is about thermal watts, not electrical watts. These are not the same.

TDP is the final product in a formula that specifies to cooler vendors what thermal resistance is acceptable for a cooler to enable the manufacturer-specified performance of a CPU.

Thermal resistance for heatsinks is rated in a unit called θca ("Theta C A"), which represents degrees Celsius per watt.

Specifically, θca represents thermal resistance between the CPU heatspreader and the ambient environment.

The lower the θca, the better the cooler is.

The θca rating is an operand in an equation that also includes optimal CPU temp and optimal case ambient temp at the "inlet" to the heatsink. That formula establishes the TDP.

Here's the TDP formula:

TDP (Watts) = (tCase°C - tAmbient°C)/(HSF ϴca)

tCase°C: Optimal temperature for the die/heatspreader junction to achieve rated performance.

tAmbient°C: Optimal temperature at the HSF fan inlet to achieve rated performance.

HSF ϴca (°C/W): The minimum °C per Watt rating of the heatsink to achieve rated performance.

Using the established TDP formula, we can compute for the 180W 1950X:

(56° – 32°)/0.133 = 180W TDP

tCase°C: 56°C optimal temperature for the processor lid.

tAmbient°C: 32°C optimal ambient temperature for the case at HSF inlet.

HSF ϴca (°C/W): 0.133 ϴca

0.133 ϴca is the objective AMD specification for cooler thermal performance to achieve rated CPU performance.

In other words, we recommend a 0.133 ϴca cooler for Threadripper and a 56C optimal CPU temp for the chip to operate as described on the box. Any cooler that meets or beats 0.133 ϴca can make this possible. But notice that power consumption isn't part of this formula at all.
Ik vind dit eigenlijk vreemd.

Voorbeeld:
Ik koop een Oven en die trekt maximaal 3500 watt. Dat betekend dat als ik zeker wil zijn dat ik geen probleem heb dat die oven op een aparte groep moet.

In het geval van intel heeft die oven 3000 watt. Waardoor ik bv nog een (kleine) waterkoker aan kan zetten. Maar helaas valt de helft van de tijd de stroom uit omdat de oven naar 3500 watt gaat en samen met de waterkoker is dat teveel.

Nu zal bijna niemand volledig zijn voeding belasten. Maar in theorie kan dat wel.
Maar dat is niet wat Intel zegt, echter maken veel gebruikers dat er wel van.

Wat Intel zegt bij bijvoorbeeld een 9900K:

Wij garanderen dat deze CPU tijdens een complexe All Core workload minimaal 3.6Ghz zal behalen wanneer jij als klant een koeler monteert die minimaal 95W kan verwerken tijdens deze workload.

Intel zegt nergens dat die cpu maximaal 95W zal verbruiken. Enkel dat de warmte afgifte op 3.6Ghz tijdens een complexe all core workload op de lange termijn maximaal 95W zal zijn. Nu is bij cpu's in de regel de warmte afgifte vrijwel gelijk aan het verbruik. Dus is het ook vrij logisch dat wanneer de cpu veel hoger geklokt wordt, bijvoorbeeld tijdens een turbo boost dat dan betere koeling is vereist en ook dat het verbruik tijdens die boost ook hoger is.

Als je dit wil vergelijken met een oven is het meer dat jij een oven koopt waarbij wordt aangegeven dat wanneer je op 200c gaat bakken deze oven maximaal 3000W zal verbruiken (ik noem maar even een getal), ga jij dan op 250c graden lopen bakken is het vrij logisch dat je over een stuk meer zal verbruiken dan 3000W.
Nee, je hebt een oven die gemiddeld 3 kW verbruikt... Net zoals je auto gemiddeld 12 km/liter haalt, maar als jij vol op het gas gaat staan kom je daar best bovenuit. Ze geven er geen garantie op he ;)
Een automaat werkt echter ook op gemiddeld vermogen. Een automaat van 16A zal nog niet meteen springen als je even 20A trekt, wel zal deze onmiddelijk springen bij een kortsluitvermogen. google op automaat karakteristiek

[Reactie gewijzigd door g4wx3 op 23 juli 2024 13:11]

Volgens mij is het andersom gespecificeerd (zie vorige Anandtech artikel):
-De beloofde levensduur wordt gehaald bij een max junction temperatuur*,
-Bij die max junction temperatuur hoort een max TDP, dus een maximaal aantal Joules per seconde (warmte),
-Bij die max TDP hoort een max base frequentie.

Wat gegarandeerd wordt, is dat bij die base freq de TDP niet overschreden wordt, dus de levensduur niet verkort.

Een gemiddelde game PC-CPU wordt over de tijd genomen maar voor een laag percentage belast.
Dan komt het met de levensduur redelijk in orde, en als die niet gehaald wordt :Ach, de consument gaat er toch niet vanuit dat die vijf jaar mee _moet_ gaan. De gemiddelde gamer koopt daarvoor toch al lang een nieuwe.

Daarom hebben consumenten CPU's turbo's: Door de lage gemiddelde belasting is er "levensduur-speling" over, om af en toe de max junction temperatuur te overschrijven en de levensduur daarmee te verkorten.

Voor supercomputers die bedoeld zijn om 100% van de tijd 100% belast te worden, is die 'sneller (s)lopende turbo mode' geen optie. Die is gewoonweg irrelevant.

Dus ze redeneren omgekeerd als de gemiddelde Tweaker;
-Tweaker: "Ik wil 15% overklokken, dus heb ik waterkoeling nodig".
-BullAtos / AMD:
*) "Als ik hetzelfde levensduur-budget heb bij waterkoeling ipv luchtkoeling, kan ik 24% meer Joules per seconde afvoeren dan met lucht bij gelijkblijvende max junction temperatuur.
*) Dus kan mijn TDP 24% omhoog.
*) Dan kan mijn frequentie √1,24 ≈ 11,6% omhoog; dus wordt 1,116 * 2,25gHz = 2,5gHz.
*) Dan, want het mag wat kosten, kies ik de allerbeste CPU's uit de bak (binning); die de hoogste levensduur halen. Omdat ik die met de hoogste levensduur kies, kan ik naar 2.6 gHz base.

*Een interessant embedded document van TI: Als je op 125°C Junction Temperatuur draait ipv. het gespecificeerde 105°C, gaat je processor 5x zo kort mee!
De "gemiddelde gamer die niet dood omvalt" zal hopelijk de helft van de tijd niet gamen; en hopelijk vreet het spel niet 100% van de tijd alle CPU op, maar laten we van dat laatste worst-case scenario wel even uitgaan.
In het geval van TI kan de junction temperatuur bij 50% van de tijd 100% gebruik dan van 105°C naar 110°C; en daarmee dus de TDP omhoog t.o.v. een "supercomputerachtige" 24/7 toepassing waar die 100% van de tijd op 105°C draait.

Een supercomputer doet snel $46 miljoen, als die was bedoeld voor 5 jaar maar al na 1 jaar kapot is, dan is de belastingbetaler niet blij.

[Reactie gewijzigd door kidde op 23 juli 2024 13:11]

Volgens mij relateer je nu in stap 2 direct TDP aan temperatuur, en dat werkt alleen als je koeler inderdaad TDP volgens specs afhandelt. De meeste koelers (in elk geval van slimme tweakers) kunnen ruim meer aan, ook geholpen door capabele ventilatie in de systeemkast. Daarom durven zowel Intel als AMD je een turbo te beloven.

Verder gaat je CPU zelden of nooit over die Tj heen, dan ben je em namelijk zo kwijt. Bij Ryzen houdt ie sowieso je temperatuur in de gaten tijdens boosten, en als je in de buurt van 'gevaarlijke' waarden (85 graden ofzo) komt dan klokt ie terug. Doet Intel ook al jaren, thermal throttling is niks nieuws.

Verder kun je best veel meer dan 280W afvoeren met een goeie waterkoeling, zoals overklokkers al sinds jaren bewijzen, en Intel met z'n W-3175X (PL2 510 Watt!) ook nu laat zien. Het grote probleem is dat verbruik vaak met de 3e macht van de kloksnelheid omhoog gaat vanaf een bepaald moment, en dan moet je economische keuzes maken.
Overigens ben ik benieuwd hoe je 100% belast definieert, want da's een gevaarlijk wespennest ;)
Daarom durven zowel Intel als AMD je een turbo te beloven.
Dat is het hele punt van mijn reactie:

Daarom durven zowel Intel als AMD thuis-consumenten een turbo te beloven! Die gaan niet zeuren over levensduur.
Verder kun je best veel meer dan 280W afvoeren met een goeie waterkoeling, zoals overklokkers al sinds jaren bewijzen,
Ook dat is exact het punt: Wat precies hebben die overklokkers bewezen over de levensduur? Meestal niets! "Overklokkers" mikken op max frequentie bij gelijkblijvende stabiliteit, server-gebruikers op max frequentie bij gelijkblijvende levensduur.
Overigens ben ik benieuwd hoe je 100% belast definieert,
Volgens mij is dat niet moeilijk: Als je vanuit de supercomputer / server gebruiker redeneert, zijn dat de omstandigheden waarbij de levensduur-factor 1 is; dus dat Tj gelijk is aan Tj_max, 100% van de tijd. Zie het document van TI.
Het grote probleem is dat verbruik vaak met de 3e macht van de kloksnelheid omhoog gaat
Dat gaat over stroomverbruik, niet over faal-modi. Wat ik probeer uit te leggen, is (zie ook artikel van Guy*) dat de faal-mode / levensduur tijdens het ontwerp-proces voor server processoren kennelijk belangrijker is dan stroomverbruik en frequentie; beide zijn een gevolg van bij welke temperatuur na hoe lange tijd de boel kapot gaat.

De tijd die het duurt voor de transistors door TDDB falen (hoewel te complex om zo simpel te modelleren) is geen machtsfunctie, maar een exponentiele functie van de temperatuur.

*Ed - Nagezocht, Intel's Guy Therien zegt letterlijk: "Enthusiasts of today are willing to take risks, and maybe don’t consider wear performance that is targeted for the general population" En het hele stuk vanaf "So through all that effort, we also came across an interesting problem that was happening on the server side. When we sell our parts, in respect to our internal tools, we do modelling to detemine how long they expected to last. " --> Levensduur is de belangrijkste ontwerp-parameter aan het begin van hun proces, niet TDP of freq!

Ed2 -
Volgens mij relateer je nu in stap 2 direct TDP aan temperatuur
Even in mijn geheugen graven, maar volgens mij doet de 3e klas formule Q=c * m * ΔT dat - in zeer vereenvoudigde vorm. In een ander artikel van Anandtech stond geloof ik uitgelegd dat Intel-TDP ervanuitgaat, dat je al die Joules aan de kant van de hittekoeler afvoert. Dus een slimme moederbord-bouwer kan Q en dus ΔT nog wat verhogen door langs het moederbord af te voeren, dat is denk ik de enige manier om de directe relatie tussen temperatuurverschil en TDP te omzeilen.

Maar inderdaad, als ΔT geljk is aan T1-T2, dan verhoog je ΔT (dus TDP dus base-freq) door T2 te verlagen, en dat is wel wat een goede (water)koeling doet ja.

[Reactie gewijzigd door kidde op 23 juli 2024 13:11]

Dit gaat om supercomputers die uren, dagen of in sommige gevallen zelfs weken aan een probleem rekenen. Dan maakt de boost die het een paar seconden vol houdt niks meer uit. Van 2,25 naar 2,60 GHz betekend 15% meer performance, oftewel een dag minder per week.
De kloksnelheid waarop 'ie daadwerkelijk draait, is sterk afhankelijk van het TDP. Meer TDP staat dus gelijk aan meer rekenkracht. Daardoor zal deze processor waarschijnlijk toch een stuk betere benchmarks neerzetten dan de 7742. Wat de max. boost is, is niet zo relevant, als je alle kernen gebruikt zit je daar meestal toch ver vandaan.
Een hogere TDP is niet per definitie meer rekenkracht. In dit geval wel aangezien het om een zelfde soort processor gaat uit dezelfde serie en productie.

Zoals jij het stelt zal een oude itanium door een veel hogere TDP beter kunnen presteren dan deze Epyc.
Dus je opmerking behoeft wat nuancering/aanpassing.

[Reactie gewijzigd door jqv op 23 juli 2024 13:11]

Dat bedoel ik inderdaad niet. Dus nog even om het voor het publiek te verduidelijken: In het verleden lag de snelheid van een processor vast, en was het TDP puur een eigenschap, net als bijvoorbeeld het aantal pinnetjes of het gewicht. Moderne processoren als deze, zien TDP als een budget dat ze kunnen gebruiken om de kloksnelheid te boosten. Op het moment dat je het TDP verhoogt, gaat de processor dan ook meer boosten.
Voor Server cpu's heb je zeker gelijk daar fabrikanten van Server hardware zich meestal vrij strak aan de gespecificeerde TDP's houden, waardoor TDP en verbruik normaliter zeer dicht bij elkaar liggen als je naar de langere termijn waarden kijkt. Daardoor kun je inderdaad vrij goed stellen dat je TDP als een budget mag zien dat verbruikt kan worden, maar waar in de regel bij servers niet overheen gegaan zal worden (tenzij zeer kortstondig).

Bij consumenten machines is dat echter wel anders, zeker in machines gebouwd rondom componenten gericht op de zelfbouw markt houd bijna geen moederbord fabrikant zich aan de TDP richtlijnen van Intel waardoor je bij K Sku's van Intel vrijwel altijd flink meer verbruik ziet dan dat je bij een TDP van 95W zou verwachten. Bij een 9900K zijn waardes van 110W tot 160W zonder overklok afhankelijk van het type stresstest niet ongewoon op "Stock" settings (Niet de door Intel geadviseerde stock settings, maar stock setting bepaald door de mobo fabrikant). Ga je overklokken dan gaat het verbruik nog een stukje verder de lucht in.

Ook bij AMD zie je bij de 3000 serie TDP overschrijdingen, waar dat bij eerdere series vrijwel niet het geval was.

Zo zit de 3700X (TDP van 65W) vrijwel constant op een verbruik van +-90W en bij de 105W Sku's zie je dit naar de 140W kruipen zonder zaken als PBO aan, dan kan het zelfs nog een stukje hoger oplopen.

Waarom AMD hiervoor gekozen heeft snap ik eigenlijk niet direct, ik vond het altijd zeer prettig dat je er bij AMD eigenlijk vanuit kon gaan dat TDP = gelijk aan lange termijn verbruik onder load. Nu lijkt dit niet meer te kunnen.

Ga je af op het opgegeven TDP van beide fabrikanten en installeer je koelers die exact de opgegeven waarde van het TDP kunnen verwerken ga je bij zowel Intel als AMD niet de maximale performance uit je cpu halen.
Wist niet dat die techniek al oud was, maar ik kan me inderdaad voorstellen dat een nucleaire processor (kernprocessor?) sowieso best veel warmte zal kunnen veroorzaken.
Of bedoel je een Itanium? :P
Dat laatste.

Spellingcontrole is soms leuk... 8)7

[Reactie gewijzigd door jqv op 23 juli 2024 13:11]

In dit soort supercomputers draaien cpu's 99% van de tijd op zijn base clock
Ligt vooral aan de usecase van de servers. Ze dienen allemaal een doel, waar de hoger geklokte servers niet tijdelijk hogere kloksnelheden behaalt maar zelfs langduring.
De boost-clock bij ZEN2 CPUs heeft betrekking op de pieksnelheid die een enkele core kan halen en die je dus vooral in single-threaded workloads zal zien. Zodra je alle cores lekker laat zweten, is de boost-clock niet relevant meer en zul je dichter in de buurt van de base-clock zitten. Dus voor servers die continu een zware multithreaded load trekken zal deze CPU erg geschikt zijn, ondanks de lagere boost-clock.
Dat zie je helemaal goed maar 64 cores op een die is best veel.
Hij gebruikt meer wattage en is daarom niet zuiniger dan die andere epyc processors.
Maar daarin tegen dus wel hoger geklok op een cluster of mainframe maakt het wel veel uit als ze hoger geklokt zijn dan zou je een lagere latency moeten hebben aldus in theorie.
Ze mogen warm worden daarom gaan ze in een water gekoelde omgeving.

[Reactie gewijzigd door rjmno1 op 23 juli 2024 13:11]

11% betere prestaties tegen een ~25% hoger verbruik.
Deze processor is inderdaad minder zuinig, maar al met al valt het meerverbruik wel mee.
De TDP zit in een andere schaal, namelijk die van 285W.
Maar je hebt gelijk, dat deze op 285W staat betekent niet dat hij dit daadwerkelijk verbruikt.
Net zoals die 225W geen daadwerkelijk verbruik is.

Voorlopig hou ik het er toch op dat het verbruik 25% hoger is ;-)

Verder is de waarde tussen de TDP van Intel en AMD niet met elkaar te vergelijken.
Gisteren nog gezien dat de AMD TDP van 105W bij hogere prestaties minder verbruikte dan de 95W van Intel.
Laat me raden, linus?
Heb dat filmpje ook gezien :)
Zit met smart te wachten op Ryzen 9 3900x, laat ze die eerst maar eens uitleveren. _/-\o_
Aangezien m_snel spreekt over "uitleveren", is het wel degelijk de 3900x dat gewoon nergens te vinden is. Constant direct uitverkocht.
Amazon UK heeft em meestal wel op voorraad, tegen schappelijkere prijzen dan amazon DE.
Price: £545.99 = 619.47 Euro
De prijzen in Duitsland zijn 519 Euro...
https://www.heise.de/preisvergleich/?fs=3900x&in=

Dik verschil die UK prijs, is bijna de prijs van de 3950X :)
Alleen niet op voorraad voor die 620 euro......
En amazon DE had ze op voorraad tussen de 700 en 800 euro.

[Reactie gewijzigd door dwwolf op 23 juli 2024 13:11]

Op dit item kan niet meer gereageerd worden.