Intel kondigt Xeon Max-serverprocessors en Data Center-gpu's aan

Intel heeft de Xeon Max aangekondigd, serverprocessors die intern bekendstaan als de Sapphire Rapids HBM. Daarnaast kondigt het bedrijf de Data Center GPU Max Series aan, server-gpu's die als codenaam Ponte Vecchio hebben. Leveringen van beide producten beginnen in januari.

De Xeon Max-cpu-serie, voorheen bekend als Sapphire Rapids HBM, heeft maximaal 56 performance-cores, die verdeeld over vier chipletachtige tiles zijn geplaatst. De processors krijgen geen efficiënte E-cores. Die tiles worden onderling verbonden met wat Intel embedded multi-die interconnect bridge noemt, ofwel emib. Dit zijn een soort kleine siliciumbruggetjes die functioneren als een interconnect. Deze cpu-serie heeft tdp's tot 350W.

De cpu krijgt daarnaast 64GB HBM2e-geheugen verspreid over vier 16GB-stacks. Daarmee krijgt elke core meer dan 1GB aan HBM2e-geheugen tot zijn beschikking. De Xeon Max ondersteunt verder PCIe 5.0 en de CXL 1.1-interconnectstandaard voor i/o. Intel claimt dat de nieuwe cpu 68 procent minder energie gebruikt dan een AMD Milan-X-cluster voor dezelfde prestaties, of bij het maken van klimaatmodellen 2,4 keer zo snel is als zo'n AMD-cluster als er HBM-geheugen wordt gebruikt.

De Data Center GPU Max-serie, voorheen bekend als Ponte Vecchio, bestaat uit drie verschillende kaarten die met maximaal 128 Xe-HPC-cores uitgerust kunnen worden. De kaarten worden eveneens opgebouwd uit verschillende tiles en krijgen maximaal 408MB L2-cache en tot 64MB L1-cache. De Data Center GPU-kaarten krijgen ook native ray tracing acceleration, waarmee volgens Intel wetenschappelijke visualisaties en animaties sneller uitgevoerd kunnen worden. In bepaalde financiële benchmarks zouden de kaarten 2,4 keer zo snel zijn als Nvidia's A100-kaarten; bij bepaalde natuurkundige simulaties zouden Intels kaarten 1,5 keer zo snel zijn.

Intels krachtigste Data Center-gpu is de Max Series 1550, een 600W-kaart met 128 Xe-kernen, 128GB HBM2e-geheugen en 128 raytracingunits. De Max Series 1350 heeft een tdp van 450W, 112 Xe-kernen en 96GB geheugen. De 1100-gpu heeft op zijn beurt een 300W-tdp, 56 Xe-kernen en 48GB geheugen. Kaarten kunnen met Intel Xe Link-bridges aan elkaar worden gekoppeld.

Onder meer de Aurora-supercomputer moet met Xeon Max-producten worden uitgerust. Het moet de eerste supercomputer worden die meer dan twee exaflops aan rekenkracht kan behalen. Overigens wacht deze supercomputer al jaren op Intels serverproducten; Aurora had eigenlijk al in 2021 opgeleverd moeten worden. Dit werd vorig jaar uitgesteld tot 2022 vanwege de vertraging van de vandaag aangekondigde producten.

Aurora zal dus pas volgend jaar de twee exaflops halen, met de release van de Xeon Max- en Data Center GPU Max-producten. De supercomputer krijgt ruim 10.000 blades. In elke blade zitten zes Max Series-gpu's en twee Xeon Max-cpu's. Verschillende Amerikaanse labs en de universiteit van Kioto krijgen eveneens supercomputers met de vandaag aangekondigde producten. In 2024 moet de opvolger van de Max Series GPU verschijnen. Die gpu's hebben nu als codenaam Rialto Bridge.

Door Hayte Hugo

Redacteur

10-11-2022 • 13:13

11

Submitter: TheVivaldi

Lees meer

Reacties (11)

11
11
8
0
0
1
Wijzig sortering
Maar kun je nu deze gpu dan ook inzetten op Windows server omgevingen?
het is een pci-e kaart. Wat bedoel je met windows server omgevingen? Ik veronderstel dat Intel gewoon driivers gaat leveren zoals met al hun producten
Nvidia kaarten hadden vanwege een security invulnerability er voor gezorgd dat gpu kaarten niet meer ondersteund werden in de nieuwere Windows servers... Dus ik vroeg mij af met een Intel gpu architectuur.. Of mogelijk de optie terugkomt om hardware acceleration in te schakelen, voor bijvoorbeeld 3d pakketten. De vraag blijft anders over, waarvoor is dit anders te gebruiken?
Dit zijn vooral ML / AI kaarten, net als bijvoorbeeld de A100 van Nvidia, niet direct iets dat je in een VDI / RDS omgeving gebruikt.
Maar Nvidia heeft daar nog altijd gewoon kaarten voor toch? Zie o.a. de A40, A16 en in mindere mate de A2. https://www.nvidia.com/en...cards-for-virtualization/

[Reactie gewijzigd door Dennism op 24 juli 2024 13:59]

Thnx voor de link, ik zal het eens even gaan bestuderen :Y)
Op de een of andere manier voelt dit aan als een wat lompe/onelegante manier om AMD's EPYC voor te blijven in specifieke memory-bound workloads? Zeker in situaties waar veel cache nodig kan dit best wel een enorme boost kunnen geven.
Veel op anandtech en wat andere plekken besproken, een van de dingen waar de epyc's tegen aan liepen in hele specifieke scenarios was de enorme performance penalty als er data uit een van de 8-core chiplets data nodig had uit de cache or cores elders.

Ben dus wel benieuwd hoe die 56 cores verdeeld zijn. de scepticus in mij zegt dat het niet veel anders is dan twee Xeon gold/platinum (28core) ontwerpen op een interposer geplakt, in plaats van de enorme monolithsche ontwerpen eerder.

[Reactie gewijzigd door otog8 op 24 juli 2024 13:59]

Dit is Intels eerste moderne chiplet generatie. Ze gebruiken 4 compute chiplets, zie ook deze afbeelding: https://static.tweaktown....up-to-64gb-hbm2e_full.jpg van de marketing afdeling. Dit met Emib uit mijn hoofd als interconnect.

Of hier de delidded variant, zoals gepost door Servethehome: https://www.servethehome....hire-Rapids-HBM-Top-2.jpg

[Reactie gewijzigd door Dennism op 24 juli 2024 13:59]

Leuk dat ze nu efficiënter zijn dan Milan, echter staan Genoa en Bergamo al voor de deur amd gaat dan van 64 naar 96 en 128 cores.

L3 cache gaat van Milan naar Genoa van 768MB naar 1152MB. (mits ze een 32 + 64mb config blijven gebruiken).

In bepaalde situaties waar je veel super snel geheugen nodig hebt is de HBM xeon nog in het voordeel maar als het binnen de L2/L3 cache past heeft amd een voordeel.
Klopt, al is er nog wel de kleine kanttekening dat een 56c Sapphire Rapids Xeon meer L2 heeft dan een 96 core Genoa. De Intel heeft namelijk 2MB per core, en de AMD Genoa 'slechts' 1MB per core.

L3 is bij AMD ruim groter over het algemeen, waar de modellen met 12 chiplets minimaal 384MB L3 hebben en maximaal 1152MB voor de X modellen met 12 chiplets, terwijl het Intel top model het met 105MB moet doen, althans zo lijkt het.

[Reactie gewijzigd door Dennism op 24 juli 2024 13:59]

Och, Intel is altijd goed met aankondigen.
Ja.. De Arc PRO GPU's die volgens Intel in Q3 dit jaar gereleased zijn zijn nog steeds nergens te vinden...

Papieren tijger dus.

Op dit item kan niet meer gereageerd worden.