Intel: Aurora-supercomputer haalt 2 exaflops aan rekenkracht en komt in 2022

Intel laat weten dat zijn Aurora-supercomputer voor het Argonne National Laboratory 2 exaflops aan rekenkracht zal halen. De supercomputer zou volgens eerdere verwachtingen 1 exaflops aan rekenkracht bieden.

Intel liet op woensdag weten dat de rekenprestaties van Aurora twee keer hoger uitvallen dan verwacht, schrijft SemiAnalysis-analist Dylan Patel op Twitter. De supercomputer zou 'meer dan twee exaflops' aan rekenprestaties leveren. Aurora maakt gebruik van Intels komende Sapphire Rapids-processors, in combinatie met Ponte Vecchio-datacenter-gpu's en is bedoeld voor het Argonne National Laboratory van het Amerikaanse ministerie van Energie.

Aurora wordt volgens de huidige planning in 2022 geleverd. Intel zou de supercomputer aanvankelijk in 2021 leveren, maar het bedrijf heeft dit eerder al uitgesteld. Patel meldt dat het niet de eerste keer is dat Aurora is uitgesteld. Intel heeft ook de rekenprestaties van Aurora meermaals opgeschroefd. De supercomputer zou aanvankelijk in 2018 operationeel worden met 180 petaflops, schrijft DataCenterDynamics. Dit werd vervolgens uitgesteld naar 2021 met 1 exaflop, en de levering werd later opgeschoven naar 2022 met 2 exaflops aan rekenkracht.

In de tussentijd neemt het Argonne National Laboratory nog een Polaris-supercomputer in ontvangst, die gebruikmaakt van 560 AMD EPYC-processors met 32 cores, naast 2240 Nvidia A100-accelerators. Volgens het Argonne National Laboratory haalt Polaris een theoretische rekenkracht van maximaal 1,4 exaflops bij AI-rekentaken. Polaris zal gebruikt worden om software voor de Aurora-supercomputer van Intel voor te bereiden. Polaris wordt dit jaar nog geleverd en geïnstalleerd en moet begin 2022 operationeel zijn.

Intel Aurora

Door Daan van Monsjou

Nieuwsredacteur

27-10-2021 • 21:17

54

Lees meer

Reacties (54)

54
51
21
6
2
15
Wijzig sortering
Leuk gespind van Intel, maar Aurora is een desastreuze clusterfaal-catastrofe:

-De info uit het Tweakers artikel kwam naar boven toen Timothy Morgan (NextPlatform) vroeg* waarom Intel $300 miljoen op dit project heeft afgeschreven. Ding is te laat dus de klant gaat veel minder betalen.

-De 2 Exaflops is _piek_ vermogen, en afkomstig van Xe HPC (GPU achtige) accelerators gemaakt door TSMC op de N5 node (!), een brevet van Intels onvermogen. Ze kunnen zelf helemaal geen HPC GPU's produceren.

-AMD's Frontier gebruikt ca 2x zo weinig energie als Aurora.

-AMD's Polaris (supercomputer), die nu dus eerder klaar is dan Aurora, maakt gebruik van Epyc Rome dat op de markt kwam in 2019, en die CPU en de A100 worden gemaakt op het TSMC N7 proces dat in 2018 op de markt kwam! Dus het lukt Intel maar amper om beter te zijn dan de concurrentie >2 jaar geleden al was, en dat lukt ze uitsluitend omdat ze TSMC N5 eerder gebruiken voor supercomputers dan NVidia (iets met grote zak geld en middelvinger naar Intels eigen fabs).

-China heeft stiekem al de 1e Exascale computer klaar; no Intel x86 inside.

https://www.nextplatform....-not-be-a-bridge-too-far/

[Reactie gewijzigd door kidde op 23 juli 2024 17:24]

De 2 Exaflops is _piek_ vermogen, en afkomstig van Xe HPC (GPU achtige) accelerators gemaakt door TSMC op de N5 node (!), een brevet van Intels onvermogen. Ze kunnen zelf helemaal geen HPC GPU's produceren.
De Ponte Vecchio die in deze supercomputer terecht komt gebruikt verschillende productietechnieken. Dat zijn TSMC's N7 en N5, de base tile wordt door Intel gemaakt en Intel doet de verpakking met hun Foveros techniek.
De GPU is geheel door Intel ontworpen. Zoals iedereen weet heeft Intel al jaren productieproblemen met hun 10nm procedés en dat is de reden dat gedeeltes van deze chip bij TSMC worden gemaakt. Dus je opmerking dat Intel helemaal geen HPC gpu's kan produceren klopt niet gedeel, slechts gedeeltelijk. Het is mijn inziens slim van Intel om capactiteit bij TSMC in te kopen om niet verder achterop te raken in de datacenter markt op het gebied van HPC gpu's. Had Intel dat ook maar eerder ook gedaan voor hun cpu's, SUnny Cove en Willow Cove, dan hadden ze daar ook niet verder achtergeraakt op AMD, maar voor AMD is het juist een voordeel geweest, Zen 2 en Zen 3 zou het stuk moeilijker hebben gehad als Intel gewoon Sunny Cove en Willow Cove had kunnen leveren volgens planning.
-AMD's Frontier gebruikt ca 2x zo weinig energie als Aurora.
Het is nog afwachten hoeveel Aurora precies gaat verbruiken. Plus het is afwachten wat de daadwerkelijk performance van biede supercomputers gaat komen. Zoals je hierboven zegt dat de 2 exaFLOPS peak performance is van Aurora, lees ik alleen maar 1,5 exaFLOPS voor de Frontier, wat ik dan ook interpreteer als peakperformance.
-AMD's Polaris (supercomputer), die nu dus eerder klaar is dan Aurora, maakt gebruik van Epyc Rome dat op de markt kwam in 2019, en die CPU en de A100 worden gemaakt op het TSMC N7 proces dat in 2018 op de markt kwam! Dus het lukt Intel maar amper om beter te zijn dan de concurrentie >2 jaar geleden al was, en dat lukt ze uitsluitend omdat ze TSMC N5 eerder gebruiken voor supercomputers dan NVidia (iets met grote zak geld en middelvinger naar Intels eigen fabs).
AMD's Polaris? Er zitten ook nVidia GPU's in! En ook kan je wel zo afgeven op Intel, maar iedereen weet dat Intel grote problemen heeft gehad met hun 10nm productieprocedés, zoals ik al eerder aangaf. Dat heeft helemaal niets met 'middelvinger naar Intels eigen fabs' te maken, maar gewoon met knopen doorhakken en, mijn inziens, de juiste beslissingen maken.
Polaris is de naam van de Argonne supercomputer. Had ik er speciaal tussen haakjes bijgezet. Want wie niet op let verwart de naam van het project met de naam van deG PU architectuur, begrijpelijk.

https://www.alcf.anl.gov/polaris
. Dus je opmerking dat Intel helemaal geen HPC gpu's kan produceren klopt niet gedeel, slechts gedeeltelijk.
Als ik het goed begrijp, was de Ponte Vecchio Xe HPC tile eerst gepland op the process formerly known as ('TPFKA') Intel 7nm; dat lees je in oudere berichtgeving. Bij Next Platform van augustus lees ik in een keer dat die computer tile TSMC N5 is (onder de afbeelding met exploded View):

https://www.nextplatform....-not-be-a-bridge-too-far/

Als dat zo is en die TSMC N5 compute core is wat de 2 Exaflops levert (Xeons doen dat niet), noem ik dat een redelijke dikke middelvinger naar Intel fabs; dan heeft dat niets met capa te maken maar het falen van TPFKA 'Intel 7nm' (nu 4 hernoemd geloof ik).

De compute tile kan kennelijk (nog?) niet op 'TPFKA Intel 7nm' gemaakt worden.

En zonder compute tile heb je een auto zonder motor. Waar ik werk betekent het missen van 1 component dat de auto helemaal niet gemaakt wordt. Zonder Honda motor doet RedBull dit seizoen mijns inziens 'helemaal niet' mee aan de race, niet voor 20% niet of zo. Maar OK, Intel maakt inderdaad "de rest' van de auto.

Of misschien heb ik het fout begrepen en is de compute tile wel op Intels eigen proces; maar dat is vrijwel uitgesloten. Want het is nu 2 dagen na INTC ER, en als TPFKA 7nm gewerkt had dan hadden ze het wel van de daken tegen aandeelhouders geschreeuwd toch? Maar sinds ze over lijken te gaan van 'TPFKA' Intel 7nm naar TSMC N5 neemt in een keer het aantal Exaflops toe, ben ik paranoïde als ik dat net iets te toevallig vind?

Ed: Quote van Steven Conway, analyst bij Hyperion Research: " don’t know what that does to contractual terms, but it looks as if what’s happened is that they’ve figured out the design pretty well but there’s some defect that they need to correct before it can go into full production – not just that GPU, but all of their seven nanometer parts.”

Normaal zou Intel het net als bij 10nm gewoon 3 jaar uitstellen, maar er is dus een contract met US DOE. Onder tijdsdruk, want eerste exascale, AMD, China en interne competitie binnen DOE (haha ongelooflijk maar waar). Dus teneinde wanhoop nadat er $300 miljoen afgeschreven is omdat 'TPFKA' Intel 7nm dus simpelweg niet op tijd af is, en er toch iets moet gebeuren, switcht Intel naar het door Apple iPhones betaalde (!) TSMC N5. Want een TSMC SoC proces voor mobiele telefoons blijkt voor supercomputers beter te werken dan een Intel proces gemaakt voor desktop- en server CPU's.....

'Middelvinger' is inderdaad geen nette bewoording van me, 'TPFKA' Intel 7nm is na 10nm gewoon de volgende 'epysche faal'. Beter zo?

[Reactie gewijzigd door kidde op 23 juli 2024 17:24]

Ik maak ook geen verwarring tussen de polaris supercomputer en polaris gpu. :) Je noemt het alleen AMD's polaris, terwijl er ook nVidia gpu's in zitten. Niet echt AMD's supercomputer naar mijn mening. Dat was alles. :)

Ok, nu terug naar Ponte Vecchio en de gebruikte technieken. Het klopt dat Intel deze eerst gewoon zelf wilde bakken op Intel's 7nm procedé, tegenwoordig omgedoopt naar Intel 4. Intel 7 was voorheen Intel's 10nm Enhanced SuperFin procedé. Maar door problemen met Intel's 7nm, uh Intel 4, procedé heeft Intel snel knopen doorgehakt en capaciteit bij TSMC ingekocht, zowel N5 voor de compute tiles als N7 voor de link tile.

Intel Ponte Vecchio and Xe HPC Architecture: Built for Big Data
https://www.tomshardware....ecture-built-for-big-data
The compute tiles at the heart of Ponte Vecchio will be made using TSMC's N5 process, each with eight Xe-cores. These link to an Intel Foveros base tile (built on the newly renamed Intel 7 process), which also houses the Rambo cache, HBM2e, and a PCIe Gen5 interface. The Xe Link tile meanwhile uses TSMC N7.
Inderdaad een winwar van gebruikte technieken. :)

Hoe je aankijkt tegen Intel's productieprocesproblemen, 10nm en 7nm (resp Intel 7 en Intel 4), is iedereens eigen mening. Ja het is duidelijk dat ze daarin gefaald hebben, Intel's 10nm stond al voor 2016 op de planning en Intel's 7nm voor 2018. Een discussie hierover is zinloos. Wat slim van Intel is is dat ze eindelijk de problemen erkent hebben en knopen hebben doorgehakt om capaciteit bij TSMC in te kopen om hun high-end chips te laten produceren.

De uitspraak 'middelvinger naar Intels eigen fabs' is naar mijn menig gewoon niet correct, omdat Intel niet eens de keuze had voor hun eigen fabs te kiezen door alle problemen met hun productieprocedés. :)
Zit je nog steeds aandelen Intel te shorten? ;)
Jammer, was me niet gelukt afgelopen earnings release (was een uurtje te laat want was net met GTA 5 begonnen, en DeGiro doet geen CFD warrants meer?). Anders had ik weer 50% winst gepakt in een dag.

Maar u kent het recept: 5 dagen na ER weer long gaan tot de dag voor de volgende ER (rond 24 januari ongeveer). Want komende drie maanden wordt het aandeel weer omhoog gepraat. En dan weer 1 dag short 'overnight' bij de volgende earnings release (die van Q4 en FY '21 dus, rond 24 januari).

[Reactie gewijzigd door kidde op 23 juli 2024 17:24]

welk os kan deze machine aanspreken ?
Snelius draait een mix van CentOS en RedHat.
SLES is ook populair om te gebruiken onder Supers.

Daarnaast heb je ook cluster beheer software nodig.
Hier kom je zaken zoals http://www.openhpc.community/ tegen of je kan ook voor Bright Computing gaan.
Daarnaast zijn er ook genoeg locaties die hun eigen set aan software hebben opgebouwd en dat blijven doorontwikkelen.

Als je een Cray koopt, krijg je CrayOS erbij. Hier zit ook meteen een complete beheer omgeving al in verwerkt. Maar Cray wordt vaak vergeleken met de dure en luxe uitgevoerde auto's die je op de markt kunt vinden.

[Reactie gewijzigd door lasermen op 23 juli 2024 17:24]

Zal wel een aangepaste linux versie zijn. Meestal een RH afgeleide
Een custom versie van Linux.
Linux is enkel de kernel. het besturingssyteem dat ze gaan draaien is een suse variant (lang geleden gelezen, mogelijk inmiddels achterhaald).
De top 10 draait schijnbaar RHEL. Andere varianten zijn bijvoorbeeld Ubuntu.
Er bestaat ook een Windows variant (HPC Server 2008) voor super computers maar die zie je nauwelijks terug in de top 500.
Dat zou kunnen, maar voor Aurora is cray Linux beoogd. Een afgeleide van suse Linux.

Zie net dat de voters hiermee oneens zijn, maar weet zeker dat ik het heb gelezen.

Zal ook even de bron erbij opzoeken.
https://buy.hpe.com/us/en...ating-system/p/1012842044

'HPE Cray OS is based on SUSE® Linux Enterprise Server (SLES) with enhancements for high performance computing.'
Dat is heel wat rekenkracht. :)

Nog niet in verdiept maar wat voor SC draaien ze er nu ?
https://www.anl.gov

[Reactie gewijzigd door Nebulasky2 op 23 juli 2024 17:24]

Aangenomen dat ze die publiceren dan staat deze in de top500 lijsten. Hier staan ze allemaal die onder Argonne National Laboratory vallen: https://top500.org/site/47347/
Volgens de site hebben ze er al het één en ander staan, maar dat is in de orde van grootte van 10-tallen petaflops. Exa is 1000x peta, dus tel uit de winst.

Is dit ook direct de krachtigste supercomputer tot op heden? Daar lijkt het wel op volgens de top-500.

[Reactie gewijzigd door scorpionv op 23 juli 2024 17:24]

Als dit systeem gebouwd is en operationeel is. Zal het wel even de snelste van de wereld zijn.
Al staan andere locaties ook niet stil om boven de exaflop uit te gaan komen.
Nog ff een orde groter dan snellius.
Renderen van blender files, is zoiets daar geschikt voor? Serieuze vraag.
Ja, maar dan vooral voor het parallel uitrekenen van de frames van een complete animatie. De interconnects worden dan vrijwel niet gebruikt.
O.a. Pixar heeft daar een leuk stukje van op hun site, ze hebben een eigen render farm:

https://sciencebehindpixar.org/pipeline/rendering

En over How to train your Dragon (op HP hardware)

https://www.datacenterkno...w-to-train-your-dragon-2/
Dit past toch nooit op iemands bureau :+
Wie weet over 20 jaar?
Je hebt tegenwoordig meer rekenkracht in je hand dan wat er 20 jaar geleden in de supers zaten.
nou nee.
erm, ja dus….

2020
iPhone 12 Max Pro: 11 TFLOPS

https://www.bigcompute.org/blog/from-apollo-to-fugaku
On October 13, 2020, Apple Inc. released the newest line of iPhones, dubbed the iPhone 12. Embedded in the A14 bionic custom Apple silicon that powers this new line of phones is the 16-core Apple Neural Engine. And according to Apple, that new Neural Engine is capable of 11 trillion operations per second (TFLOPS).
2000
IBM ASCI White: 7,226 TFLOPS

https://en.m.wikipedia.org/wiki/History_of_supercomputing

DoE-Lawrence Livermore National Laboratory, California, USA


edit: ja dus, de smartphone van nu is krachtiger dan de supercomputer van 20 jaar geleden. Alleen de volgende stap van de supercomputer in 2002 ging al naar 36TFLOPS, dat zie ik de iPhone 14 nog niet doen (denk ik).

[Reactie gewijzigd door Fermion op 23 juli 2024 17:24]

Naja die 11TOPs INT8 operaties voor AI mag je niet vergelijken met general purpose FLOPS.

Hardware (oppervlakte, energie,...) schaalt ongeveer kwadrarisch met het aantal bits, dus 8 bit ops zijn sowieso 16x efficiënter dan 32bits ops (of meer met special purpose HW zoals die AI cores).

Maar zelfs als de iPhone 1/50 heeft van die supercomputer uit 2000 is het nog altijd heel indrukwekkende vooruitgang
Edit: Verkeerd gelezen. Lijk toch wel te kloppen inderdaad. Best bizar!

[Reactie gewijzigd door Menesis op 23 juli 2024 17:24]

dat zie ik de iPhone 14 nog niet doen (denk ik).
Ik denk dat Apple daar best snel aan toe zal zitten, het lastige gaat het meten zijn. Ze bouwen tegenwoordig hun eigen CPU's met ingebouwde GPU's, maar ik weet niet of die vrij te programmeren zijn. Ook hebben ze specialistische hardware voor bijv. 'AI' en beeldverwerking. Lastig om dat om te rekenen naar teraflops, maar ik geloof zo dat ze 3x performance kunnen halen tov de chips in de genoemde iphone 12.
Nee doom! Dat is wat we willen weten! }:O
Hebben ze in drie seconden de oplossing op corona uitgerekend :+
Ik doe ‘t in minder dan 3 seconden: vaccineren! ;)
Denk dat er dan ergens een fout zit, want vaccineren is blijkbaar niet de oplossing.. Gelukkig zou men in de VS een echt geneesmiddel inmiddels hebben, maarja, daar is natuurlijk niet zoveel aan te verdienen dan alle mensen op de aarde te vaccineren, want dat zijn er heel veel meer dan mensen die werkelijk het geneesmiddel nodig zouden hebben.
Dexamethason vermindert het aantal sterfgevallen met 30%. Da's mooi, maar vaccineren lijkt me nog steeds een betere kans dit niet nodig te hebben!
Helaas kan die wel wat hulp gebruiken, zie de miljoenen mensen die overleden zijn of gehandicapt geworden zijn aan ziektes waar we nu vaccinaties voor hebben.

De vaccins hebben geen significante bijwerkingen, en die zijn mild in vergelijking met de ziekte.
Zijn koorts en longontsteking geen bijwerkingen van je eigen immuunsysteem dan?

De bijwerkingen van je eigen immuunsysteem zijn een stuk heftiger dan die van een vaccinatie.

[Reactie gewijzigd door aicaramba op 23 juli 2024 17:24]

maarja, het is je eigen immuumsysteem die dan zo heftig reageert op het vaccine dat het toegedient krijgt...
Alleen veel minder heftig dan op de ziekte..
Dat hangt af per persoon. Het overgrote deel van de mensen heeft helemaal geen heftige reactie op de ziekte, het is maar een marginaal aantal dat heftige reacties hierop hebben.
Klopt. Hangt af van de persoon.. Statistich gezien zijn de bijwerkingen op het vaccin veel kleiner dan op de ziekte.
Door te vaccineren krijg je een goed werkend immuunsysteem.
Helaas zo eenvoudig is het niet.
Exclusief stroomkosten

Op dit item kan niet meer gereageerd worden.