Nvidia kondigt Ampere-architectuur voor GeForce en Tesla aan

Nvidia heeft de A100 aangekondigd, de eerste gpu die het bedrijf op zijn nieuwe Ampere-architectuur produceert. De chip komt als eerste naar een DGX-systeem met acht A100-gpu's. Ook GeForce-kaarten krijgen een gpu op basis van Ampere.

Ampere moet uiteindelijk niet alleen Volta maar ook Turing vervangen en als enkel platform dienen voor zowel de enterprise- als de consumentenkaarten, zei Nvidia-ceo Jensen Huang voorafgaan aan de aankondiging volgens Marketwatch. Volta is de architectuur van de gpu van de Tesla V100-accelerator; GeForce-kaarten op basis van Volta verschenen er nooit. De GeForce 20-kaarten zijn op de Turing-architectuur gebaseerd. Over Ampere voor GeForce zei Huang verder niets, alleen dat er veel overlap zal zijn met Ampere voor Tesla maar met andere configuraties.

De eerste gpu op basis van Ampere is de Tesla A100 en deze is bedoeld voor high performance computing, kunstmatige intelligentie en andere datacentertoepassingen. Deze chip laat Nvidia op 7nm produceren en bevat 54 miljard transistors. Het oppervlak van de die is 826mm². Daarmee is het aantal transistors flink toegenomen tegenover de GV100-gpu van de Tesla V100, die 21,1 miljard transistors heeft, terwijl het chipoppervlak niet veel groter is: de GV100 meet 815mm².

Het aantal cudacores van de A100 is ten opzichte van de V100 verhoogd van 5120 naar 6912. Het aantal tensorcores is afgenomen, van 640 naar 432, maar het gaat om tensorcores van de derde generatie die verbeterd zijn ten opzichte van de vorige generatie, volgens Nvidia. Bij fp64-rekenwerk bieden deze meer dan dubbel zo hoge prestaties. Bij fp32-rekenwerk zou dat zelfs een vertienvoudiging zijn, maar Nvidia vergelijkt hier berekeningen op basis van zijn eigen tensor float 32 met floating point 32-rekenwerk. Volgens Nvidia 'werkt tf32 net als fp32 zonder dat code veranderd hoeft te worden'.

Nvidia A100 Tensor Cores

De geheugenbus van de A100 is 5120 bits breed en de maximale geheugenbandbreedte bedraagt 1555GB/s. De accelerator heeft 40MB on-chip level cache, zeven keer meer dan de vorige generatie, en kan over 40GB vram beschikken, verdeeld over zes hbm2e-stacks.

Nieuw is verder de aanwezigheid van multi instance gpu voor virtualisatie. Elke A100 kan hiermee in tot aan zeven instances opgedeeld worden die elke geïsoleerd en met hun eigen geheugen aan het werk kunnen voor verschillende gebruikers. Daarnaast is er ondersteuning voor een nieuwe nv-link-interconnect om gpu's in een server met elkaar te verbinden. Deze biedt een gpu-naar-gpu-bandbreedte van 600GB/s.

A100 multi-instance gpu

Nvidia kondigde direct een eerste systeem met de A100 aan: de DGX A100. Dit bevat acht A100-accelerators met een totaal van 320GB geheugen en ook is dit systeem van 200Gbit/s-interconnects van het door Nvidia overgenomen Mellanox voorzien. Opvallend hierbij is dat Nvidia de overstap van Intel naar AMD heeft gemaakt: de vorige DGX-2 had twee Intel Xeon Platinum 8168-processors. De fabrikant is van plan om de DGX A100 gebundeld in een cluster van 140 systemen aan te bieden in de vorm van de zogenoemde DGX SuperPOD.

Nvidia DGX A100

Nvidia Tesla-serie
	Tesla A100	Tesla V100s	Tesla V100	Tesla P100
Gpu	7nm GA100	12nm GV100	12nm GV100	16nm GP100
Die-oppervlak	826 mm²	815 mm²	815 mm²	610 mm²
Transistors	54 miljard	21,1 miljard	21,1 miljard	15,3 miljard
Sm's	108	80	80	56
Cudacores	6912	5120	5120	3840
Tensorcores	432	640	640	NA
FP16 Compute	78 tflops	32.8 tflops	31,4 tflops	21,2 tflops
FP32 Compute	19,5 tflops	16,4 tflops	15,7 tflops	10,6 tflops
FP64 Compute	9,7 tflops	8,2 tflops	7,8 tflops	5,3 tflops
Boost-kloksn.	~1410MHz	~1601 MHz	~1533 MHz	~1480MHz
Max. geh. bandbr.	1555 GB/s	1134 GB/s	900 GB/s	721 GB/s
Eff. geh. kloksn.	2430 MHz	2214 MHz	1760 MHz	1408 MHz
Geheugen	40GB HBM2e	32GB HBM2	16GB / 32GB HBM2	16GB HBM2
Geheugeninterface	5120-bit	4096-bit	4096-bit	4096-bit
Tdp	400	250W	300W	300W
Formfactor	SXM4 / pci-e 4.0	pci-e 3.0	SXM2 /pci-e 3.0	SXM

Reacties (47)

Tummie555 14 mei 2020 16:57

Kan iemand hieruit herleiden wat dit gaat betekenen voor onze a.s desktop-gpu's?

Bijvoorbeeld, gaat de RTX/GTX3080 veel sneller zijn?

HuugTheSeal @Tummie555 • 14 mei 2020 17:00

voor zover ik heb gehoord gaat de raytracing performance flink omhoog (de 3070 zou zelfde raytracing performance hebben als de 2080Ti) maar de "normale" performance jump zou vergelijkbaar zijn met Pascal > turing

RobinNL @HuugTheSeal • 14 mei 2020 17:26

Er zijn ook geruchten die zeggen dat de 3060 dezelfde raytracing performance zou hebben als de 2080Ti. We moeten het maar afwachten

HuugTheSeal @RobinNL • 14 mei 2020 17:30

zou leuk zijn voor de 3000-kaarten maar de resell value van mn 2080 zal wel flink gaan kelderen, zeker nadat het ook al flink naar beneden is gegaan na de release van de super kaarten

lezzmeister @HuugTheSeal • 14 mei 2020 18:27

Dat is meestal als je de topkaart koopt.

Verwijderd @lezzmeister • 14 mei 2020 20:15

Daar moet je ook even bij vertellen dat die topkaart ook heel erg lang mee kan gaan. Ik zit hier nog steeds op een 980Ti alles te spelen op zeer hoge settings. Wel op 1080 maar na 5 jaar gamen is hij het geld wel waard.

/Edit: lol@ Tesla flair.

[Reactie gewijzigd door Verwijderd op 23 juli 2024 02:23]

SiNNeR-Ism @Verwijderd • 15 mei 2020 06:43

Dus dit. Zit nu 4 jaar op een 1080ti en speel vrijwel (bijna) alles nog op Ultra op 1440p. Ik heb er een nier voor moeten afstaan, maar het is het geld dubbel en dwars waard. Gelukkig heb ik nog een tweede nier...

Audione0 @HuugTheSeal • 14 mei 2020 18:43

De 2080 serie zijn top kaarten, dus die zullen best nog wel wat op gaan brengen..

Blijft high end gaming voor de minder bedeelde ook nog leuk en voor de early adapter ook omdat je die centen bij een recent model kunt neerleggen..

Iedereen blij

Kubrix @Audione0 • 14 mei 2020 23:39

De 2080 serie zijn top kaarten, dus die zullen best nog wel wat op gaan brengen..

Niet als de aankomende mid-range straks dezelfde performance gaat geven.

Sulya @Kubrix • 15 mei 2020 09:59

Alleen de RTX gedeelte krijgt zo'n boost, gewone (niet-RTX) prestaties gaan maar mild omhoog.

LeStef @HuugTheSeal • 14 mei 2020 20:11

Daarom dat ik de 2xxx serie overgeslagen heb met mijn 1080Ti.
Tegen dat de 3xxx kaarten in de schappen liggen kan ik er misschien nog 300€ voor krijgen.

Bombtrack @RobinNL • 14 mei 2020 18:48

het gaat hier om raytracing performance. Het berekenen van rays. Dat staat volledig los van traditionele 3d berekeningscapaciteit. Het kan dus goed zijn dat de lowend kaarten van de 3000 serie beter zijn in het berekenen van rays als de 2080ti, maar dat de rest van de performance achterblijft, wat resulteert in lagere fps, minder hoge max resoluties, en minder hoge settings van graphics in games. Maar wel met global illumination bijvoorbeeld. Een bijzondere mix. We gaan het zien.

RobinNL @Bombtrack • 14 mei 2020 19:00

Daar had ik het toch over?

Xander.M @HuugTheSeal • 14 mei 2020 18:05

"(de 3070 zou zelfde raytracing performance hebben als de 2080Ti)"
Als 2080ti eigenaar kan ik oprecht zeggen dat die raytracing perfomance niet indrukwekkend is. Het moet op ze minst x2 gaan, want minecraft rtx is leuk enzo, maar dipt vaak naar de 40fps.

Tummie555 @HuugTheSeal • 14 mei 2020 17:07

Oh heerlijk! Nog even geduld hebben dus... dank voor de reactie!

Takkie2024 @Tummie555 • 14 mei 2020 17:19

à propos geduld, wanneer zullen de consumenten-GPU's naar verwachting op de markt komen?

Scale @Takkie2024 • 14 mei 2020 17:50

Als alle geruchten waar zijn... (Zijn ze dat ooit?)
Dan rond september..

Takkie2024 @Scale • 14 mei 2020 18:02

Dankjewel. Geduld hebben, dus. Ik zou heel graag nu al een PC willen bouwen, maar het wordt einde vh jaar dus, zeker omdat de volgende generatie Ryzens ook nog wel even nodig hebben

SuperDre

Nvidia GeForce

@HuugTheSeal • 14 mei 2020 23:59

Volgensmij was zelfs de bewering dat de 3060! dezelfde RT performance zou hebben als de 2080Ti.

Jeroenneman @Tummie555 • 14 mei 2020 17:09

Een RTX 2080Ti heeft een FP32 Compute van 14.2Tflops. Deze kaart bereikt er 19.5, ruw dus ongeveer 33% sneller dan een RTX 2080Ti.

DCK @Jeroenneman • 14 mei 2020 17:35

Zou je voor de vergelijking in het juiste segment niet moeten vergelijken met de "gehele" RTX Titan die 16.31 TFLOPS FP32 haalt? Dat is een steiging van ~20%.

Mitsuko @Jeroenneman • 14 mei 2020 18:18

Ik denk wel dat ze gaan inzetten om waar mogelijk hun TF32 te laten gebruiken aangezien ze dat zo veel sneller hebben kunnen maken. TF32 is een 19-bit formaat (19 bits per component iig) met de precisie van FP16 en de range van FP32 en de bedoeling is dat het intern gebruikt wordt voor tensor-operaties, met gewoon FP32 input en output (maar dus wel lossy).

Astennu

Videokaarten
Nvidia GeForce
Nvidia

@Tummie555 • 14 mei 2020 17:18

Is nog lastig te zeggen. De A100 is echt gericht op GPGPU.
Waarschijnlijk gaat het aantal Cuda cores omhoog in de nieuwe desktop GPU's. Daarnaast kan je denk ik ook wel een IPC verbetering verwachten per CUDA core.
Ik ben benieuwd wat ze met de tensor cores gaan doen. Ze zouden deze ook mee kunnen nemen. En dan met driver optimalisaties de tf32 in zetten om FP32 te doen. Maar dat moet nVidia dan regelen. Ik zie het game dev's niet snel inbouwen.

En de verwachting is dat ze ook groot gaan inzetten op RT. Moet ook wel want nu is het niet echt bruikbaar gezien de performance hit.

Ik denk dat je deze stap wel groter kan worden als in 30-50% sneller dan de huidige kaarten. De vraag is wel wat gaat dit allemaal kosten.

johnbetonschaar @Astennu • 14 mei 2020 17:35

Waarschijnlijk gaat het aantal Cuda cores omhoog in de nieuwe desktop GPU's. Daarnaast kan je denk ik ook wel een IPC verbetering verwachten per CUDA core.

Zou het? Volgens mij valt er aan IPC weinig te winnen bij moderne GPU's, dat is allemaal in-order 32 threads tegelijk in lock-step. De standaard trucs om IPC te verbeteren in CPU's zijn volgens mij niet of nauwelijks van toepassing op GPU's. Daar moet het allemaal uit allemaal bandbreedte, kloksnelheid en aantal cores komen eigenlijk. Enige wat ik zou kunnen verzinnen is dat bepaalde arithmetic built-ins (instrinsics) misschien een hogere doorvoer zouden kunnen krijgen, maar als ik me niet vergis is daar bij NVidia een paar generaties terug al een enorme verbetering in geweest.

Astennu

Videokaarten
Nvidia GeForce
Nvidia

@johnbetonschaar • 14 mei 2020 19:27

Dingen zoals cach geheugen hebben wel degelijk impact. Ik versta dat soort dingen er ook meer onder waardoor de CUDA cores dan beter benut worden en je ondanks gelijke clocks en een gelijk aantal CUDA cores toch betere prestaties kan neerzetten.

johnbetonschaar @Astennu • 15 mei 2020 10:35

Dat is waar, maar op basis van wat ik tot nu toe heb gezien geloof ik niet dat Ampere daarin erg veel verschilt van de vorige generaties NVidia GPU's, buiten het toevoegen van extra hardware blocks (tensor, ray tracing) en het verhogen van het aantal cores verandert er eigenlijk al jaren weinig aan die aspecten van hun GPU architectuur.

Astennu

Videokaarten
Nvidia GeForce
Nvidia

@johnbetonschaar • 15 mei 2020 10:38

Cache is verbeterd en dat kan wel weer aardig wat impact hebben op prestaties en deels verbruik.
Het is geen gigantische makeover nee. Dit is in de basis volgens mij nog steeds vergelijkbaar met Fermi. Alleen dan elke keer door ontwikkeld en er zijn nieuwe hardware capabilities toegevoegd.

[Reactie gewijzigd door Astennu op 23 juli 2024 02:23]

Lividmatter @Astennu • 14 mei 2020 20:09

De vraag is wel wat gaat dit allemaal kosten.

Ik denk eerlijk gezegd dat we dat allemaal liever niet zouden weten...

DoubleYouPee @Astennu • 14 mei 2020 23:35

Hopelijk wordt big navi concurrerend zodat de prijzen weer iets kunnen zakken..

Astennu

Videokaarten
Nvidia GeForce
Nvidia

@DoubleYouPee • 15 mei 2020 09:48

Het is niet zo maar big Navi het is Navi 2X want deze chips krijgen een nieuwe architectuur (RDNA2).
Dat gaat zeker helpen. Ik denk zelf dat hij tussen de 3080 en de 3080 Ti komt te zitten (mits de leaks over Ampere van mores law is dead kloppen). Afhankelijk van de prijs is het dan zeker concurrerend.

Het zou ook kunnen dat AMD een 80CU versie maakt met HBM2e om toch een gooi naar de prestatie kroon te doen.
Al kan nVidia een Titan met A100 uit brengen voor 3000 en dan toch de kroon claimen.

We gaan het zien. Het zal in ieder geval spannend gaan worden. En AMD zit nu niet meer zo stil. Er is nu meer geld beschikbaar om door te blijven ontwikkelen. RDNA3 staat ook al op de roadmap.

Lividmatter @Tummie555 • 14 mei 2020 20:06

een kort en simpel antwoord op je vraag: nee niemand kan dat vertellen. Heb wat geduld, het zal waarschijnlijk over een jaar of 2 bekend zijn.

OverTeeHill @Lividmatter • 14 mei 2020 22:07

Eerder tegen de herfst van dit jaar nog

Lividmatter @OverTeeHill • 14 mei 2020 22:58

wat, over de volgende consumer/gaming lineup?
lijkt me sterk. vanwaar dat gerucht?

OverTeeHill @Lividmatter • 15 mei 2020 20:33

Door het feit dat nvidia om de 2 jaar de volgende generatie kaarten op de markt brengt en het alweer 2 jaar geleden is dat de rtx 2000 serie uitkwam. Verder wordt op allerlei techsites het gerucht verspreid dat de 3000 serie eind van de zomer of tegen de herfst uitgebracht wordt. Door het hele corona gedoe verwacht ik hoogstens een paar maanden vertraging.

Het hangt er ook een beetje van af wat amd gaat doen natuurlijk. De radeon VII (pro?) komt al redelijk in de buurt van rtx2080 performance en ze zouden vermoedelijk ook dit jaar nog de big navi productline uitbrengen dus dan moet nvdia wel volgen om marktleider te blijven.

Transistortje @Lividmatter • 14 mei 2020 23:54

Wanneer je de huidige geruchten voorzichtig combineert met kennis van de launches van vorige generaties en, daarbij nog, deze aankondiging, kom je toch al een heel eind.

- Raytracing flink verbeterd, waarbij een RTX 3060 met Raytracing ingeschakeld ongeveer gelijk presteert aan een 2080Ti met Raytracing ingeschakeld. Waarschijnlijk voornamelijk door de die-shrink van 12nm naar 7nm, waardoor er relatief goedkoop meer RT-cores geplaatst kunnen worden. Die 7nm is nu dus door Nvidia zelf bevestigd.
- Getuige o.a. diezelfde die-shrink, een (non-raytracing) prestatieverbetering die minstens gelijk, maar zeer waarschijnlijk ietwat hoger ligt dan die van Pascal naar Turing.
- Prijzen die nog enigszins mee moeten vallen (dus niet alweer een grote sprong hoger zoals bij de afgelopen generaties), zeker als AMD snel met een vorm van concurrentie ('Big Navi') komt.
- Release gepland in Q3 van dit jaar.

Lividmatter @Transistortje • 15 mei 2020 09:36

We gaan het zien! Ik ben zelf geen enorm fan van speculeren over releases etc. meestal zorgt dat voor teleurstelling. Uiteraard extra nice als het wel allemaal blijkt te kloppen

Dragunov @Tummie555 • 15 mei 2020 12:44

Geen GTX meer

Limbids @Tummie555 • 15 mei 2020 19:07

Geruchten gaan dat zelfs de simpelste modellen van de "30 serie" veel betere raytracing performance hebben dan de 2080.
Zoals het gerucht gaat "the RTX2080 won't age well"...

Nieuwevolger 14 mei 2020 16:57

Deze architectuur lijkt een hele dike vooruitgang te hebben in transistors per CU. Waardoor misschien de tflops jump niet zo heel indrukwekkend lijkt, maar dat de performance dat we zullen zijn.

Cairo555 14 mei 2020 17:22

Deze specs zijn echt wel extreem te noemen. Misschien in een paar dingen niet t.o.v. huidige RTX modellen, al twijfel ik daar ook aan. Maar zeker in verhouding tot de GTX kaarten.

Nou zijn dit natuurlijk geen specs van de consumer kaarten, maar toch.. Ben erg benieuwd waar ze mee gaan komen. Nog even geduld.

peperbus 14 mei 2020 17:55

Mooi, volgend jaar een upgrade. 3080 kaartje + 48'oled scherm, ivm HDMI 2.1. (nu 34' 4k scherm + 1080 kaartje).

john milton @peperbus • 14 mei 2020 18:28

Game je dan op de bank, neem ik aan? Mijn bureau is daar niet diep genoeg voor, dat formaat. Dan zit ik er wel erg bovenop :-)

Ik houd het op een 3080 en een 34 inch 1440p 21:9 144+hz, denk ik. Nu 25 inch 1440p en een 970 kaartje.

[Reactie gewijzigd door john milton op 23 juli 2024 02:23]

Finraziel

@peperbus • 14 mei 2020 19:16

Wow, een 48 voet oled, dat is nogal wat

Striker_zelf @peperbus • 14 mei 2020 19:55

De hamvraag is natuurlijk: Will it run Crysis ?

Lividmatter @Striker_zelf • 14 mei 2020 20:07

hoho, minecraft rtx is de nieuwe maatstaaf hè!

computerjunky 15 mei 2020 11:23

Mwa beest van een specsheet maar wat dat voor de desktop zegt. Niets.
Ik hoop echter wel dat de 3070 een flinke vooruitgang is ten opzichte van de 2070 super.

10 a 20 % zoals sommigen zeggen zou echt een enorme domper zijn. 1440p ultra kan nu bij veel games al niet op hoge fps en dan komt er einde van het jaar eindelijk een fatsoenlijke console waardoor game specs omhoog gaan en pc fps naar beneden.

Ik zit nog steeds op 1080p omdat ultra en fps zwaarder wegen dan een groter scherm en 1440p en het ziet er naar uit dat dat nog steeds zo blijft.

Cairo555 16 mei 2020 11:15

Dacht dat zo'n beetje iedereen die al een 10xx kaart had de 20xx had laten liggen. Zeker omdat bij de 20xx release als ik het mij goed herinner al bekend was dat de ampera er aan kwam?

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (47)

Sorteer op:

Weergave: