Nvidia kondigt Tesla P40- en P4-accelerators aan

Nvidia heeft twee nieuwe Tesla-kaarten met Pascal-gpu's aangekondigd. De Tesla P40 is gebaseerd op een GP102-gpu met 3840 cudacores. Dat is meer dan de Tesla P100, Nvidia's krachtigste accelerator, maar de P40 bevat geen hbm2-geheugen.

De Tesla P40 en P4 zijn de opvolgers van de M40 en M4, die nog Maxwell-gpu's bevatten. Prijzen maakt Nvidia nog niet bekend, maar de P40- en P4-kaarten zullen betaalbaarder zijn dan de high-end P100, zodra ze in respectievelijk oktober en november beschikbaar komen.

Nvidia richt zich met de kaarten op inferencing-toepassingen, waarbij deep neural networking wordt gebruikt om spraak, beeld en tekst te herkennen. Nvidia koppelt de introductie van de kaarten dan ook aan twee softwaretools. TensorRT is een bibliotheek voor het optimaliseren van deep learning-modellen, terwijl de DeepStream-sdk het decoderen en analyseren van videostreams door kunstmatige intelligentie moet versnellen.

Opvallend is dat Nvidia bij de P40 3840 streamprocessors heeft geactiveerd, waarbij dit bij het 'vlaggenschip' P100 3584 is. Die kaart beschikt echter over een flink bredere geheugeninterface in combinatie met snel hbm2-geheugen. Hierdoor ligt de geheugenbandbreedte van de P100 ten opzichte van de P40 een stuk hoger: 720GB/s tegenover 346GB/s. Met de Tesla P100 richt Nvidia zich meer op het trainen van deep-learningnetwerken, dankzij de aanzienlijke fp16-rekenkracht van 21,2 teraflops.

Nvidia Tesla
	Tesla P100	Tesla P40	Tesla P4	Tesla M40	Tesla M4
Cudacores	3584	3840	2560	3072	1024
Kloksn.	1328MHZ	1303MHz	810MHz	948MHz	872MHz
Boostkloksnl.	1480MHz	1531MHz	1063MHz	1114MHz	1072MHz
Geheugeninterface	4096bit hbm2	384bit gddr5	256bit gddr5	384bit gddr5	128bit gddr5
Geheugenhoeveelh.	16GB	24GB	8GB	12GB/24GB	4GB
Geheugenbandbr.	720GB/s	346GB/s	192GB/s	288GB/s	88GB/s
Single Precision (FP32)	9,3Tflops	12Tflops	5,5Tflops	7Tflops	2,2Tflops
Transistors	15,3 miljard	12 miljard	7,2 miljard	8 miljard	2,94 miljard
Tdp	300W	250W	50W-75W	250W	50W-75W
Manufacturing Process	TSMC 16nm	TSMC 16nm	TSMC 16nm	TSMC 28nm	TSMC 28nm
GPU	GP100	GP102	GP104	GM200	GM206

Vorig nieuwsartikel Volgend nieuwsartikel

Door Olaf van Miltenburg

Nieuwscoördinator

Feedback • 13-09-2016 12:27 28

13-09-2016 • 12:27

Lees meer

Nvidia presenteert Tesla T4-accelerator met Turing-gpu Nieuws van 13 september 2018

Nvidia voorziet Quadro-kaart voor workstations van GP100-gpu en 16GB hbm2 Nieuws van 6 februari 2017

Nvidia's SaturnV-supercomputer met Pascal-gpu's is efficiëntste tot nu toe Nieuws van 15 november 2016

Nvidia en Microsoft optimaliseren Cognitive Toolkit voor gpu's Nieuws van 15 november 2016

Nvidia introduceert Quadro P6000 met 24GB gddr5x Nieuws van 25 juli 2016

Nvidia kondigt Titan X met Pascal-gpu aan Nieuws van 22 juli 2016

Gerucht: Nvidia onthult GTX Titan met Pascal-gpu in augustus Nieuws van 5 juli 2016

Nvidia kondigt pci-e-versie van Tesla P100 aan Nieuws van 20 juni 2016

Nvidia presenteert GeForce GTX 1080 en 1070 met Pascal-gpu Nieuws van 7 mei 2016

Nvidia kondigt Tesla P100-accelerator met Pascal-gpu en 16GB hbm2-geheugen aan Nieuws van 5 april 2016

Meer producten en artikelen

Videokaarten Nvidia Nvidia Tesla

Reacties (28)

-Moderatie-faq

Wijzig sortering

Astennu

Videokaarten
Nvidia

13 september 2016 12:44

De GP100 heeft ook veel betere FP64 performance (Double Precision) die hardware units zijn niet in die aantallen aanwezig in de GP102.

Titan X Pascal doet slechts 384 Gflops FP64 vs 4700 gflops voor de GP100 Tesla kaart.

[Reactie gewijzigd door Astennu op 1 augustus 2024 11:25]

HKS-Skyline @Astennu • 13 september 2016 14:17

Dat zal hoofdzakelijk te danken zijn aan de bredere geheugenbus van HBM2.
Ik ben erg benieuwd hoe de desktop versies van deze kaarten gaan presteren in games. Het lijkt mij dat game engines drastische veranderingen door moeten voeren om hier optimaal gebruik van te kunnen maken. Misschien is dat dan ook wel de reden dat nvidia voor GDDR5 koos voor de 10 series.

Astennu

Videokaarten
Nvidia

@HKS-Skyline • 13 september 2016 16:38

Nee dat heeft daar helemaal niets mee te maken. De GP102 heeft een andere architectuur waarbij er niet zo veel FP64 units aanwezig zijn. De GP100 is met 601mm2 ook een heel stuk groter dan de GP102 die als ik mij niet vergis rond de 430mm2 zit.

HBM2.0 gaat ook alleen maar helpen als je veel geheugen bandbreedte nodig hebt. Bepaalde computer zaken zullen vooral shader limited zijn en dan hoeft een gddr5 kaart niet altijd langzamer te zijn. Met Fp32 kan deze kaart sneller zijn dan de duurdere P100 met HBM2.0 (doordat deze kaart 3840 shaders heeft ipv 3584)

[Reactie gewijzigd door Astennu op 28 juli 2024 00:42]

jqv @HKS-Skyline • 13 september 2016 16:38

Zucht.

Als je nu eens leest en jezelf beter informeert, dan weet je dat Tesla's niet gemaakt zijn voor games.
Staat redelijk duidelijk in de tekst waar nVidia zich op richt met deze kaarten.

Verwijderd @HKS-Skyline • 13 september 2016 20:30

Tesla serie is geen videokaart, zover ik weet beschikken ze niet eens over video uitgangen. De desktop versies zijn gewoon de geforce 1000 serie pascal kaarten aangeschien deze tesla kaarten ook de pascal architectuur hebben. Waarschijnlijk dacht je aan de quadro serie die voor workstations zijn.

MeMoRy 14 september 2016 11:38

Ik ben op dit moment voor een real-time DSP research project aan het kijken naar de P100 -de DGX-1 zelfs-, omdat ik bizar hoge data-rate heb die realtime verwerkt moet worden (eind doel ~4 Tb/s) . De berekeningen zijn (gelukkig) niet zo complex.

Wat vooral de bottleneck bij al dit soort GPU oplossing lijkt, is de (PCIe) interface. de P100 heeft (naast NVLINK) een Gen3 x16 connector. Daar gaat max ~16 Gbit/s overheen. Dat is dus 500M FP32/sec. Wat heb ik aan 10 TFLOP/s als ik de data niet snel genoeg de kaart in kan krijgen?

Misschien zijn er (nog) niet zo veel mensen die zo'n hoge bandbreedte nodig hebben, maar het valt me tegen dat Nvidia (nog) geen rekening hiermee houdt, en bijvoorbeeld (Q)SFP(+) connectoren op de kaarten plaatst.

robin15243 13 september 2016 13:46

Deze gpu wordt de basis van de Titan XP black edition? 8% meer rekeneenheden, en de volledige GP102 core unlocked.

aval0ne @robin15243 • 13 september 2016 14:38

Welke? Er staan er 5 in de tabel.

Verwijderd @aval0ne • 13 september 2016 17:46

De p40 lijkt me, want die heeft de gp102 core.

Boost9898 13 september 2016 12:45

Tesla P100, dit lijkt wel heel erg op de naam van de nieuwe snelle Tesla Auto. Want dat is namelijk Tesla Model S P100D. Is dit toeval?

Vizzie @Boost9898 • 13 september 2016 14:54

Ergens was ik teleurgesteld dat ze niet iets hadden gemaakt om die auto's nog harder te laten gaan

Xm0ur3r @Boost9898 • 13 september 2016 12:49

P100 kaart is alweer een tijdje aangekodigd, grote kans dat Musk dat inderdaad bewust gedaan heeft. Die man heeft wel een beetje humor; Model S, Model E, Model X en Model Y. $_/-\o_$

Edit: verduidelijking

Edit2: voor de mensen die het niet zien of nog niet weten: sexy

[Reactie gewijzigd door Xm0ur3r op 1 augustus 2024 11:25]

supersnathan94

@Xm0ur3r • 13 september 2016 13:29

En binnenkort de Model 3(sexy5youM9)

SpazzII @supersnathan94 • 13 september 2016 13:56

Model 3 = Model E. Alleen Model E mocht niet van een andere autofabrikant... Dus het wordt helaas S3XY. De 3 wordt dan wel weer geschreven als drie streepjes, zoals de E in het logo van Tesla. Dus toch wel weer een beetje S≡XY.

CEx @Xm0ur3r • 13 september 2016 12:59

Mwah dat denk ik niet (het bewust gedaan gedeelte) de P staat simpelweg voor "Performance" zo was er al veel eerder de P85.

Xm0ur3r @SuperDre • 13 september 2016 13:46

Daar zijn de meningen over verdeeld, hoewel ik het eerst met u eens was is mijn mening bijgedraaid wanneer ik hem uitgebreid in het echt van binnen en van buiten heb mogen bewonderen. Wat ik dan wel echt het meest lelijke vind is de zwart plastic achterkant van de stoelen.

De Model S blijft echter mijn voorkeur bieden qua uiterlijk uiteraard.

Verwijderd 13 september 2016 13:24

waarom is de term "co-processor" niet gevallen? want dat is wat ze zijn. co-processors geen "accelerators" dat is een marketing term.

supersnathan94

@Verwijderd • 13 september 2016 13:30

Het idee van een co-processor is toch juist dat het allemaal wat meer kracht onderin heeft -> acceleratie.

MSalters @Verwijderd • 13 september 2016 15:01

De klassieke co-processor heeft geen eigen Instruction Stream. Voorbeeld: de 487 FPU gebruikte de Instruction Stream van de 486 CPU. Deze accelerators hebben eigen cores met elk eigen instruction streams.

Chaosstorm @jjeggink • 13 september 2016 12:37

Technisch gezien wel, maar volgens mij hebben deze geen aansluiting voor een beeldscherm

Xm0ur3r @Chaosstorm • 13 september 2016 12:44

Hoeft ook niet, je kan hem inzetten als gpu accelerator op een Windows Server op een virtuele machine bijvoorbeeld. Vervolgens op afstand benaderen.

NESFreak @Chaosstorm • 13 september 2016 12:48

Dat zou geen probleem moeten zijn als je hier nvidia optimus/bumblebee op zou kunnen draaien. Dan kun je de output van je intel igp gebruiken (of doorlussen over vnc).

nvidia heeft hier zelfs een tutorial voor (linux) http://www.nvidia.com/content/pdf/remote-viz-tesla-gpus.pdf

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (28)

Sorteer op:

Weergave: