Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 28 reacties

Nvidia heeft twee nieuwe Tesla-kaarten met Pascal-gpu's aangekondigd. De Tesla P40 is gebaseerd op een GP102-gpu met 3840 cudacores. Dat is meer dan de Tesla P100, Nvidia's krachtigste accelerator, maar de P40 bevat geen hbm2-geheugen.

De Tesla P40 en P4 zijn de opvolgers van de M40 en M4, die nog Maxwell-gpu's bevatten. Prijzen maakt Nvidia nog niet bekend, maar de P40- en P4-kaarten zullen betaalbaarder zijn dan de high-end P100, zodra ze in respectievelijk oktober en november beschikbaar komen.

Nvidia richt zich met de kaarten op inferencing-toepassingen, waarbij deep neural networking wordt gebruikt om spraak, beeld en tekst te herkennen. Nvidia koppelt de introductie van de kaarten dan ook aan twee softwaretools. TensorRT is een bibliotheek voor het optimaliseren van deep learning-modellen, terwijl de DeepStream-sdk het decoderen en analyseren van videostreams door kunstmatige intelligentie moet versnellen.

Opvallend is dat Nvidia bij de P40 3840 streamprocessors heeft geactiveerd, waarbij dit bij het 'vlaggenschip' P100 3584 is. Die kaart beschikt echter over een flink bredere geheugeninterface in combinatie met snel hbm2-geheugen. Hierdoor ligt de geheugenbandbreedte van de P100 ten opzichte van de P40 een stuk hoger: 720GB/s tegenover 346GB/s. Met de Tesla P100 richt Nvidia zich meer op het trainen van deep-learningnetwerken, dankzij de aanzienlijke fp16-rekenkracht van 21,2 teraflops.

Tesla P40 P4Tesla P40 P4

Nvidia Tesla
  Tesla P100 Tesla P40 Tesla P4 Tesla M40 Tesla M4
Cudacores 3584 3840 2560 3072 1024
Kloksn. 1328MHZ 1303MHz 810MHz 948MHz 872MHz
Boostkloksnl. 1480MHz 1531MHz 1063MHz 1114MHz 1072MHz
Geheugeninterface 4096bit hbm2 384bit gddr5 256bit gddr5 384bit gddr5 128bit gddr5
Geheugenhoeveelh. 16GB 24GB 8GB 12GB/24GB 4GB
Geheugenbandbr. 720GB/s 346GB/s 192GB/s 288GB/s 88GB/s
Single Precision (FP32) 9,3Tflops 12Tflops 5,5Tflops 7Tflops 2,2Tflops
Transistors 15,3 miljard 12 miljard 7,2 miljard 8 miljard 2,94 miljard
Tdp 300W 250W 50W-75W 250W 50W-75W
Manufacturing Process TSMC 16nm TSMC 16nm TSMC 16nm TSMC 28nm TSMC 28nm
GPU GP100 GP102 GP104 GM200 GM206
Moderatie-faq Wijzig weergave

Reacties (28)

De GP100 heeft ook veel betere FP64 performance (Double Precision) die hardware units zijn niet in die aantallen aanwezig in de GP102.

Titan X Pascal doet slechts 384 Gflops FP64 vs 4700 gflops voor de GP100 Tesla kaart.

[Reactie gewijzigd door Astennu op 13 september 2016 12:50]

Dat zal hoofdzakelijk te danken zijn aan de bredere geheugenbus van HBM2.
Ik ben erg benieuwd hoe de desktop versies van deze kaarten gaan presteren in games. Het lijkt mij dat game engines drastische veranderingen door moeten voeren om hier optimaal gebruik van te kunnen maken. Misschien is dat dan ook wel de reden dat nvidia voor GDDR5 koos voor de 10 series.
Nee dat heeft daar helemaal niets mee te maken. De GP102 heeft een andere architectuur waarbij er niet zo veel FP64 units aanwezig zijn. De GP100 is met 601mm2 ook een heel stuk groter dan de GP102 die als ik mij niet vergis rond de 430mm2 zit.

HBM2.0 gaat ook alleen maar helpen als je veel geheugen bandbreedte nodig hebt. Bepaalde computer zaken zullen vooral shader limited zijn en dan hoeft een gddr5 kaart niet altijd langzamer te zijn. Met Fp32 kan deze kaart sneller zijn dan de duurdere P100 met HBM2.0 (doordat deze kaart 3840 shaders heeft ipv 3584)

[Reactie gewijzigd door Astennu op 13 september 2016 16:38]

Zucht.

Als je nu eens leest en jezelf beter informeert, dan weet je dat Tesla's niet gemaakt zijn voor games.
Staat redelijk duidelijk in de tekst waar nVidia zich op richt met deze kaarten.
Tesla serie is geen videokaart, zover ik weet beschikken ze niet eens over video uitgangen. De desktop versies zijn gewoon de geforce 1000 serie pascal kaarten aangeschien deze tesla kaarten ook de pascal architectuur hebben. Waarschijnlijk dacht je aan de quadro serie die voor workstations zijn.
Ik ben op dit moment voor een real-time DSP research project aan het kijken naar de P100 -de DGX-1 zelfs-, omdat ik bizar hoge data-rate heb die realtime verwerkt moet worden (eind doel ~4 Tb/s) . De berekeningen zijn (gelukkig) niet zo complex.

Wat vooral de bottleneck bij al dit soort GPU oplossing lijkt, is de (PCIe) interface. de P100 heeft (naast NVLINK) een Gen3 x16 connector. Daar gaat max ~16 Gbit/s overheen. Dat is dus 500M FP32/sec. Wat heb ik aan 10 TFLOP/s als ik de data niet snel genoeg de kaart in kan krijgen?

Misschien zijn er (nog) niet zo veel mensen die zo'n hoge bandbreedte nodig hebben, maar het valt me tegen dat Nvidia (nog) geen rekening hiermee houdt, en bijvoorbeeld (Q)SFP(+) connectoren op de kaarten plaatst.
Deze gpu wordt de basis van de Titan XP black edition? 8% meer rekeneenheden, en de volledige GP102 core unlocked.
Welke? Er staan er 5 in de tabel.
De p40 lijkt me, want die heeft de gp102 core.
Tesla P100, dit lijkt wel heel erg op de naam van de nieuwe snelle Tesla Auto. Want dat is namelijk Tesla Model S P100D. Is dit toeval? :*)
Ergens was ik teleurgesteld dat ze niet iets hadden gemaakt om die auto's nog harder te laten gaan :)
P100 kaart is alweer een tijdje aangekodigd, grote kans dat Musk dat inderdaad bewust gedaan heeft. Die man heeft wel een beetje humor; Model S, Model E, Model X en Model Y. _/-\o_

Edit: verduidelijking

Edit2: voor de mensen die het niet zien of nog niet weten: sexy

[Reactie gewijzigd door Xm0ur3r op 13 september 2016 13:24]

En binnenkort de Model 3(sexy5youM9)
Model 3 = Model E. Alleen Model E mocht niet van een andere autofabrikant... Dus het wordt helaas S3XY. De 3 wordt dan wel weer geschreven als drie streepjes, zoals de E in het logo van Tesla. Dus toch wel weer een beetje S≡XY.
Mwah dat denk ik niet (het bewust gedaan gedeelte) de P staat simpelweg voor "Performance" zo was er al veel eerder de P85.
Daar zijn de meningen over verdeeld, hoewel ik het eerst met u eens was is mijn mening bijgedraaid wanneer ik hem uitgebreid in het echt van binnen en van buiten heb mogen bewonderen. Wat ik dan wel echt het meest lelijke vind is de zwart plastic achterkant van de stoelen.

De Model S blijft echter mijn voorkeur bieden qua uiterlijk uiteraard.
waarom is de term "co-processor" niet gevallen? want dat is wat ze zijn. co-processors geen "accelerators" dat is een marketing term.
Het idee van een co-processor is toch juist dat het allemaal wat meer kracht onderin heeft -> acceleratie.
De klassieke co-processor heeft geen eigen Instruction Stream. Voorbeeld: de 487 FPU gebruikte de Instruction Stream van de 486 CPU. Deze accelerators hebben eigen cores met elk eigen instruction streams.
Technisch gezien wel, maar volgens mij hebben deze geen aansluiting voor een beeldscherm :P .
Hoeft ook niet, je kan hem inzetten als gpu accelerator op een Windows Server op een virtuele machine bijvoorbeeld. Vervolgens op afstand benaderen.
Dat zou geen probleem moeten zijn als je hier nvidia optimus/bumblebee op zou kunnen draaien. Dan kun je de output van je intel igp gebruiken (of doorlussen over vnc).

nvidia heeft hier zelfs een tutorial voor (linux) http://www.nvidia.com/content/pdf/remote-viz-tesla-gpus.pdf


Om te kunnen reageren moet je ingelogd zijn



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True