Nvidia heeft twee nieuwe Tesla-kaarten met Pascal-gpu's aangekondigd. De Tesla P40 is gebaseerd op een GP102-gpu met 3840 cudacores. Dat is meer dan de Tesla P100, Nvidia's krachtigste accelerator, maar de P40 bevat geen hbm2-geheugen.
De Tesla P40 en P4 zijn de opvolgers van de M40 en M4, die nog Maxwell-gpu's bevatten. Prijzen maakt Nvidia nog niet bekend, maar de P40- en P4-kaarten zullen betaalbaarder zijn dan de high-end P100, zodra ze in respectievelijk oktober en november beschikbaar komen.
Nvidia richt zich met de kaarten op inferencing-toepassingen, waarbij deep neural networking wordt gebruikt om spraak, beeld en tekst te herkennen. Nvidia koppelt de introductie van de kaarten dan ook aan twee softwaretools. TensorRT is een bibliotheek voor het optimaliseren van deep learning-modellen, terwijl de DeepStream-sdk het decoderen en analyseren van videostreams door kunstmatige intelligentie moet versnellen.
Opvallend is dat Nvidia bij de P40 3840 streamprocessors heeft geactiveerd, waarbij dit bij het 'vlaggenschip' P100 3584 is. Die kaart beschikt echter over een flink bredere geheugeninterface in combinatie met snel hbm2-geheugen. Hierdoor ligt de geheugenbandbreedte van de P100 ten opzichte van de P40 een stuk hoger: 720GB/s tegenover 346GB/s. Met de Tesla P100 richt Nvidia zich meer op het trainen van deep-learningnetwerken, dankzij de aanzienlijke fp16-rekenkracht van 21,2 teraflops.
Nvidia Tesla | ||||||
Tesla P100 | Tesla P40 | Tesla P4 | Tesla M40 | Tesla M4 | ||
Cudacores | 3584 | 3840 | 2560 | 3072 | 1024 | |
Kloksn. | 1328MHZ | 1303MHz | 810MHz | 948MHz | 872MHz | |
Boostkloksnl. | 1480MHz | 1531MHz | 1063MHz | 1114MHz | 1072MHz | |
Geheugeninterface | 4096bit hbm2 | 384bit gddr5 | 256bit gddr5 | 384bit gddr5 | 128bit gddr5 | |
Geheugenhoeveelh. | 16GB | 24GB | 8GB | 12GB/24GB | 4GB | |
Geheugenbandbr. | 720GB/s | 346GB/s | 192GB/s | 288GB/s | 88GB/s | |
Single Precision (FP32) | 9,3Tflops | 12Tflops | 5,5Tflops | 7Tflops | 2,2Tflops | |
Transistors | 15,3 miljard | 12 miljard | 7,2 miljard | 8 miljard | 2,94 miljard | |
Tdp | 300W | 250W | 50W-75W | 250W | 50W-75W | |
Manufacturing Process | TSMC 16nm | TSMC 16nm | TSMC 16nm | TSMC 28nm | TSMC 28nm | |
GPU | GP100 | GP102 | GP104 | GM200 | GM206 |