Nvidia heeft pci-e-versies van de Tesla P100-accelerator aangekondigd. Nvidia onthulde de hpc-kaart met Pascal-gpu al in april, maar die versie beschikte over een door de fabrikant zelf ontwikkelde Mezzanine-connector.
Nvidia maakt eind dit jaar twee versies van de pci-e-variant van de P100 beschikbaar: een met 16GB hbm2 en een met 12GB. De kaarten beschikken niet over de nvlink-interconnect: voor die interface waarmee P100-kaarten onderling kunnen communiceren heeft Nvidia zijn eigen Mezzanine-connector ontwikkeld.
De kaarten beschikken over iets lagere boost-kloksnelheden dan de Mezzanine-versie en ook de tdp is lager: 250W in plaats van 300W. De 12GB-versie van de pci-e-P100 beschikt bovendien over een 3072 bits brede geheugenbus, tegenover de 4096bit-interface van de overige twee kaarten. Net als de P100-kaart die Nvidia in april aankondigde, gaat het om accelerators voor high performance computing zoals supercomputers met een Pascal-gpu en high bandwidth memory van de tweede generatie.
Nvidia kondigde de P100-kaarten aan tijdens de International Supercomputing Conference in Frankfurt.
Nvidia Tesla-familie | ||||||
---|---|---|---|---|---|---|
Tesla P100 (Mezzanine) |
Tesla P100 (16GB) |
Tesla P100 (12GB) |
Tesla M40 | |||
Streamprocessors | 3584 | 3584 | 3584 | 3072 | ||
Core-kloksnelh. | 1328MHz | ? | ? | 948MHz | ||
Boost-kloksn. | 1480MHz | 1300MHz | 1300MHz | 1114MHz | ||
Geheugen kloksn. | 1,4Gbit/s HBM2 | 1,4Gbit/s HBM2 | 1,4Gbit/s HBM2 | 6Gbit/s gddr5 | ||
Geheugenbus | 4096-bit | 4096-bit | 3072-bit | 384-bit | ||
Geheugenbandbreedte | 720GB/sec | 720GB/sec | 540GB/sec | 288GB/sec | ||
Geheugenhoeveelheid | 16GB | 16GB | 12GB | 12GB | ||
Half Precision | 21,2 tflops | 18,7 tflops | 18,7 tflops | 6,8 tflops | ||
Single Precision | 10,6 tflops | 9,3 tflops | 9,3 tflops | 6,8 tflops | ||
Double Precision | 5,3 tflops (1/2 rate) |
4,7 tflops (1/2 rate) |
4,7 tflops (1/2 rate) |
213 gflops (1/32 rate) |
||
Gpu | GP100 (610mm2) |
GP100 (610mm2) |
GP100 (610mm2) |
GM200 | ||
Transistors | 15,3 miljard | 15,3 miljard | 15,3 miljard | 8 miljard | ||
Tdp | 300W | 250W | 250W | 250W | ||
Formfactor | Mezzanine | pci-e | pci-e | pci-e | ||
Koeling | N/A | passief | passief | passief | ||
Procede | tsmc 16nm finfet | tsmc 16nm finfet | tsmc 16nm finfet | tsmc 28nm | ||
Architectuur | Pascal | Pascal | Pascal | Maxwell 2 |
Tabel afkomstig van Anandtech