Nvidia heeft een nieuwe acceleratorkaart aangekondigd voor high performance computing. De Tesla P100 heeft een GP100-gpu die is gebaseerd op de Pascal-architectuur en is bedoeld voor gpgpu-toepassingen als deep learning en ontwikkelen van kunstmatige intelligentie.
Jen-Hsun Huang, ceo van Nvidia, kondigde de Tesla P100 aan tijdens de GPU Technology Conference. De accelerator beschikt over de nieuwe GP100-gpu die bestaat uit 15,3 miljard transistors. Dat is bijna het dubbele van de GM200-gpu van de Maxwell-generatie, die uit maximaal 8 miljard transistors bestaat. Volgens Huang is er drie jaar lang gewerkt aan de chip en was er met research & development twee tot drie miljard dollar aan kosten gemoeid.
Nvidia heeft tijdens de keynote nog niets losgelaten over nieuwe videokaarten voor consumenten. Opvallend is dat de Tesla P100 gebruikmaakt van 16GB hbm2-geheugen, waarschijnlijk van Samsung. Recente geruchten leken juist aan te duiden dat de nieuwe GeForce-kaarten gddr5x-geheugen zouden krijgen. Wel is zeker dat toekomstige GeForce-videokaarten gebruik zullen maken van dezelfde Pascal-architectuur als de Tesla P100.
De Tesla P100 heeft verder 4MB L2-cache en 14MB sm rf, dat met een snelheid van 80TB/s met de chip kan communiceren. De GP100-gpu is gemaakt op een 16nm-finfet-procedé en heeft een rekenkracht van 5,3 teraflops bij fp64-doubleprecisionrekenwerk. Bij fp32-singleprecision is dat 10,6 teraflops en bij fp16 neemt dat toe tot 21,2 teraflops.
De GP100 bestaat uit een samenstelling van graphics processing clusters, streaming multiprocessors en geheugencontrollers. De chip beschikt over zes gpc's, tot 60 sm's en acht 512bit-geheugencontrollers, wat neerkomt op een geheugenbus van 4096bit breed. Iedere Streaming Multiprocessor op de gpu heeft 64 cudacores en 4 texture-units. Goed voor een totaal van 3840 cudacores en 240 texture-units. Bij de Tesla P100 zijn 3584 cores ingeschakeld. De gpu heeft een kloksnelheid van 1328MHz met boostclock van 1480MHz.
De Tesla-accelerators zijn bedoeld voor zakelijke toepassingen en de P100 bevindt zich aan de top van dat segment. De chip is momenteel in massaproductie en Nvidia zegt de eerste exemplaren zo snel mogelijk te leveren aan grote bedrijven voor gebruik in hun hyperscale-datacenters. Later zullen oem's zoals Dell, HP en IBM de beschikking krijgen over de accelerators, zodat ze deze in kunnen bouwen in servers. Die servers met Tesla P100 komen in het eerste kwartaal van 2017 op de markt volgens Nvidia.
Zelf brengt Nvidia de DGX-1 uit, naar eigen zeggen een 'supercomputer', die is voorzien van acht Tesla P100-accellerators. De kaarten communiceren onderling met de Nvidia nvlink-interface, die vijf keer de snelheid van pci-e-3.0 biedt. Een enkele node is goed voor 170 teraflops aan rekenkracht met fp16-halfprecisie. Met rack vol van deze servers is 2 petaflops mogelijk. In de Nvidia DGX-1, die 129.000 dollar kost, zitten twee Intel Xeon E5-2698 v3-processors, 512GB ddr4-ram en vier 1,92TB-ssd's in raid 0-opstelling. De eerste exemplaren worden geleverd aan onderzoekafdelingen van universiteiten.
Tesla-accelerators | Tesla K40 | Tesla M40 | Tesla P100 |
GPU | GK110 (Kepler) | GM200 (Maxwell) | GP100 (Pascal) |
Sm's | 15 | 24 | 56 |
Tpc's | 15 | 24 | 28 |
FP32 cudacores / sm | 192 | 128 | 64 |
FP32 cudacores / gpu | 2880 | 3072 | 3584 |
FP64 cudacores / sm | 64 | 4 | 32 |
FP64 cudacores / gpu | 960 | 96 | 1792 |
Baseclock | 745 MHz | 948 MHz | 1328 MHz |
Gpu-boostclock | 810/875 MHz | 1114 MHz | 1480 MHz |
Singleprecision | 4,3 tflops | 7 tflops | 10,6 tflops |
Doubleprecision | 1,43 tflops | 0,2 tflops | 5,3 tflops |
Texture Units | 240 | 192 | 224 |
Geheugeninterface | 384-bit gddr5 | 384-bit gddr5 | 4096-bit hbm2 |
Geheugengrootte | Tot 12GB | Tot 24GB | 16GB |
L2-cache |
1536KB | 3072KB | 4096KB |
Register file size / sm | 256KB | 256KB | 256KB |
Register file size / gpu | 3840KB | 6144KB | 14336KB |
Tdp | 235 Watts | 250 Watts | 300 Watts |
Transistors | 7.1 miljard | 8 miljard | 15.3 miljard |
Gpu die-formaat | 551mm² | 601mm² | 610mm² |
Ontwerpproces | 28nm | 28nm | 16nm |
Vergelijking van de nieuwe GP100-gpu met de GM200- en GK-110 van de vorige generaties.