Nvidia brengt Tesla K80 met 24GB geheugen uit - update

Nvidia komt met een nieuwe Tesla-videokaart voor high performance computing uit: de Tesla K80. De kaart beschikt over twee Kepler-gpu's en via de twee 384bit-interfaces kan in totaal 24GB aan gddr5-geheugen aangesproken worden.

Een officiële introductie is er nog niet maar die moet snel volgen blijkt uit het bericht op WccfTech. De Tesla K80 bevat een duo KGK210-gpu's voor een totaal van 4992 cuda-cores, 416 tmu's en 96 rop's. De 384bit brede geheugeninterfaces spreken twee keer 12GB gddr5 aan.

De corekloksnelheid bedraagt 870MHz en het geheugen is op 5GHz geklokt. De bandbreedte komt uit op 480GB/s en volgens Nvidia liggen de prestaties bij double precision-berekeningen op 2,9 teraflops terwijl de singleprecision-prestaties op 8 teraflops zouden liggen. Daarmee is de kaart dubbel zo snel als de Tesla K40, claimt Nvidia. De Tesla-kaarten worden ingezet voor supercomputers en andere high performance computing-toepassingen, waar ze bijvoorbeeld wetenschappelijk rekenwerk verrichten. De prijs zou in de VS 7000 dollar bedragen, omgerekend 5600 euro.

Update, 16.00: Nvidia heeft de Tesla K80 inmiddels zelf aangekondigd.

Reacties (94)

vinx77 18 november 2014 06:08

Het is eigenlijk gewoon een dubbele K40. Discussies hier op SC14 gaan vooral over hoe ze een dubbele K40 (225 Watt) in 300 Watt hebben gekregen. En welke specs vallen onder AutoBoost en welke onder de gewone NonBoost. Hopelijk krijgen we morgen hierop antwoorden.

Wat wel veranderd is, is dat het aantal registers and L1-cache beide verdubbeld zijn. Dat betekent dat CUDA en OpenCL een hogere "occupancy" behaald kan worden bij complexe an grote kernels.

Anonymoussaurus 17 november 2014 14:37

Mooie kaart en mooie specs

Ik vraag me af waarom ze geen 512 bit interface hebben.

Zal ook wel een goede videokaart zijn voor in de Tianhe-2: http://en.wikipedia.org/wiki/Tianhe-2

[Reactie gewijzigd door Anonymoussaurus op 23 juli 2024 00:04]

Ionicawa @Anonymoussaurus • 17 november 2014 14:47

Voornamelijk vanwege kosten en fysieke ruimte heeft nvidia de afgelopen aantal jaar niet meer aan een 512-bit interface gezeten.

Aan de andere kant, AMD is stappen aan het zetten naar een 4096-bit interface, meer info hier: https://www.youtube.com/watch?v=6KbazCnR4Mw#t=4748

[Reactie gewijzigd door Ionicawa op 23 juli 2024 00:04]

aval0ne @Ionicawa • 17 november 2014 15:12

Voornamelijk vanwege kosten en fysieke ruimte heeft nvidia NOOIT aan een 512-bit interface gezeten.

GTX280
GTX285
Quadro FX 5800
Tesla C1060
Tesla S1070

Allemaal 512 bit bussen.

[Reactie gewijzigd door aval0ne op 23 juli 2024 00:04]

ColinZ @aval0ne • 17 november 2014 15:32

Nvidia heeft inderdaad 512-bit interfaces gebruikt in het verleden. Daarna zijn ze overgegaan op veel smallere interfaces. De GTX480, GTX580 en GTX780 waren allemaal 384-bit. De GTX680 en GTX980 hebben zelfs maar een 256-bit bus.
De GTX285 was de laatste consumenten kaart met een 512-bit bus. Zo'n grote bus neemt veel die ruimte in beslag, en heeft ook een negatieve impact op het verbruik.

AMD gebruikt wel nog 512-bit op de R9 290/290X, maar geruchten gaan dat ze de volgende generatie overstappen op HBM ipv. GDDR5.

dusty-2011 @ColinZ • 17 november 2014 16:29

De GTX 970 en GTX 980 gebruiken een nieuwe generatie lossless-compressie, die zo'n 25% efficiënter is dan de vorige generatie. Daarom is de geheugenbus van 256 bit geen probleem.

Door gebruik van efficiëntere compressie kan een geheugenbus van 256 bit tegenwoordig véél meer aan dan eentje van 5 jaar geleden.

vinkjb @ColinZ • 17 november 2014 16:01

http://www.alternate.nl/E...duct/1138825?tk=7&lk=9377

768bit

Thomg @vinkjb • 17 november 2014 16:06

Eerder 2x 384 bit.

Ionicawa @aval0ne • 17 november 2014 15:42

Je hebt helemaal gelijk, ik heb mijn reactie hierop aangepast

vinkjb @aval0ne • 17 november 2014 16:02

http://www.alternate.nl/E...duct/1138825?tk=7&lk=9377
768bits

Mektheb @aval0ne • 17 november 2014 16:56

GTX 285 was echt een top kaart !

Rudie_V @Ionicawa • 17 november 2014 15:25

Met stacked ram willen ze de 4096 bit geheugen interface fabriceren, het zijn nog wel geruchten:
http://www.kitguru.net/co...extreme-memory-bandwidth/
http://www.eteknix.com/am...ture-4096-bit-memory-bus/
http://riqqle.com/upcomin...390x-4096-bit-memory-bus/

Anonymoussaurus @Ionicawa • 17 november 2014 14:48

Oke, want ik weet wel dat er volgens mij een paar game videokaarten zijn die een 512 bit geheugenbus hebben.

Soulaiman @Anonymoussaurus • 17 november 2014 15:12

Ja in de GTX 2xx serie waren er een paar en ook een aantal goedkope GT kaarten hebben een 512 bit bus.

ansteygo 17 november 2014 14:37

Er kan 24 gb aangesproken worden, dus dat is effectief 12 gb toch?

hylke94 @ansteygo • 17 november 2014 14:39

Yep, het ram op de kaart is verdeeld op beide gpu's. Elke gpu heeft dezelfde info nodig, dus het is eigenlijk twee keer 12 GB.

anodesni @hylke94 • 17 november 2014 14:44

Elke gpu heeft dezelfde info nodig

Wat is dan het voordeel van de 2e gpu? Je wilt toch juist alle data verdelen over beide GPUs, zodat ze ieder de helft van het werk doen?

hylke94 @anodesni • 17 november 2014 14:47

Het rekenwerk wordt wel verdeeld, maar beide gpu's moeten wel weten welke beelden er worden verstuurd en wat er gemaakt moet worden.

.ScorpionSquad @hylke94 • 17 november 2014 15:04

Ware het niet dat deze kaarten eerder met honderden tegelijk aan het werk zijn en dus helemaal niet bezig zijn met beeldverwerking of creatie maar gewoon met diehard parallel simuleren.

Dit is vooral een design om zo veel mogelijk rekenkracht in een zo klein mogelijke ruimte te stoppen.

pindamaster @hylke94 • 17 november 2014 19:56

Ik vraag me af of ze bijde hetzelfde gebruiken aangezien Tesla kaarten niet in sli worden gezet omdat ze bijde GPU's aan andere instructies werken en dus waarschijnlijk niet het geheugen delen.

cold @poor Leno • 17 november 2014 14:48

Dit is geen Videokaart waar het beeld tussen de twee GPU's wordt verdeeld en alle textures ed dus voor elke GPU beschikbaar moet zijn, deze TESLA wordt ingezet voor HPC waarbij er wel effectief van 24GB RAM gebruik gemaakt kan worden.

Cergorach @cold • 17 november 2014 18:01

Er zit zo te zien niet eens een videokaart aansluiting op de kaart, het is inderdaad puur een rekenunit.

Anonymoussaurus @poor Leno • 17 november 2014 14:46

Ik snap je, het is alleen wel best logisch. Er wordt vermeld:

De 384bit brede geheugeninterfaces spreken in totaal 24GB gdd5 aan.

poor Leno @Anonymoussaurus • 17 november 2014 14:48

Misschien wel soort van logisch, maar totaal nutteloos..

@Cold hieronder:

In dat geval heb ik niets gezegd

[Reactie gewijzigd door poor Leno op 23 juli 2024 00:04]

martijnve @ansteygo • 17 november 2014 14:47

Bij SLI moeten de beide kaarten/chips dezelfde data in memory hebben om dezelfde scene te kunnen renderen. Dus feectief heb je 2x de rekekenkracht maar slechts het memory van één kaart. Marketing laat dat feitje uiteraard achterwegen.

Dit is echter geen SLI. Zolang je de data netjes over de twee chips verdeeld zouden ze niet over duplicate data moeten hoeven beschikken en zou je dus (bija) het volledige memory moeten kunnen gebruiken.

[Reactie gewijzigd door martijnve op 23 juli 2024 00:04]

Thekilldevilhil @supersnathan94 • 17 november 2014 15:24

Deze GPU's draaien niet in SLI. SLI is een game land feature.

martijnve @supersnathan94 • 17 november 2014 16:20

Nee, want ook bij alternate frame rendering hebben de beide kaarten voor 98% dezelfde textures en modellen om te renderen. Als een kaart compute werk staat te doen waar deze tesla voor gemaakt is kunnen ze op (vrijwel) volledig onafhankelijke data werken.

aadje93 @supersnathan94 • 17 november 2014 18:46

SLI is puur voor game makers bedoeld, daar hebben *alle* gpu's *alle* textures nodig en de driver bepaald dan continu welke gpu wat berekend (Bijvoorbeeld oneven en even lijnen) Deze kaarten hebben niet eens een SLI aansluitingen.

Als voorbeeld;

Ik doe zelf zeer actief mee aan BOINC (google) hiervoor heb ik 2 rigs met per rig 4 maal 7950 (goed amd...) Deze zitten vrolijk zonder crossfire bridges of beeldscherm dummys dag en nacht hun werk op 100% te doen met een celeron g1610 als cpu.

De gpu's worden amper aangestuurd door de cpu (rig draait vrij kale windows 7 maar ondanks dat hoogstens 20% cpu gebruik)

Dit soort kaarten draaien op exact hetzelfde principe (er zal dan wel een leuke xeon cpu ingaan, maar alsnog) Er is geen onderlinge verbindinding tussen de kaarten nodig. Om die reden klopt het feitelijk dus WEL dat er 24GB geheugen op de kaart zit, alleen weet ik niet of dit door bijde gpu's aangesproken kan worden, of dat het 2 losse interfaces zijn naar de gpu's (ik weet niet of geheugen door 2 interfaces benaderd kan worden, zodat de gpus dus wel geheugen kunnen delen, immers delen cpu's op een multi socket moederbord ook het totale geheugen dat beschikbaar is)

trub 17 november 2014 14:45

Moeten deze eigenlijk nog de noemer videokaart krijgen? Ze hebben geen uitgangen meer en worden vermoedelijk voor heel wat andere berekeningen gebruikt dan enkel rendering.

33Fraise33 @trub • 17 november 2014 14:47

Je hebt hier wel een punt inderdaad een andere benaming zou wel prettig zijn al is het om de klant ook beter duidelijk te maken dat het om een ander product gaat.

Aardwolf @33Fraise33 • 17 november 2014 15:03

Want een videokaart moet altijd uitgangen hebben die je daadwerkelijk ook gebruikt? Bij multiple videokaarten in 1 systeem gebruik je er meestal toch maar 1 of 2 om spul aan te sluiten. Spreken we dan bij de rest van geen videokaart meer? Lijkt me sterk.

Ben wel eens dat het ook mij onduidelijk is wanneer je van iets spreekt: CPU, co-processor of GPU. Wanneer is iets van dit type? Ligt het softwarematig aan de code die nodig is of juist hardwarematige kenmerken zoals het aantal cores/bandbreedte/hoeveelheid geheugen?

mission 17 november 2014 15:02

kan iemand mij uitleggen wat je aan een hele dikke gpu hebt, zonder uitgang voor een monitor?

als dit ding puur voor rekenen is, waarom dan geen blade server?

[Reactie gewijzigd door mission op 23 juli 2024 00:04]

halofreak1990 @mission • 17 november 2014 15:28

Omdat een blade server bij lange na niet dezelfde parallelle computing performance heeft als één zo'n Tesla kaart.

Blazing-Studios @mission • 17 november 2014 15:37

Een tesla (vaak meerdere) worden op een moederbord geprikt wat of zelf een video uitgang heeft of remote via een network benaderd kan worden.
Verder is dit niet zo zeer een GPU (G=Graphics) maar een accelerator card die bepaalde (mits voor deze kaarten geoptimaliseerde) taken veel sneller uit kan voeren.
APU zou beter passend zijn maar die term wordt al gebruikt voor simpele AMD CPU's (hoewel Nvidia die term volgens mij wel eens in een keynote gebruikt heeft).

Het gaat hier om simulaties op het level van: Hoe zag de big bang er uit in de 10 miliseconden na de big-bang.

En geen bladeserver om het feit dat er tussen de 4/8 van deze kaarten op een moederbord passen waardoor ze een veel densere configuratie mogelijk maken (voor deze specifieke taken) dan met een blade server die nog steeds op CPU's werkt.

Eigen inbreng: Ik vermoed (kijkende naar hoe het tot nu toe loopt) dat de high-end consumenten kaarten over een jaar of 4/5 op dit niveau zitten (GTX Titan 3?).

Seal64 @mission • 17 november 2014 15:28

Dit ding zal wel ín een server gaan, neem ik aan. Ik zie niet echt iets van een ventilator in die kap zitten en met een dergelijke set aan GPU's heb je aardig wat hitte af te voeren - dat zal dan dus van de behuizing waar de kaart in gaat moeten gaan komen, lijkt me.

Eldunari 17 november 2014 15:32

Wat is nou het verschil tussen de Tesla en Quadro reeks? Het zijn allebij reeksen die op de zakelijke markt gericht zijn, en er zijn in allebij de reeksen zeer krachtige kaarten te vinden.

aval0ne @Eldunari • 17 november 2014 15:51

NVIDIA markt segmenten:

Consumer: GeForce
Professional graphics (workstation & mobile): Quadro
High performance computing (server): Tesla

Tesla:

floating-point calculations (simulations, large scale calculations)
high-end image generation (professional, scientific fields)

[Reactie gewijzigd door aval0ne op 23 juli 2024 00:04]

benji83 @Eldunari • 17 november 2014 16:30

Het heeft een compleet ander doel, de Quadro is een videokaart zoals deze ooit bedoeld was. De Tesla kaarten gebruiken dezelfde soort technologie maar zijn bedoeld voor HPC, heftige parallele berekeningen.

mikat @benji83 • 18 november 2014 17:05

Wat kan de Quadro dan goed? want workstation dingen zijn toch ook meestal direct compute of niet?

benji83 @mikat • 19 november 2014 12:00

De Quadro is een videokaart, de Tesla niet. Dat is het simpele verschil.

mikat @benji83 • 21 november 2014 09:01

dus de tesla kan niet renderen voor video bewerken enzo?

benji83 @mikat • 21 november 2014 10:49

Oh, dat zal hij best kunnen, het is wel gebaseerd op dezelfde technologie, alleen is hij toegespitst op HPC taken, bedoeld om in een supercomputer te schuiven en daar complexe parallele berekeningen uit te voeren.
Een 'normale' CPU kan ook renderen, alleen minder efficient.

ATS79 @Eldunari • 17 november 2014 15:46

de output (heeft quadro wel)
en het doel; quadro is meer voor workstations.

dimi 17 november 2014 14:41

Ik vraag me wel eens af waarom ze nog computers om die dingen heen bouwen.... SSD er in en Thunderbolt of USB3. Ohja, en een beetje stroom...

$_/-\o_$

Verwijderd @dimi • 17 november 2014 15:19

En een moederbord. En een behuizing. Oh wacht, dan heb je weer een pc.

33Fraise33 17 november 2014 14:42

But the main question: can you game on it?!

Mooie ontwikkeling maar zoals ik voorgaand zeg zal het waarschijnlijk wel meer op het zwaar werk gericht zijn dan op games.

EDIT: Zoals AnonymousWP zegt: inderdaad geen output dus sowiezo al geen optie

[Reactie gewijzigd door 33Fraise33 op 23 juli 2024 00:04]

Anonymoussaurus @33Fraise33 • 17 november 2014 14:44

Nee, zoals Midas.e al zei:

Nee. Aangezien ten eerste de kaart geen video output heeft en ten 2e de code niet geschreven is voor de kepler serie.

33Fraise33 @Anonymoussaurus • 17 november 2014 14:45

Wauw inderdaad nu je het zegt ik had er nog niet eens op gelet dat er geen output was.

Seal64 @Anonymoussaurus • 17 november 2014 15:25

Is een output noodzakelijk? Als je twee kaarten in SLI hangt, gebruik je van één van die twee de output ook niet. Moet je er wel altijd een tweede kaart naast hangen...

Anonymoussaurus @Seal64 • 17 november 2014 15:33

Ja, maar hoe wil je anders beeld hebben als geen van je kaarten een output bevat.
En je kan geen verschillende kaarten met elkaar laten werken dus dat werkt ook niet.

[Reactie gewijzigd door Anonymoussaurus op 23 juli 2024 00:04]

pindamaster @Seal64 • 17 november 2014 19:59

eeh, dat gaat niet lukken. tesla's zijn niet gemaakt om op te gamen of iets in die richting puur om mee te rekenen

qbig1970 @33Fraise33 • 17 november 2014 14:45

je beantwoord je eigen vraag...

ASP 17 november 2014 14:37

Kan ik hiermee weer bitcoins gaan minen en levert het nog winst op?

Gamebuster @ASP • 17 november 2014 14:41

Ja, dat kan.
Nee, je hebt er geen winst op.

[Reactie gewijzigd door Gamebuster op 23 juli 2024 00:04]

TheLastOttoman 17 november 2014 15:22

Stomme vraag, grote zucht, daar komt ie:

Waarom slechts 870mhz core clock. Ik snap dat dit niet voor gamen bedoeld is maar het zou toch handig zijn om een snellere kloksnelheid te hebben?

RGAT @TheLastOttoman • 17 november 2014 15:43

Dit soort kaarten doen grote zware berekeningen, maar niet in een keer. Dan gaat het meer om parallel kunnen rekenen met een bootlading aan cores bijv. zodat miljoenen simpele berekeningen tot het gewenste resultaat komen.

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (94)

Sorteer op:

Weergave: