Omdat ik al een tijd lang video's soepeler (interpoleren) maak met Dain-App en gelimiteerd ben aan mijn GTX 1080ti met 11GB videogeheugen was ik opzoek naar een kaart met meer geheugen die zodoende native 1920x1080 video's kan interpoleren zonder te hoeven splitten in de software om niet buiten het videogeheugen te komen. Wanneer er niet genoeg videogeheugen over is om de nieuwe data in te laden mislukt de render. Splitten van een frame lost dit probleem op maar heeft als nadeel dat er vreemde lijnen in de video terecht komen.
Via via heb ik een Nvidia Tesla M40 aangeboden gekregen en besloten deze te gaan gebruiken omdat hierop 24GB Gddr5 geheugen zit wat goed van pas komt. Wat meteen opviel is de schaarste van informatie over deze kaart op het internet, waarschijnlijk omdat Nvidia deze kaart niet aan particulieren verkoopt en andere bedrijven die hem wel verkopen er astronomische bedragen voor vragen...
De kaart kwam netjes verpakt en beschermt binnen in een bulk doos, bij de kaart zat alleen een verloopstuk van dubbele pci 8 pins naar enkele cpu 8 pin om de videokaart van stroom te kunnen voorzien met een normale computer voeding.
De features van de kaart zijn eigenlijk zeer karig te noemen, er zitten geen beeldscherm aansluitingen op. Hij heeft OpenGL versie 1.1 (Niet van toepassing in WDDM mode, zie laatste edit) waardoor software zoals blender niet wilt opstarten met alleen deze videokaart er in. Hij is puur ontworpen voor CUDA workloads waarbij veel videogeheugen benodigd is.
Bij de eerste keer testen wilden de computer niet opstarten, na Google te hebben geraadpleegd kwam ik er achter dat "above 4g decoding" moet aan staan in de BIOS om deze kaart te laten werken met het moederbord en besturingssysteem. Na dit aangezet te hebben startte de computer direct op en kon ik via RDP verbinden. De kaart werd direct herkend en na de drivers voor Windows server 2016 datacenter geïnstalleerd te hebben kon ik hem gaan gebruiken.
Omdat de kaart passief gekoeld is en ik de kaart in een normale desktop wilden gebruiken had ik met een 3D geprinte fan mount gedacht de kaart koel te houden.
Helaas lukten het niet met een 60mm
Noctua fan en een snellere
Startech fan, de kaart koel te houden met als resultaat dat de kaart zich snel terug klokte naar 1/3 van de kloksnelheden om zich zelf te beschermen tegen oververhitting.
Ik had nog in gedachten om een 7500rpm 60mm fan te gaan gebruiken maar omdat de Startech 5000rpm fan al als een straaljager klonk heb ik dat plan maar niet uitgevoerd aangezien de pc in dezelfde kamer staat waarin ik gedurende dag studeer en werk.
Na een dag gezocht te hebben op het internet naar wat voor koeloplossing goed zou werken kwam ik tegen dat het PCB van de Tesla M40 hetzelfde is als die van een GTX 980ti en GTX Titan X kaart, dit versimpelde/versnelde het zoeken enorm.
Uiteindelijk heb ik mijn oog laten vallen op een Accelero Xtreme III Rev. 2 koeler van Arctic, een duits bedrijf wat zich volledig richt op het koelen van processoren en videokaarten.
Een paar dagen later viel de koeler op de mat en kon het ontleden van de videokaart gaan beginnen.
Met een kleine inbussleutel was de groene kap er gemakkelijk vanaf te halen waardoor het koelblok bloot komt te liggen. Nu kon ik de achterplaat van de videokaart volledig losschroeven en het koelblok van de videokaartkern verwijderen. Ook kon ik het het plastic/ metalen omhulsel voor de koeling van het videogeheugen en stroomregulatie loshalen van de videokaart. Nu kijken we tegen een "bloot" PCB aan.
Hierna ben ik gaan kijken naar wat voor onderdelen van de videokaart allemaal verbonden zat met het koelblok en hierop koelblokjes gaan plaatsen. Uiteindelijk had ik elk component voorzien van een koelblokje en vastgelijmd met de niet geleidende thermische lijm van Arctic die bij de koeler zat. Na een nacht de lijm gedroogd te laten hebben zaten alle koelblokjes goed en stevig vast aan de componenten.
Nu kon ik verder met het "3 pci-slots dikke gevaarte" van een koelblok om deze vast te maken aan het PCB. Omdat ik vergeten was dat er aan de achterkant van het PCB nog 12 videogeheugen chips zaten had ik 2 opties. Of meer koelblokjes en thermische lijm bestellen bij Arctic of de originele achterplaat van de videokaart blijven gebruiken.
Uiteindelijk heb ik ervoor gekozen om de achterplaat van de videokaart te blijven gebruiken. Zo bleef de kaart laag aan de bovenkant en kwam hij niet in problemen met de processor koeler.
Met M2 boutjes en moertjes en een O-ring tussen het PCB en het moertje heb ik de achterplaat goed en stevig kunnen vastmaken.
Door de achterplaat te gebruiken worden alle 12 videogeheugen chips gekoeld en wordt de druk van de beugel aan de achterkant netjes verdeeld over de achterplaat van de videokaart. Zo ziet de videokaart er toch nog gelikt uit!
Bij het binnen komen van de koeler had ik al direct door gekregen dat mijn
Fractal Design Define Nano S behuizing veel te klein was om die videokaart met koeler daarin te laten passen. Uiteindelijk zijn grotere broertje de
Fractal Design Define Mini C Window gekocht om de videokaart van genoeg adem ruimte te voorzien. Na een middag bezig te zijn geweest met alles over te zetten van de ene behuizing mag het resultaat er wel wezen.
Na het ombouwen van de koeler deed de kaart het gelukkig nog wat ik meteen met zware berekeningen heb getest. Zie hier de eigenschappen van de kaart met GPU-Z en temperaturen.
Ik heb de kaart niet warmer zien worden dan 74 graden op 100% fan speed tijdens deze zware berekeningen en dit was in een warme kamer van +-24 graden. Ondanks dat de fans van het Arctic koelblok op 100% draaien zijn ze alsnog erg stil te noemen met bijkomend voordeel dat alle componenten op het PCB ook gekoeld worden. Ik ben dus zeer blij met het resultaat!
Nu het spannendste gedeelte, de benchmarks!
Ik heb niet heel veel op opzichzelfstaande GPGPU-benchmarks kunnen vinden, mocht je iets getest willen hebben laat het mij dan gerust weten.
- OctaneBench
Met een eindscore van 128.70 wisselt deze in de verschillende Octane testen stuivertje met een GTX 1070.
https://render.otoy.com/o...ystemID=1x+Tesla+M40+24GB
- AIDA64 GPGPU Benchmark
Links de Tesla M40 en rechts een Inno3D iChill GeForce GTX 1080 Ti X3 als vergelijking.
- Dain-App
Ik heb de GTX 1080ti en Tesla M40 dezelfde video laten interpoleren.
De eerste test is een flimpje van 640x360 met een frame rate van 30 naar 120 fps te interpoleren.
Op beide apparaten zijn exact dezelfde settings gebruikt.
Tesla M40:
:fill(white):strip_exif()/f/image/PcnmhI8bYy9j1C0jMmVycicO.png?f=user_large)
Gtx 1080ti:
In bovenstaande resultaten zie je duidelijke dat de GTX 1080ti ongeveer 35% sneller is dan de Tesla M40.
Zelf had ik tussen de GTX 1070 en GTX 1080 prestaties verwacht en dat lijk ook wel redelijk te kloppen omdat een GTX 1080 gemiddeld gezien 25% trager is dan een GTX 1080ti.
De volgende test is een 1920x1080 video interpoleren. Hierbij laat de Tesla M40 zich van zijn beste kant zien met zijn 24GB videogeheugen. De GTX 1080ti is niet instaat om deze resolutie te interpoleren door te weinig videogeheugen. Hier is dus de Tesla M40 kaart duidelijk de winnaar. (Tevens ook een van de redenen waarom ik hem in gebruik heb genomen)
Tesla M40:
GTX 1080ti:
Waarom de Gtx 1080ti meteen crasht is terug te zien in het videogeheugen gebruik van de Tesla M40 kaart, deze heeft maar liefs 17.5GB geheugen in gebruik!
Ik kan deze kaart in elk geval aanbevelen als je Dain-App specifiek of andere software gebruikt die baat heeft bij veel videogeheugen. De performance ligt tussen dat van een GTX 1070 - 1080 niveau afhankelijk van de software die je gebruikt.
Mochten er nog vragen of aanvullingen zijn dan hoor ik die graag.
Update: 18/11/2020: foto Tesla M40 VS 1080TI AIDA64 GPGPU Benchmark aangepast. In de vorige test liep de Tesla M40 kaart op PCIE x8 snelheid. Nu zijn beide kaarten in het zelfde systeem getest op PCIE x16 snelheid en ook met de zelfde driver.
Update 26/5/2023: De gpu draait standaard op Tesla Compute Cluster (TCC) mode, hierdoor vermindert de CUDA-kerneloverhead op Windows. Goed voor cuda applicaties maar beperkt wel de overige applicaties. Door met de Nvidia SMI utility te gebruiken kan er naar Windows Display Driver Model (WDDM) te switchen wordt hij volledig bruikbaar binnen Windows. OpenGL support is 4.6. Dit is super om als coprocessor iets op te laten renderen en je eigen videokaart te gebruiken om te gamen.
https://docs.nvidia.com/g...tesla_compute_cluster.htm