Inleiding
Eind september publiceerden we op Tweakers onze review van de RTX 3090. Maar wat is er dikker dan de snelste videokaart van dit moment? Precies: twee keer de snelste videokaart van dit moment. Gewapend met twee GeForce RTX 3090 Founders Editions en Nvidia's nieuwe NVLink-brug, kortom bijna 3200 euro aan gpu-hardware, onderzoeken wij tot welke prestaties deze monstercombinatie in staat is.
SLI in het kort
De term SLI staat tegenwoordig voor scalable link interface en werd eind jaren '90 voor het eerst gebruikt door gpu-fabrikant 3dfx. Nvidia kwam door een overname in het bezit van de merknaam en blies hem nieuw leven in, voor een techniek om de rekenkracht van meerdere videokaarten met elkaar te combineren. Dat gebeurde de laatste jaren doorgaans op basis van alternate frame rendering, waarbij de videokaarten om en om een beeld renderen. Een inherent nadeel hiervan is dat de tijd tussen beelden (de frametime) kan variëren doordat niet elk frame even snel klaar is. Dat neem je waar als 'stuttering'.
Met de komst van DirectX 12 zou alles anders - en vooral ook beter - worden. Deze api bevat een techniek die explicit multi-adapter is gedoopt en daarmee kan een game zelf meerdere videokaarten aansturen. Het is zelfs mogelijk om totaal verschillende videokaarten van AMD en Nvidia door elkaar te gebruiken. Het merendeel van de DX12-games past deze techniek echter niet toe, terwijl Nvidia deze zomer officieel de stekker trok uit de 'oude' manier met SLI-profielen in de driver.
De SLI-brug die je vroeger bij elk leuk moederbord kreeg, wordt overigens al lange tijd niet meer gebruikt. Na een high bandwidth-versie van die brug stapte Nvidia bij de RTX 2000-serie over op NVLink, een veel snellere interconnect die zijn oorsprong vindt in de datacenterwereld. Diezelfde technologie wordt voor de RTX 3000-serie ingezet, maar door de veranderde connectors heb je toch een nieuwe brug nodig.
De gecontroleerde dood van SLI
Vroeger kon je zo'n beetje elke videokaart in SLI zetten. AMD's tegenhanger CrossFire was op dat punt nog veel flexibeler: je kon zelfs verschillende gpu's mixen. Als we naar de laatste vier GeForce-generaties kijken, valt echter op dat de ondersteuning voor SLI steeds verder is afgebouwd. Kon je vroeger twee GTX 960's bijvoorbeeld nog probleemloos met elkaar combineren, bij de 10-serie had je daarvoor minstens een GTX 1070 nodig en bij de vorige generatie kon het pas vanaf de RTX 2080. In de nieuwe serie biedt alleen de RTX 3090 nog ondersteuning voor SLI.
|
RTX 3000 |
RTX 2000 |
GTX 1000 |
GTX 900 |
**90 / Titan |
Ja |
Ja |
Ja |
Ja |
**80 |
Nee |
Ja |
Ja |
Ja |
**70 |
Nee |
Nee |
Ja |
Ja |
**60 |
Nee |
Nee |
Nee |
Ja |
SLI met de RTX 3090
Trek je de lijn door, dan is het bij de volgende generatie einde verhaal voor SLI. Nu werd het leven je als SLI-liefhebber al niet makkelijk gemaakt: de afgelopen drie generaties werd de functionaliteit steeds beperkter terwijl de benodigde hardware in prijs steeg. De NVLink-brug die benodigd is voor de RTX 3000-serie gebruikt voor de derde generatie op rij andere connectors dan de voorgaande. Bovendien kost hij maar liefst 85 euro.
Voor deze test bouwden we een ander testsysteem op dan in onze reguliere gpu-reviews. Waar PCI Express 4.0 volgens onze tests nog weinig toevoegt, gaat bij de mainstreamplatforms van AMD en Intel de gpu-bandbreedte nogmaals door de helft. Dat is een gevolg van het beperkte aantal PCIe-lanes. Om dit te voorkomen en bovendien de te verwachten cpu-bottleneck bij zó veel gpu-power te minimaliseren, hebben we deze tests uitgevoerd op een HEDT-platform, waarover meer op de volgende pagina.
Deze test is medemogelijk gemaakt door de tweakers Shroudster en Rsnubje, die zo vriendelijk waren om hun 3090 FE's tijdelijk ter beschikking te stellen. Bedankt!
Testverantwoording
Om de rest van het testsysteem zo min mogelijk een bottleneck te laten zijn voor de SLI-configuratie van RTX 3090's, hebben we eenmalig een overgeklokt systeem samengesteld op basis van Intels X299-platform. Op die manier beschikken beide videokaarten over zestien lanes PCI Express 3.0-bandbreedte, terwijl een eventuele cpu-bottleneck minder snel zal optreden dan bij ons standaard 3900XT-testsysteem. Intels midrangeplatform was geen optie. Door het gebrek aan voldoende lanes en PCIe 4.0 zou de bandbreedte per videokaart dan nog eens door de helft gaan.
Als processor installeerden we een Intel Core i9 10980XE met achttien cores, overgeklokt naar 4,5GHz, op een ASUS ROG Rampage VI Apex-moederbord. G.Skill leverde vier 32GB-modules uit zijn Trident Z Neo-reeks voor een totaal van 128GB op een snelheid van 3200mt/s. Het OS draaien we op een Samsung 970 Evo 250GB-ssd, de games staan op een Kioxia Exceria+ 2TB. Verder bestaat het systeem uit een Corsair AX1600i-voeding en een uitgebreide waterkoelset van Alphacool. Als besturingssysteem is uiteraard de nieuwste versie van Windows 10 Pro 64bit geïnstalleerd.
Drivers en meetmethode
Voor de gamebenchmarks in deze review hebben we gebruikgemaakt van de GeForce 456.55-driver. De 'creatieve' benchmarks hebben we uitgevoerd met versie 456.38 van Nvidia's Studio-driver.
Met behulp van PresentMon meten we in elke geteste game de prestaties, waaruit we zowel de gemiddelde framerates (fps) als de frametimes van het 99e en 99,9e percentiel berekenen en die laatste twee in milliseconden rapporteren. Let er wel op dat het hier dus om een softwaremeting gaat. Bij een SLI-opstelling worden niet per definitie alle berekende frames ook weergegeven op de monitor.
In de grafieken op de volgende pagina's vind je steeds in eerste instantie de gemiddelde framerates, oftewel het gemiddelde aantal beelden per seconde dat een videokaart kan berekenen. De frametimes geven geen beeld van de gemiddelde framerate, maar van de uitschieters in negatieve zin die ervoor kunnen zorgen dat een game ondanks een goed gemiddelde niet vloeiend aanvoelt.
De tijd die het kost om beelden binnen een 3d-game en dus binnen onze benchmark te renderen, varieert van frame tot frame. Bij onze frametime-meting worden de rendertijden van alle individuele frames opgeslagen. Daarna gooien we de 1 procent langzaamste frames weg. De hoogste rendertijd van de resterende 99 procent van de frames, oftewel het langzaamste frame, is het 99e percentiel frametime.
Op verzoek van enkele lezers hebben we ook de 99,9e-percentielwaarden toegevoegd. Hiervoor laten we dus slechts de 0,1 procent langzaamste frames buiten beschouwing. In theorie is dit nog preciezer, maar in de praktijk gooien incidentele oorzaken en meetfouten soms roet in het eten. Voor nu hebben we ze vermeld in de review, maar houd dat dus in het achterhoofd bij het bekijken van deze resultaten.
Games en creatieve workloads
Aangezien lang niet alle moderne games ondersteuning bieden voor SLI of multi-gpu in het algemeen, hebben we voor deze test een andere selectie gemaakt dan in onze reguliere gpu-reviews. SLI testen in een game waarvan we weten dat hij geen SLI ondersteunt, is immers niet de meest nuttige bezigheid.
Daarnaast hebben we de gelegenheid te baat genomen om enkele 'creatieve' benchmarks te draaien, in de hoek van videobewerking en rendering. Diverse tweakers vroegen daarom in reactie op onze RTX 3090-review. Om een beeld te geven van de prestaties in videobewerkingssoftware renderen we in zowel Adobe Premiere Pro als DaVinci Resolve een project met gpu-acceleratie ingeschakeld. Verder berekenen we een Blender-scène in twee modi: standaard gpu-acceleratie waarvoor de cudacores worden ingeschakeld en Optix, waarbij ook de raytracing-cores worden ingezet. Tot slot renderen we drie scènes in OctaneBench, de benchmarktool van OctaneRender.
Stroomverbruik
Gezien de geringe tijd waarin we over twee RTX 3090 FE's beschikten, hebben we geen uitgebreide stroommetingen uitgevoerd. Het totale systeemverbruik was tijdens de zwaarste workloads 880 watt, maar de pieken lagen vermoedelijk heel wat hoger. In eerste instantie hadden we namelijk een systeem met een 1200W-voeding opgetuigd, maar die viel uit tijdens het benchmarken van Shadow of the Tomb Raider.
Benchmarks: 3DMark en games
We trappen af met 3DMark, in diverse smaken. De reguliere Fire Strike-test, die in 1080p-resolutie draait, laat amper schaling zien, en in de Extreme- en Ultra-versie (1440p en 4K) wordt dat niet veel beter. Dat is opvallend, want met 2080 Ti's in SLI zagen we nog prima schaling.
In Timespy, de DirectX 12-versie van de benchmark, is het een heel ander verhaal. Daarin scoort de SLI-opstelling bijna 60% beter dan een enkele RTX 3090. In de raytracingtest Port Royal loopt het verschil op naar een uitstekende 92%.
Het lijkt hiermee duidelijk dat Nvidia de 'oude' SLI, waarbij de driver regelde hoe meerdere gpu's samenwerkten in DirectX 11-toepassingen, niet alleen niet langer actief ondersteunt, maar ook bestaande implementaties daarvan heeft uitgeschakeld. Wil je in games profiteren van SLI, dan kan dat dus uitsluitend in spellen die de nieuwe vorm van multi-gpu ondersteunen.
- Firestrike
- Firestrike Extreme
- Firestrike Ultra
- Timespy
- Port Royal
Games
Zoals besproken op de vorige pagina, hebben we uitsluitend games getest die ondersteuning bieden voor het combineren van meerdere gpu's. Twee daarvan maken ook deel uit van onze standaard-testsuite, namelijk Shadow of the Tomb Raider en Red Dead Redemption 2 (in de Vulkan-api). Verder draaiden we ook de Quake 2-remaster met RTX, Battlefield 1 (in DirectX 12-modus) en Deus Ex: Mankind Divided. Battlefield V ondersteunt helaas geen SLI meer.
Shadow of the Tomb Raider
In 4K-resolutie haal je op medium settings al een comfortabele 117fps in Shadow of the Tomb Raider. Desondanks maak je met een tweede kaart een mooie sprong naar 167fps, een schaling van 43%. Op ultra-settings voegt de tweede kaart 73% toe aan de prestaties, waardoor je zelfs de 4K-monitoren met de hoogste verversingssnelheid volledig verzadigt.
- Medium
- Medium (99p)
- Medium (99.9p)
- Ultra
- Ultra (99p)
- Ultra (99.9p)
Gamen in 8K is met een enkele RTX 3090 een zware kluif. Op medium haal je dan gemiddeld 40fps, terwijl de SLI-opstelling ruim 76fps laat noteren: bijna 89% schaling! Op ultra is de schaling in relatieve zin nog iets beter, maar wellicht kun je dan toch beter nog enkele settings verlagen om stabiel 60fps te halen.
- Medium
- Medium (99p)
- Medium (99.9p)
- Ultra
- Ultra (99p)
- Ultra (99.9p)
Red Dead Redemption 2
In Red Dead Redemption 2 moet je de Vulkan-api gebruiken om de rekenkracht van twee videokaarten te kunnen benutten. In 4K-resolutie zien we zowel op medium als ultra zo'n 60 procent schaling. Met een enkele RTX 3090 kom je zelfs op ultra-settings echter ook al een heel eind, dus echt het verschil tussen speelbaar en onspeelbaar maakt SLI hier niet.
- Medium
- Medium (99p)
- Medium (99.9p)
- Ultra
- Ultra (99p)
- Ultra (99.9p)
Waar 4K ultra met één gpu nog wel te doen was, geldt voor deze game in 8K juist dat de framerates zelfs in SLI nog niet optimaal zijn. Een strakke 60fps kun je zelfs op medium vergeten. Het valt op dat de schaling steeds wat slechter lijkt te worden, wat er mogelijk op duidt dat er op de achtergrond toch een andere bottleneck dan de pure gpu-rekenkracht speelt.
- Medium
- Medium (99p)
- Medium (99.9p)
- Ultra
- Ultra (99p)
- Ultra (99.9p)
Quake 2 RTX
Omdat Quake 2 RTX behoorlijk wat van de gpu vraagt, hebben we dit spel ook op de lagere wqhd-resolutie gebenchmarkt. Op medium-settings komen we tot 57% schaling, op ultra loopt dat op naar 63% voor een keurige 134fps.
- Medium
- Medium (99p)
- Medium (99.9p)
- High
- High (99p)
- High (99.9p)
Op 4K-resolutie krijgt een RTX 3090 het al behoorlijk zwaar met medium instellingen. SLI tovert een comfortabele 72fps op de monitor. Zelfs met high-settings kom je gemiddeld nog boven de 60fps uit in SLI.
- Medium
- Medium (99p)
- Medium (99.9p)
- High
- High (99p)
- High (99.9p)
De eisen die Quake 2 RTX op 8K-resolutie stelt zijn zelfs voor de SLI-opstelling te zwaar. Hoewel we procentueel uitstekende schaling zien, is het resultaat zowel op medium als high onspeelbaar.
- Medium
- Medium (99p)
- Medium (99.9p)
- High
- High (99p)
- High (99.9p)
Battlefield 1
De Eerste Wereldoorlog-shooter Battlefield 1 was het laatste deel uit deze serie met multi-gpu-ondersteuning; het nieuwere Battlefield V ontbeert die functionaliteit. Aangezien deze game al wat ouder is, vormt 4K-resolutie geen uitdaging meer voor de RTX 3090. We zien dan zelfs lichte negatieve schaling.
- Medium
- Medium (99p)
- Medium (99.9p)
- Ultra
- Ultra (99p)
- Ultra (99.9p)
Op 8K-resolutie is de extra gpu-power van de tweede RTX 3090 echter meer dan welkom. Zowel op medium- als op ultra-settings zien we winsten van tegen de 70%: op medium gaan we van 63 naar 106fps, op ultra van bijna 50 tot ruim 80fps. De frametimes worden er in onze softwarematige meting echter niet beter op, al zegt die in het specifieke geval van meerdere videokaarten helaas niet alles.
- Medium
- Medium (99p)
- Medium (99.9p)
- Ultra
- Ultra (99p)
- Ultra (99.9p)
Deus Ex: Mankind Divided
De laatste game die we hebben gebenchmarkt is Deus Ex: Mankind Divided. In 4K-resolutie zijn de framerates met één kaart eigenlijk al prima. De winsten van een kwart op medium-settings en een derde op ultra zijn mooi meegenomen, maar niet meer dan dat.
- Medium
- Medium (99p)
- Medium (99.9p)
- Ultra
- Ultra (99p)
- Ultra (99.9p)
Op 8K-resolutie komt één kaart echter tekort en maakt de tweede kaart dus het verschil. Op medium-settings is de schaling zelfs bijna perfect, waardoor je van een miezerige 36fps naar 71fps schiet. In relatieve zin is de schaling op ultra-settings duidelijk slechter, maar zelfs 100% schaling had in dat scenario geen 60fps opgeleverd.
- Medium
- Medium (99p)
- Medium (99.9p)
- Ultra
- Ultra (99p)
- Ultra (99.9p)
Benchmarks: videobewerking en rendering
Op deze pagina bekijken we de resultaten in 'creatieve' workloads: videobewerking en renderen.
In Adobe Premiere Pro valt allereerst op hoe veel sneller gpu-rendering is dan cpu-rendering. Hetzelfde project neemt wanneer we het renderen op de overgeklokte 10980XE-cpu bijna achteneenhalve minuut in beslag, maar een enkele RTX 3090 heeft de klus in 29 seconden (!) geklaard. Het toevoegen van een tweede gpu levert een tijdswinst van zes seconden op, in relatieve zin toch een aardige 20%. In DaVinci Resolve is de meerwaarde van SLI minimaal, amper zes procent.
- Premiere Pro 4K (Tweakers Tech Hub)
- DaVinci Resolve 4K
Blender
Met behulp van Blender renderen we de scène 'Barcelona Pavilion', die je hier gratis kunt downloaden. In de cuda-test zijn alleen de normale gpu-cores aan het werk. De schaling is dan bijna perfect: het SLI-systeem is in een kleine acht minuten klaar, terwijl een enkele RTX 3090 ruim een kwartier nodig heeft.
Als ook de raytracingcores hun bijdrage mogen leveren, gaan de rendertijden nog eens ruim door de helft. Wederom weet de SLI-configuratie deze taak bijna twee keer zo snel te voltooien.
- Blender - Cuda
- Blender - Optix
OctaneBench
Tot slot draaien we OctaneBench, de benchmark van de volledig gpu-gebaseerde OctaneRender-software. Tevens maakt deze renderer gebruik van de raytracingcores van Nvidia RTX-gpu's. De totaalscore van de benchmark komt uit op 1343 punten, waarmee de schaling met 97% bijna perfect is.
De benchmark bestaat uit vier scènes die allemaal drie subscores opleveren voor de prestaties van het infokanaal, de directe belichting en de pathtracing. Alle subtests laten zonder uitzondering vrijwel perfecte schaling zien, steeds hoog in de 90 procent.
- Interior - Info channels
- Idea - Info channels
- ATV - Info channels
- Box - Info channels
- Interior - Direct lighting
- Idea - Direct lighting
- ATV - Direct lighting
- Box - Direct lighting
- Interior - Path tracing
- Idea - Path tracing
- ATV - Path tracing
- Box - Path tracing
Conclusie
In games die DirectX 12 multi-gpu ondersteunen, kan het toevoegen van een tweede RTX 3090 het verschil maken tussen speelbaar en onspeelbaar. De schaling die we zien is doorgaans uitstekend, met uitschieters naar meer dan 90%. In spellen als Shadow of the Tomb Raider en Deus Ex: Mankind Divided maakt de SLI-opstelling het mogelijk om comfortabel in 8K-resolutie te gamen. Met één RTX 3090 kun je dat in die games gevoeglijk vergeten.
Zo mooi had het voor veel gamers kunnen zijn. Voor de vijf games die we in dit artikel hebben getest, hebben we echter al flink moeten graven in ons game-archief. De praktijk is dat vrijwel elke game die anno 2020 in de winkels belandt geen ondersteuning biedt voor enige vorm van multi-gpu. Tenzij je stomtoevallig groot fan bent van één van de games op Nvidia's beknopte lijstje hangt de tweede kaart het grootste gedeelte van de tijd voor Jan met de korte achternaam in je systeem.
Daar komt nog eens bij dat Nvidia de ondersteuning voor de traditionele, drivergebaseerde SLI heeft stopgezet. Ook in oudere games waarvoor nog een dergelijk profiel beschikbaar was, heb je zodoende niks aan een tweede RTX 3090. Nu zijn dat voornamelijk games die je inmiddels met gemak op één kaart kunt draaien, maar toch.
Wat rest, zijn de zogenaamde 'creatieve' workloads. Zeker rendersoftware schaalt doorgaans vrijwel lineair, waardoor het toevoegen van een extra kaart de benodigde tijd vrijwel halveert. In videobewerkingssoftware is de invloed beperkter: veel van de mogelijke winst met gpu-versnelling heb je met één kaart al lang en breed te pakken, je moet wel een hele dikke configuratie en erg zware projecten hebben om een tweede RTX 3090 de moeite waard te laten zijn.
Met dat nieuws zijn fanatieke renderaars vast hartstikke tevreden, maar feit is dat er daar veel minder van zijn dan gamers. En voor die doelgroep is de meerwaarde van SLI anno 2020 nihil, zo moeten we met pijn in het hart concluderen. Bovendien lijkt de hoop op een plotselinge ommekeer ijdel, zowel door gebrek aan interesse bij gameontwikkelaars als door Nvidia's zorgvuldige sterfhuisconstructie.
:strip_exif()/i/2003921080.jpeg?f=imagearticlefull)