Inleiding
Eind mei introduceerde Nvidia zijn eerste videokaarten van de nieuwe generatie: de GTX 1070 en 1080. Die nieuwe generatie wordt mogelijk gemaakt doordat AMD en Nvidia voor het maken van hun gpu's konden overstappen op een kleiner procedé. AMD heeft de nieuwe RX480 al wel aangekondigd, maar het is Nvidia dat aan het langste eind trekt en zijn nieuwe videokaarten, de GTX 1070 en 1080, daadwerkelijk in de schappen heeft liggen.
Zowel de GTX 1070 als de 1080 verschijnt in een Founders Edition, voorzien van Nvidia's standaardkoeler, maar uiteraard bouwen alle fabrikanten ook hun eigen videokaarten, met eigen koelers, rondom de nieuwe chips. Van MSI ontvingen we de Gaming X-versies van de GTX 1070 en 1080, die standaard overgeklokt zijn en van de kenmerkende TwinFrozr-koeler zijn voorzien.
We hebben uiteraard gekeken naar de nieuwe Pascal-gpu, de snelheid in verschillende games getest en de geluidsdruk van de ventilator gemeten om te zien of Pascal de moeite van het upgraden waard is.
/i/2001125007.jpeg?f=imagenormal)
Pascal: architectuur
De nieuwe gpu-architectuur die je terugvindt in de GTX 1080- en 1070-videokaart, heeft de codenaam 'Pascal' gekregen. De ontwikkeling die Pascal mogelijk heeft gemaakt, is de overstap van het 28nm- naar het 16nm-procedé voor het bakken van de chips. Nvidia (en AMD) is voor het maken van chips afhankelijk van halfgeleiderfabrikanten als TSMC. In 2011 begon TSMC met de massalevering van 28nm-chips en het heeft dus meer dan vier jaar geduurd voordat in 2016 de eerste 16nm-chips gemaakt werden.
Videokaart |
GTX 970 |
GTX 980 |
GTX 980 Ti |
GTX 1070 |
GTX 1080 |
Tesla P100 |
Gpu |
GM204 |
GM204 |
GM200 |
GP104 |
GP104 |
GP100 |
Architectuur |
Maxwell |
Maxwell |
Maxwell |
Pascal |
Pascal |
Pascal |
Procedé |
28nm |
28nm |
28nm |
16nm |
16nm |
16nm |
Transistors |
5,2 miljard |
5,2 miljard |
8 miljard |
7,2 miljard |
7,2 miljard |
15,3 miljard |
Cudacores |
1664 |
2048 |
2816 |
1920 |
2560 |
3584 |
Baseclock |
1050MHz |
1126MHz |
1000MHz |
1506MHz |
1607MHz |
1328MHz |
Boostclock |
1178MHz |
1216MHz |
1075MHz |
1683MHz |
1733MHz |
1480MHz |
Vram |
4GB gddr5 |
4GB gddr5 |
6GB gddr5 |
8GB gddr5 |
8GB gddr5x |
16GB hbm2 |
Geheugenklok |
1750MHz |
1750MHz |
1750MHz |
2000MHz |
1250MHz |
?MHz |
Geheugenbus |
256bit |
256bit |
384bit |
256bit |
256bit |
4096bit |
Bandbreedte |
224GB/s |
224GB/s |
336,5GB/s |
256GB/s |
320GB/s |
720GB/s |
Tdp |
145W |
165W |
250W |
150W |
180W |
300W |
Door de gpu uit kleinere componenten op te bouwen, past er meer op hetzelfde oppervlak, terwijl het energiegebruik over het algemeen daalt. De gpu van de GTX 980 werd bijvoorbeeld op 28nm gebakken en bestaat uit 5,2 miljard transistors, die een oppervlakte van 398mm² beslaan. De nieuwe GTX1080-gpu bestaat uit maar liefst 7,2 miljard transistors, maar dankzij het 16nm-procedé is de die maar 314mm² groot.
Ten opzichte van de GTX 980 steeg de tdp wel iets; van 165 naar 180 watt. Voor die 15 watt extra zijn er echter een kwart meer cores actief en bovendien konden de kloksnelheden met een halve gigahertz opgeschroefd worden. Omdat de architectuur en het geheugen ook aangepast zijn, kun je Maxwell en Pascal niet een op een vergelijken, maar op papier lijkt de overstap naar 16nm tot gevolg te hebben dat Pascal een stuk meer prestaties uit iedere watt energie haalt.
GTX1080-gpu (links) en GTX980
Zoals gezegd heeft de GTX1080-gpu ten opzichte van de GTX 980 de beschikking over een kwart meer cores. De GP104-gpu bevat weliswaar nog steeds vier gpcs, maar iedere gpc bestaat nu uit vijf in plaats van vier sm-units, met per stuk 128 cores. Het totaal komt daarmee op 2560 cores, tegenover 2048 cores voor de GTX 980. Bij de GTX 1070 is een gpc uitgeschakeld, waardoor het totale aantal cores op 1920 uitkomt, tegenover 1664 cores voor de GTX 970. De kloksnelheden zijn bovendien behoorlijk opgeschroefd. Nu leiden een hogere kloksnelheid en een groter aantal cores op zich natuurlijk al tot meer snelheid, maar Nvidia heeft daarnaast de gpu op een aantal punten verbeterd.
Asynchronous compute
Een van die punten is de verbeterde ondersteuning voor asynchronous compute. Deze berekeningen kunnen bestaan uit physics- of audioprocessing, of postprocessing van gerenderde frames. Ze kunnen bijvoorbeeld ook asynchronous timewarp zijn, een techniek die Oculus voor de Rift gebruikt.
De eerste verbetering van asynchronous compute die Pascal toevoegt, is de dynamische verdeling van de grafische- en de compute-taken. Die verdeling was bij voorganger Maxwell statisch, wat betekent dat de ontwikkelaar verantwoordelijk was voor de juiste verdeling van de taken om de gpu aan het werk te houden. Was een van die taken eerder voltooid dan de andere, dan was een deel van de gpu idle, wat natuurlijk zonde is van de rekenkracht. Pascal regelt die verdeling zelf, waardoor de gpu efficiënter benut wordt.
Nvidia heeft ook de pre-emption van de Pascal-gpu verbeterd. Bij pre-emption wordt een taak met een lagere prioriteit afgebroken om een taak met een hoge prioriteit uit te voeren. Een voorbeeld hiervan is timewarping, dat onder andere bij de Oculus Rift gebruikt wordt. Daarbij wordt het perspectief van ieder frame gecorrigeerd voor de laatste beweging die je gemaakt hebt, voordat het naar de schermpjes in de bril wordt gestuurd.
Voorganger Maxwell ondersteunt pre-emption op het niveau van de draw call, wat vrij 'hoog' in de pipeline is. Iedere draw call kan namelijk honderden triangles bevatten, die op hun beurt weer honderden pixels kunnen bevatten, en die moeten allemaal gerenderd zijn voordat er overgeschakeld kan worden op een compute-taak. Pascal ondersteunt pre-emption op pixelniveau en kan in honderd microseconden van de ene naar de andere taak schakelen. Dat betekent dat het verzoek voor pre-emption later gedaan kan worden, waardoor de gpu langer aan een taak kan werken voordat de taak onderbroken wordt om de timewarp uit te voeren.
Hoewel asynchronous compute dus verbeterd is ten opzichte van Maxwell, is het nog de vraag hoe Nvidia's implementatie zich tot die van de concurrentie verhoudt. AMD pakt het anders aan en voorziet zijn op de gcn-architectuur gebaseerde gpu's van asynchronous compute engines, die in onze benchmark van Ashes of the Singularity prestatiewinst opleveren, terwijl Maxwell er juist op achteruitgaat. Pascal is wel een verbetering ten opzichte van Maxwell, maar laat geen winst zien zoals bij AMD-gpu's. Het zal echter per toepassing verschillen hoe goed de verschillende gpu's met asynchronous compute omgaan.
Simultaneous multi-projection engine
Een andere verbetering is de ondersteuning voor simultaneous multi-projection in de polymorph engines. Smp zorgt ervoor dat het beeld vanuit maximaal twee gezichtspunten in maximaal zestien perspectieven weergegeven kan worden. Een praktijkvoorbeeld is het gamen op drie monitors, die normaal gesproken door de videokaart als een breed scherm worden gezien. De meeste mensen draaien de buitenste monitoren iets naar binnen en verstoren daarbij het perspectief van de game. Een oplossing die het juiste perspectief behoudt, is de videokaart voor ieder scherm een apart frame te laten renderen, maar dat levert een behoorlijk zware belasting voor gpu, driver en game op. In plaats daarvan kan Pascal dankzij smp in een geometry pass de drie projecties renderen.
Links: juiste (platte) projectie, midden: vervormde projectie, rechts: juiste projectie dankzij Nvidia smp
Een andere mooie toepassing van smp kan bij vr-brillen gebruikt worden. Vr-brillen werken met positieve lenzen, die ervoor zorgen dat je het beeld, dat centimeters voor je oog wordt weergegeven, toch scherp kunt zien. Doordat de lenzen het beeld vervormen, moet de videokaart een omgekeerde vervorming toepassen op het beeld, zodat het er normaal uitziet als je de bril opzet. Een vervormd beeld dat op een Oculus Rift wordt weergegeven, bestaat uit 1,1 miljoen pixels per oog, maar was voor die vervorming 2,1 megapixels groot. Een groot deel van het beeld wordt dus weggegooid om de juiste output op de schermpjes te tonen.
/i/2001123443.jpeg?f=imagenormal)
Links: 'gewone' render voor vervorming, midden: Lens Matched Shading, rechts: uiteindelijk beeld na vervorming
Pascal kan besparen op het nutteloos renderen van pixels door gebruik te maken van smp. Het beeld dat naar ieder oog wordt gestuurd, wordt in vier projecties verdeeld, waardoor er minder nutteloze pixels gerenderd worden en het beeld in plaats van 2,1 maar 1,4 miljoen pixels groot is, iets wat Nvidia 'lens matched shading' noemt. Omdat je niet een maar twee ogen hebt, moet de gpu in totaal 2,8 megapixels renderen, maar doordat smp twee gezichtspunten per projectie ondersteunt, hoeft de geometry pass maar één keer gedaan te worden. Volgens Nvidia kan smp in vr dan ook een snelheidsverdubbeling opleveren. Nvidia heeft de ondersteuning voor de nieuwe smp aan zijn gameworks- en vrworks-sdk's toegevoegd en het is op het moment van schrijven dan ook nog een kwestie van afwachten totdat de eerste games smp zullen ondersteunen.
Geheugen: gddr5x en betere compressie
De Pascal-gpu ondersteunt twee nieuwe geheugentypen, die verbeteringen bieden ten opzichte van het in 2009 geïntroduceerde gddr5: gddr5x en hbm2.
AMD paste hbm al toe op zijn Fury-videokaarten en Nvidia combineert zijn Tesla P100-gpu met 16GB hbm2. Hbm levert een veel grotere bandbreedte op dan gddr5 en gddr5x kunnen bieden, maar is ook erg duur, vooral als je meer dan 4GB aan een gpu wil koppelen, liet een medewerker van Nvidia weten. Daarom is hbm voorlopig voorbehouden aan de Tesla-kaarten van Nvidia en krijgt de GTX1080 de beschikking over gddr5x.
Gddr5x is een doorontwikkeling van gddr5, waarbij de prefetch buffer twee keer zo groot is gemaakt. Daardoor kan er twee keer zo veel data worden doorgevoerd bij dezelfde kloksnelheid. Het gddr5x-geheugen op de GTX1080 is op 1250MHz geklokt en haalt daarbij een snelheid van 10Gbit/s. De GTX1070 gebruikt nog 'conventioneel' gddr5-geheugen, met een snelheid van 8Gbit/s, waarvoor het op 2000MHz geklokt wordt. Beide videokaarten maken gebruik van 8GB werkgeheugen, dat via een 256bit-bus met de gpu communiceert. De GTX1080 krijgt daarmee een geheugenbandbreedte van 320GB/s, terwijl de 1070 256GB/s aan bandbreedte heeft. Dat is in beide gevallen een vooruitgang ten opzichte van de 224GB/s aan bandbreedte die de GTX970 en -980 hadden.
/i/2001116741.jpeg?f=imagenormal)
Cijfers over bandbreedte zeggen niet alles; het gaat er ook om hoe efficiënt je het geheugen gebruikt. Nvidia heeft voor Pascal zijn algoritmes voor geheugencompressie weer verbeterd, waardoor volgens de ontwerper de 'effectieve bandbreedte' ten opzichte van Maxwell met twintig procent is toegenomen.
/i/2001116745.jpeg?f=imagenormal)
Nvidia laat dat verschil in compressie zien aan de hand van de bovenstaande frames uit Project Cars. Het linkerbeeld is ongecomprimeerd, terwijl de roze gemarkeerde delen in de andere twee frames aangeven welke delen van het beeld voor het geheugen gecomprimeerd kunnen worden. Het middelste frame laat de compressie van een Maxwell-gpu zien, terwijl het rechterframe dat van een Pascal-gpu toont. Doordat een groter deel van het beeld gecomprimeerd kan worden, zijn er minder geheugenruimte en -bandbreedte nodig, waardoor de gpu sneller zijn werk kan doen.
De winst van de efficiëntere geheugencompressie verschilt per game, maar volgens Nvidia moet de effectieve geheugenbandbreedte er ten opzichte van een GTX980 met zeventig procent op vooruitgaan, dankzij compressie en het gebruik van het snellere gddr5x-geheugen.
Sli, hdr en hevc
De geheugencompressie, simultaneous multi projection en de asynchronous compute-verbeteringen zijn de belangrijkste nieuwe mogelijkheden van de Pascal-gpu, maar daarmee zijn we er nog niet. Er verandert namelijk nog meer, waarbij het aangepaste sli de belangrijkste verandering is.
Sli
Wilde je voorheen twee kaarten in sli draaien, dan had je daarvoor een sli-brug nodig. De high-end kaarten beschikten weliswaar over meer dan één brugconnector, maar die hoefde je pas te gebruiken als je meer dan twee videokaarten in sli wilde draaien.
/i/2001124851.jpeg?f=imagenormal)
Bij Pascal-videokaarten is dat enigszins veranderd. De kaarten hebben nog steeds twee connectors, maar die zijn nu gelinkt, waardoor ze in een opstelling met twee kaarten allebei gebruikt worden, wat meer bandbreedte tussen de gpu's oplevert. Nvidia heeft bovendien een nieuwe sli-brug, 'sli hb', ontwikkeld, die op 650MHz werkt, in tegenstelling tot de 400MHz van de vorige generatie videokaarten. Oude sli-bruggen met ledverlichting zullen ook de hogere kloksnelheid ondersteunen, maar de 'ouderwetse' bruggetjes doen dat niet. Speel je games op een resolutie tot 2560x1440 pixels op een 60Hz-scherm, dan maakt het volgens Nvidia niet veel uit wat voor soort bruggen je gebruikt. Game je op hogere resoluties, dan heb je wel baat bij meer bandbreedte, en op 5k-schermen wordt aangeraden om de nieuwe hb-brug te gebruiken.
De nieuwe sli-methode brengt helaas wel een probleem met zich mee, want hoe draai je sli met meer dan twee kaarten? Wat Nvidia betreft doe je dat helemaal niet; het bedrijf zegt dat het steeds moeilijker is om voordeel te halen uit opstellingen met meer dan twee videokaarten, bijvoorbeeld doordat de cpu sneller een bottleneck vormt of door nieuwe technieken in games die het moeilijker maken om het rekenwerk over meer gpu's te verdelen.
Aanvankelijk was het de bedoeling om ondersteuning voor tri- en quad-sli wel beschikbaar te maken voor mensen die zich bij Nvidia zouden registreren. Je zou dan een sleutel ontvangen waarmee de functionaliteit ontgrendeld kan worden, maar die eis heeft Nvidia laten vallen. Drie- en vierweg-sli hoeft daardoor niet meer ontgrendeld te worden, maar in plaats daarvan ondersteunt Nvidia de functionaliteit alleen in een aantal benchmarks, zoals 3DMark Firestrike. In games is de ondersteuning afwezig, waardoor het in de praktijk geen zin heeft om meer dan twee videokaarten te kopen.
Hdr en hevc
Vanaf de GTX 970 en 980 zijn Nvidia's videokaarten voorzien van hdmi 2.0-aansluitingen voor het aansluiten van 4k-schermen op 60Hz. Omdat uhd-blu-rayschijfjes en -spelers intussen mondjesmaat beschikbaar komen, benadrukt Nvidia nog eens dat Pascal ondersteuning biedt voor de bt2020-kleurruimte en de 12bit-kleurdiepte. Dat is op zich niet zo bijzonder, want Maxwell deed dat ook al, maar Pascal kan hevc-video ook hardwarematig decoderen en coderen. Daardoor kun je uhd-blurays kijken, maar ook hdr-video opnemen op de 4k-resolutie met 60fps.
Nvidia werkt samen met ontwikkelaars om hdr ook naar games te brengen. Obduction, The Witness, Lawbreakers, Rise of the Tomb Raider, Paragon, The Talos Principle en Shadow Warrior 2 kunnen 'binnenkort' dan ook in hdr worden weergegeven. Het enige obstakel is dan nog de ondersteuning voor hdr bij computermonitors. Voor zover wij weten zijn er nog geen schermen beschikbaar met hdr-ondersteuning en is de enige mogelijkheid voor het weergeven van hdr-content dan ook het aansluiten van een televisie, waarvan er ondertussen steeds meer wel hdr-ondersteuning hebben.
Testsysteem, videokaarten en drivers
Het heeft even geduurd, maar we hebben van Nvidia een GTX 1080 Founders Edition ontvangen, terwijl MSI ons de Gaming-uitvoeringen van zijn GTX 1080 en 1070 deed toekomen. We hebben de kaarten getest in ons gebruikelijke testsysteem, dat voorzien is van een Core i7-4960X-processor die overgeklokt is naar 4,4GHz. Het werkgeheugen is 16GB groot en draait op ddr3-1866-snelheid.
|
Testsysteem |
Moederbord |
Asus RoG Rampage IV Extreme |
Processor |
Intel Core i7-4960X @ 4,4GHz |
Geheugen |
Kingston HyperX KHX1866C9D3K4/16GX |
Ssd |
Crucial MX100 512GB |
Koeler |
Intel Thermal Solution RTS2011LC |
Voeding |
Corsair Professional Gold AX750 |
Behuizing |
CoolerMaster Test Bench |
Besturingssysteem |
Windows 10 |
Monitor |
Dell P2715Q |
We hebben de Nvidia-videokaarten in de vergelijking getest met behulp van de nieuwste whql-driver, met versienummer 368.39. Om de prestaties van de Nvidia-kaarten in perspectief te zetten, hebben we natuurlijk ook videokaarten van AMD opnieuw getest, in dit geval met driverversie 16.6.1. De GTX 1080's van Nvidia en MSI hebben we ook in sli gezet om te zien hoe die combinatie presteert. Nvidia's nieuwe hb-bruggen voor sli, die worden aangeraden bij resoluties van 2560x1440 pixels en meer dan 60fps, zijn nog niet beschikbaar, dus hebben we op hoge resoluties niet het maximale uit de combinatie kunnen halen. Zodra die hb-brug wel beschikbaar is, geeft dat weer een mooie kans om te zien hoeveel verschil dat nou eigenlijk maakt.
Pascal: Nvidia en MSI
In deze review kijken we naar MSI's Gaming-versies van de GTX 1070 en 1080, en naar het referentiemodel van Nvidia zelf, dat met ingang van Pascal het predikaat 'Founders Edition' meekrijgt. Founders Edition wil zeggen dat je een 'standaard'-videokaart koopt, dus met de door Nvidia voorgeschreven kloksnelheden en de standaardkoeler met een radiale ventilator, die de warme lucht de kast uitblaast.
|
Nvidia GTX 1080 |
MSI 1080 Gaming (OC) |
Nvidia GTX 1070 |
MSI 1070 Gaming (OC) |
Kloksnelheid gpu |
1607MHz |
1708MHz |
1506MHz |
1607MHz |
Boostsnelheid gpu |
1733MHz |
1847MHz |
1683MHz |
1797MHz |
Kloksnelheid geheugen |
1250MHz (10Gbit/s) |
1264MHz (10,1Gbit/s) |
2000MHz (8Gbit/s) |
2027MHz (8,1Gbit/s) |
De Gaming X-versies van MSI zijn geen Founders Editions, maar uitvoeringen die zijn overgeklokt en voorzien van de zesde generatie van MSI's TwinFrozr-koeling. Over de hoogte van die overklok is onlangs discussie ontstaan, toen Techpowerup meldde dat de videokaarten die MSI en Asus ter review versturen, structureel hoger geklokt zijn dan de versies die in de winkel liggen.
Ook bij de GTX 1070 en 1080 die wij van MSI ontvingen, blijkt dat het geval te zijn. De videokaarten draaien standaard in 'OC-modus', terwijl winkelexemplaren in 'Gaming-modus' draaien, op iets lagere kloksnelheden. De 1080 draait dan op 1683/1822MHz, terwijl de 1070 op 1582/1771MHz tikt. Door de MSI Gaming-app te installeren, kunnen we de kaarten met een druk op de knop ook in OC-modus laten draaien. We hebben onze kaarten in OC-modus getest, maar out-of-the-box zijn de scores dus iets lager dan die in deze review.
De nieuwe TwinFrozr VI-koeler lijkt behoorlijk op de vorige generatie TwinFrozr-koelers, die we op verschillende Gaming-kaarten van MSI tegenkwamen, maar toch wist MSI weer een en ander te verbeteren. De vorm van de ventilatorbladen is bijvoorbeeld iets aangepast, waardoor er maar liefst 22 procent meer luchtdruk opgebouwd kan worden en ook de backplate, die extra stevigheid moet bieden, is nieuw. Niet nieuw is de ZeroFrozr-techniek, die de ventilators helemaal laat stoppen met draaien zodra de gpu-temperatuur onder de 60°C komt. MSI heeft dus geen grote wijzigingen aan de koeler aangebracht, maar daar kunnen we mee leven, want de vorige TwinFrozr-koeler op de GTX 970 en 980 was al erg stil en koelde goed.
Tot slot mogen we natuurlijk niet vergeten te melden dat je de koeler aan het eind van het jaar ook in de kerstboom kunt hangen, want de rgb-leds, die achter het MSI-logo weggewerkt zijn, kunnen 16,8 miljoen kleuren aannemen en op vijf verschillende manieren knipperen, terwijl de 'ribben' rondom de rechterventilator ook rood kunnen oplichten.
Synthetische benchmarks
Om een idee te krijgen van de prestaties van de nieuwe videokaarten, beginnen we met het draaien van een aantal synthetische benchmarks van Futuremark en Unigine.
De GTX 1070 blijkt in 3DMark al meteen ruimschoots sneller te zijn dan de GTX 980 Ti, terwijl de GTX 1080 nog een twintig procent hogere score haalt. In het inmiddels wat verouderde Heaven zijn de verschillen niet zo groot en schaalt sli ook niet zo goed als in 3DMark.
Omdat Nvidia de asynchronous-computefunctie van de Pascal-gpu verbeterd heeft, hebben we dat aspect apart getest in Ashes of the Singularity. We hebben getest op dezelfde instellingen,1920x1080 pixels, met de Crazy-preset, waarbij we alleen asynchronous compute in- en uitschakelen. AMD-gpu's, die over aparte ace's beschikken, halen hogere framerates door asynchronous compute in te schakelen, maar de Maxwell-gpu's, zoals de GTX 980 en 980Ti, halen daarmee juist lagere framerates. Het resultaat in Ashes of the Singularity laat zien dat asynchronous compute bij Pascal inderdaad verbeterd is en er is nu vrijwel geen verschil in resultaat te zien als je asynchronous compute in- of uitschakelt. Een duidelijke verbetering, zoals bij AMD-kaarten, is er echter niet.
Alien Isolation en Dragon Age
- 1920x1080
- 2560x1440
- 3840x2160
Alien: Isolation was al geen zware game en ook al testen we op de hoogste instellingen, dan nog weet iedere videokaart speelbare framerates neer te zetten. Sli blijkt pas echt goed te schalen bij 3840x2160 pixels, al is het goed mogelijk dat de framerate bij lagere resoluties nog hoger kan, als je een hb-brug gebruikt.
- 1920x1080
- 2560x1440
- 3840x2160
Dragon Age: Inquisition hebben we getest bij 1920x1080 en 2560x1440 pixels op de hoogste instellingen, waarbij we 4x msaa toepasten. Als we de resolutie verhogen naar 3840x2160 pixels, moeten we de beeldkwaliteit verlagen naar 'high' om met de GTX 1080 gemiddeld op 59,9fps uit te komen. Dragon Age op ultra, 4k en 60fps vereist dus nog steeds meer dan één videokaart.
Far Cry 4 en GTA:V
- 1920x1080
- 2560x1440
- 3840x2160
In Far Cry 4 werkt de sli-schaling van de beide GTX 1080-videokaarten pas goed bij hoge resoluties. De GTX 1080 blijft op alle drie de resoluties die we hebben getest gemiddeld boven de 60fps, maar daarvoor moeten we de beeldkwaliteit bij 3840x2160 pixels wel verlagen naar medium-instellingen.
- 1920x1080
- 2560x1440
- 3840x2160
In GTA:V draaiden we de ingebouwde benchmark, waarin we de meeste grafische instellingen op 'very high' zetten, op 1920x1080 en 2560x1440 pixels, terwijl we de instellingen op 'high' zetten bij 3840x2160 pixels. Die instellingen kunnen we in het vervolg nog wat verder omhoog draaien, want de nieuwe videokaarten hebben daar weinig moeite mee. AMD's Fiji-videokaarten doen het relatief gezien beter dan Nvidia op 3840x2160 pixels, maar kunnen zich niet meten met de brute kracht van de Pascal-gpu's in de GTX 1070 en 1080.
Project Cars en The Witcher
- 1920x1080
- 2560x1440
- 3840x2160
In Project: Cars gebruikten we de simulatiefunctie om een auto automatisch een rondje te laten rijden, terwijl we de framerate bijhielden. Hoewel we Project Cars in diverse videokaartreviews zonder problemen gebencht hebben, haalden we nu vreemde resultaten, waarin de GTX 1070 op full hd een lagere framerate haalde dan de GTX 980 Ti, terwijl de GTX 1070 op 3840x2160 pixels weer even snel was als een GTX 1080. We zijn nog op zoek naar de oorzaak van dit probleem, maar als het blijft bestaan, zullen we Project Cars bij de volgende review schrappen. Vanwege het twijfelachtige resultaat hebben we de framerates van Project Cars ook niet meegenomen in de prestatie-index op pagina 14.
- 1920x1080
- 2560x1440
- 3840x2160
The Witcher 3, tot slot, draaide op high-instellingen op 1920x1080 en 2560x1440 pixels zonder problemen op hoge framerates. Wil je op 3840x2160 pixels gamen, dan heb je minstens een GTX 1080 nodig om je gemiddelde framerate boven de 60 te houden. Bovendien moeten de grafische instellingen omlaag naar medium.
DX12: Hitman en Tomb Raider
- 1920x1080
- 2560x1440
- 3840x2160
Tomb Raider en Hitman zijn twee nieuwe games die we hebben getest. Ze kunnen bovendien gebruikmaken van DirectX 12. We hebben beide games gebenchmarkt op de hoogste instellingen, op drie verschillende resoluties. In beide games hebben we ook de beide GTX 1080-kaarten in sli gedraaid, maar dat leverde geen winst op, omdat de games sli onder DirectX 12 (nog) niet ondersteunen. In Hitman is bovendien de snelheidswinst van Pascal kleiner dan we in andere games gezien hebben.
- 1920x1080
- 2560x1440
- 3840x2160
Het wat lage resultaat in Hitman zagen we niet terug in Rise of the Tomb Raider, dat de framerates neerzette die we zouden verwachten op basis van alle eerdere benchmarks. De GTX 1080 is ruim vijfentwintig procent sneller dan de GTX 1070, die op zijn beurt weer een procent of acht sneller is dan de GTX 980 Ti.
Overklokken
De drie kaarten die we getest hebben, tweemaal de GTX 1080 en een GTX 1070, hebben we overgeklokt om te zien of er nog meer uit de Pascal-gpu te halen valt. We hebben de spanning naar de gpu met rust gelaten, maar zowel gpu als geheugen zo ver mogelijk overgeklokt. Om de stabiliteit van de overklok te testen hebben we gebruikgemaakt van de nieuwe stress-test in 3DMark.
Uiteindelijk bleken we uit de MSI-kaarten geen indrukwekkende overkloks te halen. De Founders Edition van Nvidia's GTX 1080 deed het daarentegen een stuk beter en draaide 235MHz sneller. De GTX 1080 van MSI wisten we maar 85MHz over te klokken, terwijl de GTX 1070 er 110MHz bijkreeg. De MSI-kaarten zijn van zichzelf al aardig ver overgeklokt en daardoor verschilt het eindresultaat tussen de beide GTX 1080-gpu's niet veel. Ook na de overklok had gpu-boost 3.0 tot gevolg dat de gpu van de GTX 1080 zichzelf af en toe boven de 2GHz klokte.
Ook de geheugensnelheid hebben we onder handen genomen en daarbij bleek er nog aardig wat rek in het gddr5x te zitten, dat bij de Founders Edition op 1433MHz wilde draaien, terwijl MSI's GTX 1080 op 1401MHz wilde werken. Dat resulteerde in effectieve snelheden van 11,5 en 11,2Gbit/s. Ook het gewone gddr5 op de GTX 1070, waarvan we hadden verwacht dat de limiet wel rond de 2GHz lag, wist er een indrukwekkende 440MHz bij te klokken, waarmee het geheugen bijna even snel is als het gddr5x van de GTX 1080 op standaardsnelheden.
Het resultaat van de overklok is in de boven- en onderstaande tabellen te vinden. Doordat de Founders Edition-kaart zich net wat verder laat overklokken, staat die steeds bovenaan, op de voet gevolgd door de MSI-kaart. Voor de Founders Edition levert de overklok een framerate op die ongeveer tien procent hoger is dan op standaardsnelheden. De MSI is op de standaard OC-snelheid al een procent of vijf sneller dan de Founders Edition en wint met de bescheiden overklok nog een paar procent. Het interessantste resultaat is misschien dat van de GTX 1070, want die komt met zijn 110MHz extra dicht in de buurt van een GTX 1080 op standaardsnelheden.
Energie en geluid
Behalve framerates hebben we ook het verbruik en de geluidsproductie van de koelers getest. Het meten van de energieconsumptie doen we met behulp van een Voltcraft 4000, waarmee we gedurende twintig minuten het opgenomen vermogen van het hele systeem meten. Hoewel de videokaart tijdens gamen de grootste energieslurper is, is deze methode van meten niet perfect en daarom willen we in de toekomst energiemetingen direct op het pcie-slot en de peg-stekkers uitvoeren. Op dit moment hebben we daar de apparatuur nog niet voor en zullen we het met deze indicatie van het verbruik moeten doen.
We hebben het opgenomen vermogen eerst gemeten in de idle-toestand en vervolgens gedurende de stress-test van 3DMark, die we veertig runs van een halve minuut lieten uitvoeren. De GTX 1080 heeft een tdp van 180 watt, tegenover 165 watt van de GTX 980, en dat komt redelijk overeen met het verschil van 35 watt dat wij hebben gemeten. De GTX 1080 van MSI verbruikt een stuk meer, terwijl de GTX 1070 op het niveau van de GTX 1080 op standaardclocks zit.
Tegelijk met de energieopname hebben we de geluidsproductie van de koeling gemeten. De MSI-kaarten hebben semipassieve ventilators die bij lage temperaturen stoppen met draaien, waardoor we in dat geval alleen het achtergrondgeluid van 30dB(A) hebben kunnen meten. Ook onder belasting zijn de MSI-koelers buitengewoon stil, in tegenstelling tot de standaardkoeler van Nvidia, die aardig wat geluid produceert. Het voordeel van de Nvidia-koeler is wel dat de warme lucht de behuizing uit wordt geblazen, terwijl de MSI-koelers de warme lucht door de behuizing heen verspreiden. Heb je een heel compacte behuizing of geen ventilators die de warme lucht afvoeren, dan kan de standaard-Nvidia-koeler een betere keus zijn dan een videokaart met aangepaste koeling.
Vr-benchmarks op de Oculus Rift
Toen we de Oculus Rift testten, hebben we behalve naar draagcomfort en beeldkwaliteit ook naar de prestaties van verschillende videokaarten in vr-games gekeken. De conclusie was dat de door Oculus als minimum gestelde R9 290 of GTX 970 in veeleisende games niet voldeed. De meeste vr-ervaringen en eenvoudige games als Lucky's Tale draaiden prima, maar bij het spelen van zwaardere games als Adr1ft en Project Cars waren die kaarten niet toereikend. In Project Cars haalden we zelfs met een GTX 980 Ti niet de gewenste 90fps gemiddeld en Adr1ft, dat voor Nvidia-kaarten geoptimaliseerd is, liep alleen op de GTX 980 en 980 Ti op 90fps.
Nvidia heeft zich met Pascal uiteraard ook op vr gericht. De verbeterde pre-emption heeft tot gevolg dat er sneller naar een timewarp-taak geschakeld kan worden en simultaneous-multi-projection moet leiden tot een verdubbeling van de snelheid in vr. Dat laatste geldt echter alleen door ondersteuning voor smp in de game in te bouwen en op het moment van schrijven zijn die games nog niet beschikbaar. Vermoedelijk zal Obduction eind juli de eerste game zijn met ondersteuning voor smp.
Smp hebben we dus nog niet kunnen testen, maar voor Project Cars en Adr1ft in vr draait een GTX 1070 zijn hand al niet om en haalt hij netjes 90fps gemiddeld. De videokaart synchroniseert de framerate met de verversingssnelheid van 90Hz, waardoor de framerate gemiddeld niet boven de 90 uit kan komen. Hoewel we maar twee games getest hebben, zijn het wel de zwaarste games die we tegenkwamen op de Rift en we kunnen dus voorzichtig concluderen dat Pascal voorlopig opgewassen is tegen de hoge resolutie en framerates van vr.
Prestatie-index
Om een idee te geven van de onderlinge snelheidsverschillen van de videokaarten die we getest hebben, hebben we de gemiddelde framerate van de games samengevat in een prestatie-index.
De GTX 1080 is, uiteraard, de snelste. Hij haalt een framerate die gemiddeld een derde hoger ligt dan die van de GTX 980 Ti en is ongeveer 75 procent sneller dan een GTX 980. Op het moment van schrijven betaal je ook behoorlijk voor die prestaties, want de GTX 1080 is slecht leverbaar en de goedkoopste uitvoeringen kosten een euro of 700, terwijl de door ons geteste GTX 1080 van MSI bijna 800 euro kost. De GTX 1070 is betaalbaarder, maar kost nog altijd 500 euro en is eveneens slecht verkrijgbaar.
Je zou daarom ook je kans kunnen grijpen en nog een oude Maxwell-videokaart op de kop kunnen tikken, want daarvan heeft Nvidia de prijzen behoorlijk verlaagd. Een 980 Ti heb je al voor 500 euro, terwijl de goedkoopste GTX 980 380 euro doet. Deel je die prijs door de prestatie-index, dan kunnen we zien welke videokaart de meeste waar voor je geld biedt. MSI's GTX 1070 kost een euro of 500, maar de GTX 1080 kost meer dan 800 euro, terwijl er al GTX 1080-videokaarten voor ruim 100 euro minder te bestellen zijn.
Voor de Founders Edition van de GTX 1080 hebben we een prijs van 700 euro aangehouden en voor de GTX 1070 rekenen we 500 euro. Een Fury X is er voor ongeveer 580 euro, terwijl een R9 Nano een euro of 520 kost. Zet je die prijzen af tegen de prestaties die geleverd worden, dan blijkt de GTX 1070 de meeste frames voor je geld te leveren. Dat is ook niet zo raar, want de 1070 is sneller dan een GTX 980 Ti, voor hetzelfde bedrag. De GTX 1080 is natuurlijk veruit de snelste videokaart, maar daar betaal je wel onevenredig veel meer voor. Daarbij is een Founders Edition aantrekkelijker dan de geteste MSI-kaart, die voor 100 euro meer maar een kleine hoeveelheid extra prestaties levert.
Conclusie
Na de GTX 1070 en 1080 uitgebreid getest te hebben, moeten we toegeven onder de indruk te zijn geraakt van de prestaties van de nieuwe videokaarten. Uit de prestatie-index bleek al dat de gemiddelde framerate van de GTX 1080 in de door ons geteste games ongeveer een derde hoger ligt dan die van de GTX 980 Ti. Daarbij is het verbruik afgenomen en is de kaart klaar voor de toekomst met de ondersteuning voor hardwarematig (de-)coderen van hevc op 4k-formaat. Bovendien produceert de koeling dankzij het lagere verbruik niet al te veel herrie.
Zoals het er nu voorstaat, is de GTX 1070 de interessantste kaart van de Pascal-generatie, gezien de flink hogere prijs van een GTX 1080, die niet helemaal evenredig is met de prestaties die je daarvoor terugkrijgt. Dat geldt helemaal voor de MSI GTX 1080, die weliswaar een veel stillere koeler heeft dan de Founders Edition, maar zich minder ver laat overklokken en duurder is.
Ga je voor de snelste kaart van dit moment, dan zul je daar dus aardig wat voor moeten neerleggen en we vermoeden dat Nvidia zich voorlopig niet gedwongen voelt om de prijs te laten zakken. De al uitgelekte benchmarkresultaten van AMD's nog te verschijnen videokaart, de RX480, laten zien dat die gpu, die slechts tweehonderd dollar gaat kosten, ook niet bij de GTX 1070 en 1080 in de buurt zal komen.
Daarmee is Nvidia op dit moment ruimschoots de snelste, en dankzij features als smp en de mogelijkheid om hevc te (de)coderen ook klaar voor de toekomst, zolang je 'm kunt betalen.