nVidia GeForce 256
Videokaarten met de GeForce 256 chip van nVidia zijn inmiddels goed verkrijgbaar, dus werd het tijd voor een review (okee okee, ik ben een beetje laat, maar ik probeer het in ieder geval wel meteen goed te doen
). Danzij de vriendelijke medewerking van Guillemot en Creative Labs wist Tweakers.net twee exemplaren te bemachtigen: de Guillemot 3D Prophet met SDRAM en de Creative Labs Annihilator Pro met het snellere DDR SDRAM.
nVidia GeForce 256
Zoals gezegd zijn beide kaarten voorzien van een GeForce, de 'Graphics Processing Unit' die eind augustus door nVidia werd aangekondigd. Het lijkt me tamelijk onzinnig om hier een uitgebreid verhaal over de GeForce neer te kloppen, aangezien we al meer dan 3 maanden onafgebroken worden doodgegooid met nieuws over nVidia's wonderchip. Voor de volledigheid een 'kort' overzicht van de features.
256-bit, quad pipelined rendering engine
De GeForce engine berekent 4 pixels per clock, maar kan in tegenstelling tot de Voodoo3 en Savage2000 niet meerdere textures per pixel in één kloktik verwerken. Dit heeft als voordeel dat de GeForce zowel bij single- als multi-textured games altijd van zijn maximale fillrate gebruik kan maken.
De kloksnelheid van de GeForce is (slechts) 120MHz. Een simpel rekensommetje leert ons dat de maximale fillrate dus 120*4=480MPixels/sec is. Aangezien de chip ook een complete T&L engine herbergt ontwikkelt het ding nogal veel hitte, waardoor hogere kloksnelheden op het door nVidia gebruikt 0,22micron proces blijkbaar niet mogelijk waren. Dankzij de quad engine is een GeForce toch duidelijk sneller dan een TNT2, die maar 2 pixels per clock doet.
Met een fillrate van 480Mpix/sec gaat de GeForce beduidend harder dan een TNT2 Ultra (300-350Mpix/sec) en behoort hij tot de snelste videokaarten van dit moment. De S3 Savage2000 is in principe sneller (250Pix/sec single-textured, 500MTex/sec texture fillrate bij multi-textured games), maar wordt beperkt door een tragere geheugen interface (155Mhz) en het feit dat hij maximaal 2 pixels per clock kan renderen, welismaar multi-textured bij games die dit ondersteunen. De ATi Rage Fury MAXX is op dit moment nog niet verkrijgbaar, maar benchmarks laten zien dat de MAXX gelijk of soms zelfs beter presteert dan een GeForce met DDR SDRAM. Dankzij twee Rage 128 Pro cores die ieder 32Mb SDRAM tot hun beschikking hebben heeft deze kaart een extreem hoge fillrate, zonder afgeknepen te worden door de relatieve lage geheugen bandwidth van SDR SDRAM.
Hoewel de GeForce intern op 256-bit werkt, loopt de geheugenbus op 128-bit. De bandbreedte van de GeForce SDRAM kaarten is 2,66Gbyte/sec (166MHz), wat lager is dan de bandbreedte van de TNT2 Ultra. Bij gebruik van DDR SDRAM verdubbelt de bandbreedte en komt dan uit op 4,8Gbyte/sec (150MHz). nVidia spreekt dan van een 256-bit brede bus, hoewel de driver aangeeft dat het zaakje op 300Mhz loopt (128-bit dus). Maakt in feite ook geen biet uit, want het komt allebei op hetzelfde neer...
Hardware Transforms & Lighting
De GeForce (geometrie krachten?) is de eerste consumer 3D processor met een ingebakken T&L engine (nouja, de S3 Savage2000 schijnt er ook eentje te hebben, maar die is kaduk zolang ze daar hun drivertjes niet gefixt hebben
). Dankzij de T&L engine kunnen geometrie berekeningen (deels) naar de videokaart verplaatst worden, wat enerzijds de processor ontlast en anderzijds complexere scenes met meer polygonen mogelijk maakt. Als we nVidia mogen geloven betreft het hier een revolutionaire ontwikkeling en het is niet moeilijk om zelf tot een vergelijkbare conclusie te komen. Het overhoop knallen van een tiental gegroepeerde polygonen geeft een veel lagere kick dan het naarmaaien van het realistische, uit duizenden polygonen gevormde model van mevrouw Van Duuren (om maar even een oud-lerares frans als voorbeeld te noemen
).
De geometrie engine van de GeForce kan meer dan 15 miljoen triangles per seconde berekenen. Dit maakt het mogelijk om scenes van meer dan 100.000 polygonen tegen een acceptabele framerate weer te geven.
Zoals altijd werkt het hele T&L grapje pas wanneer het door de software ondersteund wordt en daar ligt op dit moment het voornaamste knelpunt, want er zijn nog nauwelijks titels die gebruik kunnen maken van hardware T&L. Allereerst moet de 3D API er voor geschikt zijn. Bij DirectX 7 en OpenGL is dit het geval, DirectX 7 games moeten echter wel specifiek van de T&L mogelijkheden gebruik maken (niet het geval bij OpenGL, daar werkt het in principe altijd). Ten tweede zijn er nog geen games die gebruik maken van complexere scenes, dus ook al wordt er T&L acceleratie gebruikt, dan nog is er geen verschil in beeldkwaliteit.
Op dit moment zijn er een beperkt aantal applicaties die de mogelijkheden van hardware T&L kunnen benutten:
Quake III Arena
In Quake III Arena is het mogelijk om een hogere detail voor curves en ver afgelegen objecten te forceren. Een voorbeeld van 3DGPU.com:
3DMark 2000
3DMark 2000 heeft een aantal high-poly benchmarks. Men heeft hier simpelweg een stel extra bomen en poppetjes in de scene gecopy/paste en eerlijk gezegd vind ik dat er nou niet echt veel beter uit zien.
Dragoth Moor Zoological Gardens
Dragoth Moor Zoological Gardens is een technology demo die specifiek werd ontwikkeld om de mogelijkheden van hardware T&L te demonstreren. DMZG is een van de eerste programma's die het ware potentieel van deze technologie naar buiten brengt.
nVidia tech demo's
nVidia heeft een aantal demo's in elkaar geschroefd die de mogelijkheden van de GeForce demonstreren. Hoewel deze demo's zeker leuk zijn om eens naar te kijken, geven ze naar mijn mening nog steeds geen goede demonstratie van de mogelijkheden van T&L. Het geeft bijzonder veel genoegdoening om een high-poly brandweerwagen rond zijn as te laten draaien, maar ik wil dus bloed, actie en snelheid zien!
3D Modelling
3D Modellers kunnen met de OpenGL drivers direkt profijt trekken uit de onboard geometrie engine. Volgens benchmarks van c't haalt een doodnormale GeForce met standaard huis-tuin-en-keuken drivertjes van nVidia al hogere framerates dan een Diamond FireGL1. Voor professionele modellers is het wellicht verstandiger om te wachten op professionele GeForce kaarten van Elsa, vanwege hun goede drivers. Wie te veel geld heeft kan dit eventueel kwijtraken aan een nVidia Quadro, de professionele versie van de GeForce die voorlopig exclusief door Elsa aangeboden zal worden.
350 MHz RAMDAC
Om maar even verder te gaan met de specs: de GeForce 256 heeft een ingebakken RAMDAC met een snelheid van 350Mhz, wat in de buurt komt van de G400 Max (360MHz RAMDAC). Dit is vooral prettig voor de trotse bezitters van een 21/22" monitor, want zij halen dankzij deze snelle RAMDAC een refreshrate van 100Hz bij een resolutie van 1600 * 1200px (dit vereist wel een stevige kijkdoos met een horizontale refreshrate van minimaal ~120KHz).
Resolutie / Kleurdiepte | 8-bit | 16-bit | 32-bit | 640 * 480 | 240 | 240 | 240 | 800 * 600 | 240 | 240 | 240 | 1024 * 768 | 240 | 240 | 240 | 1152 * 864 | 200 | 200 | 170 | 1280 * 960 | 170 | 170 | 150 | 1280 * 1024 | 170 | 170 | 150 | 1600 * 900 | 150 | 150 | 120 | 1600 * 1200 | 120 | 120 | 100 | 1920 * 1080 | 100 | 100 | 85 | 1920 * 1200 | 100 | 100 | 85 | 1920 * 1440 | 85 | 85 | 75 | 2048 * 1536 | 75 | 75 | 60 |
|
Cube Environment Mapping
De GeForce kent geen EMBM (wel Dot Product Bumpmapping, wat enigzins vergelijkbaar is met het door de G400 ondersteunde Environment Mapped Bumpmapping). nVidia is van mening dat EMBM overbodig is wegens de aanwezigheid van de T&L engine (echte polygonen berekenen in plaats van faken met een bumpmap).
Wat de GeForce wel kan is Cube Environment Mapping (CEB), waarmee weerspiegelingen van de omgeving middels een bumpmap op een object aangebracht kunnen worden. Het object wordt in een kubus met zes bumpmaps geplaatst, waarna de weerspiegeling vanuit alle zichtbare richtingen berekend wordt.
CEB werd ontwikkeld door SGI en is in DirectX7 geïmplementeerd. Hopelijk kunnen we binnenkort games verwachten die gebruik van van deze features.
AGP4x Fast Write
Met behulp van Fast Writes kan de CPU - zonder omweg via het geheugen - direkt naar de frame buffer van de GeForce schrijven. Het grapje werkt met de i820 chipset en zou zo'n 30% sneller moeten zijn. Jammer dat AGP vooralsnog erg weinig invloed op de 3D performance lijkt te helpen (behalve dan in negatieve zin, zodra de videokaart door een gebrek aan lokaal geheugen moet overgaan op AGP texturing zakt de framerate als pudding in mekaar... en 30% minder pudding is nog altijd pudding
).
Als we nVidia mogen geloven dan gaat er bij het gebruik van hardware T&L een hoop geometrie data over de AGP poort, dus wie weet gaat AGP4x ooit meer performance voordeel opleveren dan de huidige 3%.
/etc.
Verder ondersteund de GeForce HDTV playback met HDTV motion-compensation. Met Vertex Blending kunnen de 'gaten' tussen 3D primitieven (bijv. lichaamsgewrichten) aan elkaar geknoopt worden. 'Particle Systems' kunnen erg leuk gebruikt worden bij het weergeven van explosies. Tenslotte is er support voor DirectX (S3) texture compression.
Guillemot 3D Prophet
Terug naar de twee slachtoffers van deze review. De eerste kaart die ik kreeg opgestuurd was de 3D Prophet van Guillemot, die in een prachtige doos wordt geleverd (de ongelukkige personen die de doos-loze OEM versie gekocht hebben kunnen op de Guillemot website een afbeeldingen neerhalen en eventueel aan de muur hangen
).
In de doos treffen we een handleiding aan. Dit prachtig stuk literatuur heb ik niet nodig gehad. Om te voorkomen dat je je splinternieuwe 3D Prophet door een PCI slot probeert te beuken wordt er o.a. uitgelegd hoe een AGP slot eruit ziet, dus /me denkt dat het wel goed zal komen met de newbies
.
Verder in de doos een CD'tje met drivers en demo's, een S-VHS naar composite convertorkabeltje en (thank God) een GeForce kaart.
5ns SDRAM
Het exemplaar dat ik van Guillemot ontving was voorzien van 5ns SDRAM, dat volgens een simpel rekentrucje in staat moet zijn om een snelheid van 200MHz te halen. Hoewel het me inderdaad lukte om het geheugen op 200MHz te klokken had dit wel tot gevolg dat onpixels bezit van mijn beeldscherm begonnen te nemen.
Uit andere reviews heb ik begrepen dat er ook profeten in de omloop zijn die een geheugensnelheid van 5,5ns verkondigen. In dat geval ligt de maximale memory setting rond de 183MHz, wat voor overklokkers toch zo'n 9% performance kan schelen.
TV-Out
De aanwezigheid van een TV-out vormt een opvallend kenmerk in vergelijking met de massa van kale GeForce kaarten. Hoewel ik liever op m'n 19" in hoge resoluties speel kan ik me voorstellen dat er mensen zijn die de voorkeur geven aan een grote TV (of voor optimaal game nirwana: een brute beamer). De TV-Out maakt bovendien het gebruik van een hardwarematige MPEG decoder overbodig voor het afspelen van DVD's op een TV. De hogere prijs voor de TV-Out verdien je op deze manier vanzelf terug.
Software
Op de meegeleverde CD bevinden zich naast de drivers en documentatie demo's van Monaco Grand Prix Racing Simulation 2, Speed Busters, S.C.A.R.S. en Tonic Trouble. Niet geheel toevallig zijn dit allemaal spellen van Ubisoft (Guillemot en Ubisoft slapen met elkaar). Tevens staan alle 3D animation demo's van nVidia op de CD en wordt een versie van Xing DVD-Video Player meegeleverd.
Installatie
Installatie van de 3D Prophet verliep in eerste instantie vlekkeloos op mijn systeem (dual Celeron 333 @ 500MHz, Abit BP6, 384Mb, 2xIBM harddisk, Tekram Ultra SCSI, Pioneer SCSI DVD, Teac SCSI CDR en Xitel Storm Vortex II geluidskaart, dit alles verpakt in een SuperMicro SC760-A tower met 300W voeding). Windows 2000 2114 bleek na het booten niet bekend te zijn met het fenomeen GeForce, dus mocht ik eerst op heerlijke VGA resolutie met stoboscopische refreshrates een Win2k drivertje van het net plukken.
Terug op een normale resolutie (in mijn geval 1280 * 1024, 32-bit en 85Hz) viel me meteen op dat de beeldkwaliteit van de 3D Prophet beduidend beter was dan die van m'n ouwe trouwe Hercules Dynamite TNT. De oorzaak hiervan dacht ik in eerste instantie gevonden te hebben in de snellere RAMDAC van de GeForce (350 vs 250 MHz voor de TNT), maar later bleek dat de Creative Labs Annihilator Pro een vrijwel net zo wazig beeld gaf als m'n Dynamite TNT. Hoewel de beoordeling van de beeldscherpte zonder gebruik van testapparatuur erg subjectief is, heb ik toch telkens het gevoel dat de 3D Prophet stukken scherper is wanneer ik overschakel naar de TNT of de Annihilator Pro.
Problemen ontstonden er pas toen ik op het idee kwam om Unreal Tournament onder 98 te proberen: m'n systeem bleek random binnen 10 minuten op z'n waffel te gaan. Quake III Arena sorteerde exacte hetzelfde effect, net zoals 3DMark 2000. Het installeren van andere drivers (3.53, 3.56 en 3.62), andere Windows versies (Win98NL en Win98SE US), het volledig kaalplukken van m'n systeem (alleen 1 CPU, Videokaart, geheugen en harddisks) en downclocking (CPU op 333MHz, 3D Prophet op 105/140Mhz) had geen enkel effect.
Nu is het een bekend feit dat de GeForce problemen kan vertonen in systemen met een slappe voeding of systemen met moederborden die niet voldoende stroomsterkte kunnen leveren (LX mobo's geven om die reden veel ellende). Aangezien ik een 300Watt voeding gebruik die bij 3,3V een stroomsterkte van 17 ampère kan leveren heb ik niet de indruk dat dit het probleem kan zijn. Het feit dat een BE6-II met dezelfde voeding geen problemen geeft bevestigd dit. Bovendien bleek downclocking op een volledig kaalsysteem geen enkel effect te hebben. Je zou verwachten dat het stroomverbruik dan behoorlijk afgenomen is.
Blijkbaar heb ik dus gewoon een zieke BP6 die allergische reakties vertoond wanneer deze met een GeForce in aanraking komt.
De 3D Prophet bleek overigens perfect te werken op een Abit BX6-II en BE6-II, de Annihilator Pro functioneerde probleemloos op een Chaintech VIA Apollo Pro 133 plank in een systeem met 235W voeding. Tijdens een LAN-party mocht de 3D Prophet te gast zijn in de machine van Cmdr.Rosking (AOpen evangelist) en was hem daar bijzonder hulpzaam bij het omleggen van Counterstrikende Fempies
.
Conclusie van dit verhaal: beide GeForce kaarten zijn okee en mijn BP6 is brak. Let er echter wel op dat je power supply voldoende vermogen kan leveren: 235Watt kan voldoende zijn in een redelijk kaal systeem, maar zeker in combinatie met een Athlon (die geven al problemen bij <250W power supplies) is het verstandig om een stevige voeding in huis te halen.
Creative Labs Annihilator Pro
De tweede GeForce die ik kreeg toegestuurd was de Annihilator Pro van Creative Labs. De doos is wederom erg strak gedesigned, het ontwerp pas perfect bij de erg coole naam van de kaart. Na enig gefrutsel blijkt deze verzameling karton naast de Annihilator Pro een handleiding, driver CD en enkele demo's te herbergen.
6ns DDR SDRAM
De Annihilator Pro beschikt over Double Data Rate SDRAM, dat vergeleken met het SDRAM van de 3D Prophet een dubbele bandwidth heeft. De chips zijn afkomstig van Infineon (de vroegere halfgeleider divisie van Siemens) en hebben een snelheid van 6ns, wat in theorie een maximale klokfrequentie van 166Mhz toestaat. Creative speelt het safe en klokt de chips op 150MHz DDR.
Software
Een TV-Out is niet aanwezig, maar er wordt naast de driver en nVidia demonstratie CD wel een special edition (zeg maar 'demo') van Evolva meegeleverd. Net zoals Guillemot levert Creative Labs een software DVD decoder, in dit geval WinDVD van iVi.
Benchmarks - Quake III Arena 16-bit
Zoals gezegd sympathiseerde mijn BP6 niet met het idee om samen te werken met een GeForce. Een vers uit Taiwan aangevoerde BE-II bracht gelukkig soelaas. Voor de volledigheid de specs van het testsysteem:
Testsysteem
Processor: Celeron 333 op 500MHz met GlobalWin FDP32 heatsink
Moederbord: Abit BE6-II met Asus socket370 riser card
Geheugen: 384Mb SDRAM
Videokaart: Hercules Dynamite TNT, Guillemot 3D Prophet, Creative Labs Annihilator Pro
Voeding: Ablecom (SuperMicro) SP301-RA (300Watt)
OS: Windows 98SE US met v3.56 Detonator drivers
SCSI kaart werd geïnstalleerd ivm het installeren van drivers vanaf CD. Een geluidskaart was tijdens het benchmarken niet aanwezig.
In totaal heb ik van de 3D Prophet en Annihilator Pro meer dan 160 Quake III Arena en Quake II timedemo resultaten verzamelt. Mijn doel met deze benchmarks is niet zo zeer om de absolute performance van de 3D Prophet en Annihilator Pro weer te geven (deze verschilt toch sterk per systeem), maar meer om het relatieve verschil tussen de GeForce en GeForce DDR aan te tonen. Mijn arsenaal benchmarks is beperkt, maar ik ga wel diep op de resultaten in.
Quake III Arena Demo001
Zoals je ziet worden de 3D Prophet en Annihilator Pro hier duidelijk tegengehouden door mijn trage Celeron. De hoogste score is afkomstig van de 3D Prophet op 160/200MHz, die onder deze omstandigheden blijkbaar extra voordeel van de hogere core clock heeft. Memory bandwidth is duidelijk niet de bottleneck bij deze lage fillrates.
De framerates voor beide GeForce kaarten blijven vrijwel gelijk. De CPU is nog steeds de botteneck, hoewel het overklokken van de core wel een lichte performance stijging laat zien.
De 3D Prophet zit bij de standaard clock settings inmiddels aan z'n fillrate limit. De beperkte SDRAM geheugen bandwidth is duidelijk het probleem, aangezien de framerate van de Annihilator Pro met DDR SDRAM nauwelijks omlaag gaat.
Beide kaarten zitten aan hun maximale fillrate. Vooral de snelheid van de GPU lijkt de beperkende factor te zijn, gezien het opvallend grote voordeel dat de overgeklokte 3D Prophet uit z'n hoge core clock weet te halen.
Wederom haalt de 3D Prophet scores die boven het niveau van een standaard geklokte GeForce DDR liggen.
Benchmarks - Quake III Arena 32-bit
Dezelfde Quake III demo werd ook gedraaid met 32-bit kleur, 32-bit textures en bilinear filtering.
Beide kaarten zien zich duidelijk in hun prestaties beperkt worden door mijn trage Celeron op 500MHz, die er niet meer dan 75 frames per seconde uit weet te trekken.
De standaard geklokte 3D Prophet zit duidelijk aan z'n fillrate limit. Een hogere core clock is niet meer genoeg om voorbij de Annihilator Pro te komen. Duidelijk is dat het grootste probleem bij de beperkte geheugen bandwidth van de GeForce SDR ligt.
De Annihilator Pro laat voor het eerst een duidelijk gat met de 3D Prophet zien. Op standaard frequenties bereikt de Annihilator Pro een 42% hogere framerate als de 3D Prophet.
Het gat tussen de Annihilator Pro en 3D Prophet blijft vrijwel gelijk. De overgeklokte 3D Prophet komt redelijk dicht in de buurt van de standaard geklokte Annihilator Pro.
De performance zakt dramatisch. Blijkbaar is 32Mb niet meer genoeg om alle textures lokaal op te slaan en wordt er gebruik gemaakt van AGP texturing. Op een 440BX systeem met AGP2x is de maximale AGP bandwidth 528Mbyte/sec, gedeeld over een geheugenbus van 800Mbyte/sec. Vergeleken met de interne geheugenbandwidth van de 3D Prophet (2,66Gbyte/sec) en de Annihilator Pro (4,8Gbyte/sec) schiet AGP2x duidelijk tekort.
Ik ben niet zo'n aanhanger van de 3DMark index (ik zie liever harde framerates), maar voor de volledigheid toch twee 3DMark 2000 resultaten. Deze zijn sterk afhankelijk van de gebruikte processor, vergelijking met andere systemen heeft weinig zin.
Benchmark analyse
Goed, laten we eens kijken wat deze benchmarks naast harde framerates nog meer aan informatie opleverden.
In bovenstaande grafiek wordt de relatieve framerate van de Annihilator Pro vergeleken met de 3D Prophet, waarvan de 16 en 32-bit scores op 100% zijn gezet. Duidelijk is te zien dat de Annihilator Pro op lage resoluties nauwelijks sneller is dan de 3D Prophet, beide kaarten worden beperkt door mijn trage Celeron. Bij gebruik van 32-bit kleur blijkt DDR SGRAM een duidelijk voordeel te bieden boven normaal SDRAM. Bij een Celeron 500 wordt dit verschil in de Quake III demo zichtbaar vanaf een resolutie van 1024 * 768px. De vergelijking op 1600 * 1200 @ 32-bit is wegens het (waarschijnlijke) gebruik van AGP texturing niet representatief voor de prestaties van de GeForce DDR.
Bovenstaand nogmaals de SDR vs DDR verhoudingen, maar dan overzichtelijk weergegeven in een staafdiagram. Op de populaire resolutie van 1024 * 768px (ideaal voor een 17") is er bij 32-bit kleur een behoorlijk groot verschil van 42%. De aanschaf van een GeForce DDR is absoluut zinvol wanneer je met een snelle CPU op hoge resoluties (>=1024 * 768) wilt gamen.
Bovenstaande grafiek is een weergave van de effectieve fillrate (resolutie * framerate * kleurdiepte). Hierbij wordt dus niet rekening gehouden met onzichtbare pixels die in werkelijkheid wel worden gerenderd wanneer voorwerpen elkaar op de z-as overlappen. De resultaten op 1600 * 1200 @ 32-bit heb ik weg gelaten aangezien deze toch niet representatief zijn.
Uit de resultaten wordt in ieder geval duidelijk hoe zwaar beide kaarten op lage resoluties worden beperkt door mijn trage CPU. Onder ideale omstandigheden zouden de lijnen over alle resoluties ongeveer horizontaal moeten lopen.
De GeForce lijkt duidelijk voor 32-bit kleur geoptimaliseerd te zijn, aangezien de fillrate scores bij 16-bit kleur veel lager uitvallen (ook bij resoluties waar de CPU geen bottleneck is).
Het is trouwens volstrekt logisch dat een videokaart bij 32-bit kleur een flinke framerate daling laat zien, het arme chippie krijgt dan namelijk praktisch twee keer zoveel data voor z'n waffer...
Bovenstaande resultaten werden op 1280 * 1024 met 32-bit kleur en trilinear filtering gebenchmarkt. De stappen tussen 205 en 320MHz werden geïnterpoleerd. Tussen 300 en 360MHz heb ik resultaten in stappen van 10MHz, maar om de onderlinge verhoudingen in de grafiek te behouden heb ik de resultaat bij 325Mhz geïnterpoleerd en bij 365MHz geëxtrapoleerd.
De grijze lijn tussen 166 en 325MHz loopt vrijwel onder dezelfde hoek als de rode lijn tussen 325 en 365MHz, dit klopt dus perfect. Des te vreemder is het resultaat bij 205MHz SDRAM, je zou verwachten dat deze op de grijze lijn ligt. Als je deze stijging lineair zou extrapoleren, dan zou 240MHz SDRAM ongeveer net zo snel zijn als 150MHz DDR SGRAM!? (ikke nie begraipe)
Overclocking: 3D Prophet
In de grafiekjes op de voorgaande pagina's heb je al overgeklokte resultaten van beide kaarten kunnen zien. Het overklokken van een GeForce is echt een koekje, aangezien de overclock sliders zich tegenwoordig in de display properties bevinden. Programma's zoals Powerstrip kun je in principe uit het raam...euh Windows gooien, tenzij je een 3D Prophet tegenkomt...
De Guillemot 3D Prophet bleek een waar overclockin wonder te zijn. Het 5ns SDRAM dat op mijn exemplaar werd gebruikt is in principe in staat om tot 200MHz te werken. Op deze snelheid ontstonden er echter al heftige vertekeningen in het beeld (205MHz geeft bovendien hele leuke tralie patronen
). 195Mhz was bij mij safe.
De core bleek tot extreme prestaties in staat te zijn: op 150Mhz, de maximale setting van het core clock slidertje in de GeForce drivers, bleek de 3D Prophet nog steeds zonder problemen te werken. Na de meest recente versie van Powerstrip neergehaalt te hebben kon ik mijn missie voort zetten, die uiteindelijk strandde bij een setting van 170MHz (lockup na een minuut). 160MHz functioneerde echter zonder problemen, en dat zonder extra koeling! De geheugenchips worden op 205MHz trouwens wel heet genoeg om een kampvuur te ontsteken
.
Uiteraard zijn de door mij behaalde resulaten niet representatief voor alle 3D Prophets. Als je pech hebt kom je thuis met een exemplaar dat niet voorbij 130MHz wil, heb je geluk dan draai je zonder problemen op 150 of hoger.
Om het effect van overclocking te onderzoeken benchmarkte ik alle framerates in stappen van 10Mhz. Om nadelige invloeden van mijn trage 500MHz Celeronnetje zoveel mogelijk buiten spel te zetten werd dit gedaan op een resolutie van 1280 * 1024 bij 32-bit kleur en trilinear filtering.
Het is al meteen goed te zien dat een verhoging van de geheugensnelheid het meeste effect geeft. Voor een beter overzicht van de verschillen heb ik het bereik tussen 19 en 26 fps in onderstaande grafiek weergegeven:
Nogmaals wordt duidelijk dat de 3D Prophet vooral beperkt wordt door het relatief trage SDRAM. Verhoging van de memory clock van 166 tot 205MHz gaf een toename van 24%, terwijl een verhoging van de core clock van 120 naar 160MHz slechts een verschil van 2% liet zien.
Bij 166MHz memory clock blijkt de framerate boven 140MHz core clock zelfs niet meer toe te nemen. Dit effect komt ook voor op 175MHz memclock, pas op 185MHz lijkt verhoging van de core clock boven 140Mhz resultaat te geven.
Bovenstaan een grafiek met de relatieve framerate stijging in stappen van 10MHz voor zowel core als memory. De resultaten op 160/205MHz zijn hier louter voor statistische doeleinden weergegeven, het is niet realistisch om te verwachten dat je deze setting kunt halen. Ik kreeg in ieder geval al zware pixelpuree.
Een realistischer setting is 150/195, die met een toename van 22% aantoont dat het overklokken van een videokaart wel degelijk zin kan hebben. Uiteraard moet je dan niet in framerate beperkt worden door een trage CPU, maar uit mijn vorige benchmarks is gebleken dat de GeForce SDR en DDR in Quake III Arena op 1024 * 768 bij 32-bit kleur al aan hun dak zitten. Daar komt bij dat Q3A in vergelijking met bijv. de Quake II engine veel heftiger voor je processor is. In games met minder moderne engines zul je sowieso hogere framerates kunnen halen en heeft overclocking ook meer zin.
Aan de andere kant: Quake III Demo001 loopt op een Celeron 500MHz al op minimaal 70fps en dat is meer dan genoeg. Het zal echt heel erg weinig uitmaken of je 70fps onder normale omstandigheden haalt, of 85fps na overclocking. Overclocking is vooral zinvol wanneer de framerate rond de 25-40fps hangt, dan merk je namelijk zelf ook nog wat van de extra snelheid
.
Tenslotte heb ik voor de volledigheid alle scores in een tabel geparkeerd:
Core/Mem | 166 MHz | 175 MHz | 185 MHz | 195 MHz | 205 MHz | 120 MHz | 19,3 | 20,4 | 21,6 | 22,8 | 24,0 | 130 MHz | 19,5 | 20,7 | 22,0 | 23,3 | 24,5 | 140 MHz | 19,7 | 20,7 | 22,2 | 23,5 | 24,8 | 150 MHz | 19,6 | 20,7 | 22,4 | 23,7 | 25,0 | 160 MHz | 19,7 | 20,9 | 22,6 | 24,0 | 25,5 |
|
Overclocking: Annihilator Pro
De Creative Labs Annihilator Pro bleek helaas minder gewillig te zijn: bij 135Mhz core clock ging de kaart al op z'n toeter. De 6ns Infineon DDR SGRAM chips kunnen in principe werken op snelheden tot 166MHz . Ik kon resultaten krijgen op snelheden tot 360MHz, echter wel met ongewenste pixelprut. 340MHz draaide zonder beeldvervorming.
Uit de grafiek wordt al duidelijk dat het overklokken van de Annihilator Pro in mijn geval minder effect gaf als bij de 3D Prophet.
In tegenstelling tot de 3D Prophet heeft verhoging van de core clock bij de Annihilator Pro wel een duidelijk effect. Het is jammer dat de core niet hoger wilde, want dat had interessante resultaten op kunnen leveren. Verhoging van de memory clock blijkt nog steeds effect te hebben, echter niet zo groot als bij de 3D Prophet: de Annihilator Pro geeft op 120Mhz 16% hogere framerate bij 20% hogere memory clock. Bij de 3D Prophet gaan de framerate en memory clock in exact dezelfde verhouding omhoog.
125/330 is een realistisch haalbare setting en geeft een verhoging van ongeveer 10%. 130/340 draait ook goed met mijn exemplaar en levert een 15% hogere framerate op, een resultaat dat naar mijn mening de moeite van het overklokken waard is.
Core/Mem | 300 MHz | 310 MHz | 320 MHz | 330 MHz | 340 MHz | 350 MHz | 360 MHz | 120 MHz | 27,3 | 27,7 | 29,0 | 29,9 | 30,5 | 31,1 | 31,6 | 125 MHz | 27,7 | 28,0 | 29,4 | 29,7 | 31,0 | 31,5 | 32,6 | 130 MHz | 28,0 | 28,3 | 29,8 | 30,0 | 31,4 | 31,9 | 33,0 |
|
Q3A benchmarks: 16-bit, 333 MHz
Ik heb gemerkt dat op de diverse forums hier in Nederland (GoT, C!T enz.) de algemene denkwijze heerst dat het geen zin heeft om een trage PC (~300MHz) meer zelfrespect te geven door naar een moderne videokaart up te graden. Mensen die dergelijke vragen stellen worden vaak met een oude TNT of TNT2 het bos ingestuurd.
Het wordt tijd om een eind te maken aan deze hardnekkige mythe. Onderstaande benchmarks laten zien dat een GeForce en GeForce DDR wel degelijk een verschil laten zien op een 'trage' CPU (Celeron op 333MHz). M'n oude Dynamite TNT staat model voor derde generatie videochips en levert ongeveer vergelijkbare prestaties als de Voodoo2, Voodoo Banshee en ATI Rage 128.
De 500MHz Celeron bleek in Q3A Demo001 bij 70-75fps aan z'n dak te zitten. Even een rekensommetje (75*(333/500)=50) en we zien dat de framerate van de Celeron 333 op bijna exact 2/3 van de C500 ligt. De C333 zal in de Demo001 timedemo dus nooit boven een framerate gemiddelde van ~52fps komen, ongeacht de snelheid van de videokaart.
Verder blijkt het verschil met de TNT op 640 * 480 nog vrij beperkt te zijn. In de praktijk maakt het weinig uit, want deze resolutie wil je toch niet draaien. Ik mag aannemen dat iedereen met een beetje PC tegenwoordig minimaal een 17" heeft staan. Zo niet, koop dan eerst een normale monitor voordat je aan een moderne videokaart begint.
De 3D Prophet en Annihilator Pro peuteren nog gezellig wat neusvuil weg, terwijl de TNT opvallend weinig performance verlies laat zien.
Aangekomen op de populaire resolutie van 1024 * 768 blijkt dat de TNT inmiddels tegen z'n dak zit. Een gemiddelde van 24,3 fps zal in worst-case scenario's niet voldoende zijn voor een acceptabele framerate. 3D Prophet en Annihilator Pro gooien er nog een cocktail tegenaan, alvorens over te gaan op het echte werk.
De 3D Prophet zit inmiddels aan z'n limiet, de Annihilator Pro zakt licht en de oude man is ingestort.
Mijn oude Hercules is nu gaar en zowel de 3D Prophet als de Annihilator Pro hangen tegen hun fillrate limit. Op dit punt maakt het niet uit of je een Celeron 333, Celeron 500 of Kryotech Super G gebruikt, die kaart gaat gewoon niet harder. Verder vind ik 1600 * 1200 gewoon een idiote en onzinnige resolutie. Hooguit zie je wat minder aliasing...ga dan met 32-bit kleur draaien.
Q3A benchmarks: 32-bit, 333 MHz
Voor de processor maakt het in feite geen byte uit of je een spel op 16 of 32-bit kleur draait. Dit maakt 32-bit extra interessant voor systemen met een 'trage' processor, want de framerate drop bij overschakeling naar 32-bit heeft dan in theorie minder effect omdat de prestaties van de videokaart toch al door de CPU beperkt worden.
De 3D Prophet en Annihilator Pro zitten weer op de maximale framerate die de C333 kan genereren. De TNT blijkt op 640 * 480 met 32-bit vrijwel gelijk te presteren als met 16-bit.
De TNT daalt sterk en zit op 800 * 600 al op een onacceptabel gemiddelde. De 3D Prophet scoort iets onder de 50fps, maar is gezien de hogere scores van de Celeron 500 niet fillrate limited.
De 3D Prophet levert op 333 en 500Mhz vrijwel gelijke prestaties en zit duidelijk aan z'n max. Overclocking geeft een kleine verbetering. De Annihilator Pro zakt licht maar zit nog niet aan z'n uitersten. De Dynamite TNT mogen we vergeten, die is duidelijk niet geschikt voor hoge resoluties met 32-bit kleur.
Op 1280 * 1024, een ideale resolutie voor 19" monitoren en eventueel haalbaar voor een goede 17", blijkt ook de Annihilator Pro op z'n maximum te zitten. De 3D Prophet haalt inmiddels een onacceptabel laag gemiddelde, terwijl de Annihilator Pro met 29,6 wel speelbaar is, bovendien duidelijk sneller dan de GeForce SDR. Een 16Mb TNT kan niet overweg met 32-bit resoluties boven 1024 * 768.
Hier lopen we weer tegen het AGP probleem dat we ook bij de Celeron 500 zagen. Opvallend is dat de framerates hier wel omlaag gaan, terwijl dit niet het geval zou mogen zijn wanneer alleen de videokaart de bottleneck is. Blijkbaar neemt de AGP performance sterk terug wanneer deze samen met de CPU vecht om bandbreedte op een 66MHz / 528Mbyte/sec slanke geheugenbus. AGP texturing gaf op 100MHz FSB al lage resultaten, maar wat we nu zien is helemaal triest. Niet geheel toevallig blijkt de verhouding ten opzichte van de framerates op 100MHz ongeveer 66/100 te zijn.
Omdat games met de oude Quake II engine nog steeds erg populair zijn of worden (Daikatana en Soldier of Fortune zijn beide gebaseerd op een gemodifiede QII engine) heb ik een aantal Quake II massive1.dm2 timedemo's gedraaid op de Celeron 333. De Quake II engine is veel minder complex als de Q3A engine, waardoor vooral systemen met een trage CPU met dit soort spellen hogere framerates kunnen halen.
Uit bovenstaande grafiek komt dit ook naar voren: de limiet ligt nu niet bij 50 fps, maar rond de 70. De 3D Prophet en Annihilator Pro presteren tot 1024 * 768 vrijwel gelijk, pas daarna is er verschil merkbaar (24% op 1280 * 1024, 39% op 1600 * 1200). Ten opzicht van de TNT geven de GeForce kaarten duidelijk hogere prestaties.
| Dynamite TNT | 3D Prophet | Annihilator Pro | 640 * 480 | 47,0 | 69,1 | 68,6 | 800 * 600 | 38,3 | 69,5 | 68,6 | 1024 * 768 | 24,7 | 65,7 | 68,2 | 1280 * 960 | 9,7 | 49,6 | 61,4 | 1600 * 1200 | | 30,7 | 42,7 |
|
Conclusies
Moet ik een GeForce kopen?
Dat ligt natuurlijk aan je budget. Als je niet tevreden bent met de prestaties van je huidige videokaart en wanneer je van mening bent dat je die 500 - 700 gulden wel kunt missen, dan zou ik het doen. Het is een simpel feit dat de GeForce (DDR) op dit moment de snelst verkrijgbare gamekaart is. Inmiddels is gebleken dat de S3 Savage2000 - in ieder geval met de huidige drivers - achter blijft. De ATI Rage Fury MAXX is erg snel, soms zelfs sneller, maar mist T&L acceleratie.
Spellen zoals Rally Championship 2000 draaien prima op 1280 * 1024 met 32-bit kleur. Unreal Tournament ging met de 3D Prophet al als een tiet op 1152 * 864 met 32-bit kleur, met een GeForce DDR draai je dan probleemloos op 1280 * 1024.
Moet ik een GeForce DDR kopen?
Dat hangt af van je systeem en de resoluties waarop je wilt spelen. Het potentieel van de GeForce DDR - onder de meest ideale omstandigheden een performance toename van 40% ten opzichte van de normale GeForce - komt pas naar voren op resoluties vanaf 1024 * 768 met 32-bit kleur in een systeem met een redelijk snelle processor. Toevallig zijn 1024 * 768 en 1280 * 1024 ook de meest populaire resoluties onder power gamers, wat de GeForce DDR voor hen erg aantrekkelijk maakt. Gezien het prijsverschil van 100 tot 150 piek zou ik zeggen dat die extra 25-40% performance het verschil waard is, wanneer de prijs van een GeForce DDR binnen je budget ligt.
Moet ik een GeForce kopen voor mijn 'trage' systeem?
Even stellen dat 'traag' tegenwoordig ~300MHz is. Uit mijn benchmarks mag inmiddels gebleken zijn dat het wel degelijk zin heeft om zo'n 'traag' systeem met een GeForce up te graden. Plant er een GeForce in en je systeem staat op viagra: ten opzichte van een TNT kunnen de prestaties met gemak verdrievoudigen!
Het maakt hierbij voor de prestaties weinig uit of je 32-bit kleur gebruikt. Engines zoals die van Quake III zijn eigenlijk helemaal gebouwd voor 32-bit kleur en zonder de eindeloze 16 vs 32-bit discussie weer aan te wakkeren wil ik stellen dat je toch wel erg slechtziend moet zijn om in Q3A geen verschil tussen 16 en 32-bit te onderscheiden. Vooral op lage resoluties zie je erg duidelijk ditheringen in de explosies, zelfs in de textures op de muren kun je dithering patronen herkennen.
Een oud systeem mag je wat mij betreft dus rust met een GeForce uitrusten. Of je er ook meteen een DDR versie in moet stoppen is een andere vraag. Uit de benchmarks blijkt dat in de Q3A timedemo pas op 1024 * 768 met 32-bit kleur een klein verschil waarneembaar is. Pas op 1280 * 1024 met 32-bit kleur is er een duidelijk gat met de normale GeForce SDR. Bij de Quake II zien we ook pas vanaf 1280 * 1024 grote verschillen. Het is twijfelachtig of het zinvol is om een GeForce DDR te nemen wanneer je alleen op allerhoogste resoluties een klein verschil kunt zien. Komt bij dat de QII resultaten op die resolutie zelfs met een gewone GeForce al bijna op 50fps liggen (met de pittige Massive1.dm2 timedemo), de 25% hogere framerate van een GeForce DDR is dan nauwelijks merkbaar.
Dat brengt mij tot de conclusie dat een GeForce DDR zijn geld niet waard is voor oudere systemen.
Moet ik een Guillemot 3D Prophet of Creative Labs Annihilator Pro kopen?
Mijn bedoeling met dit artikel is niet om de 3D Prophet en Annihilator Pro direkt op prestaties met elkaar te vergelijken. De Annihilator Pro is duidelijk sneller en duidelijker duurder, dat was te voorspellen.
De Guillemot 3D Prophet is een uitstekend voorbeeld van een GeForce SDR kaart. Wat mij ten opzichte van de Annihilator Pro vooral opviel was de scherpere beeldweergave. Ik heb geen idee of dit een exemplarisch probleem (van de Annihilator Pro) is. Ik wil hier daarom geen harde uitspraken over doen, ik kan alleen zeggen dat het verschil bij mij duidelijk aanwezig was (en het viel me telkens op bij het switchen tussen beide kaarten).
De 3D Prophet is niet de goedkoopste GeForce, maar je krijgt er wel een TV-out en goede driver ondersteuning bij (Guillemot had een paar week geleden al up-to-date 3.62 drivers, terwijl Creative Labs nu pas met 3.53 drivers komt). Uiteraard kun je ook altijd de nieuwste nVidia reference drivers gebruiken.
De Creative Labs Annihilator Pro is op zijn beurt een uitstekend voorbeeld van een GeForce DDR en is op dit moment bovendien één van de weinige GeForce DDR kaarten die goed verkrijgbaar is in Nederland. Guillemot heeft trouwens ook een DDR versie: de Hercules 3D Prophet DDR-DVI zal sommigen alleen al vanwege de merknaam tot de verbeelding spreken. Bij Hercules waren ze goed bezig totdat ze over de kop gingen, hopelijk weet Guillemot deze traditie voort te zetten.
Voor beide kaarten dit keer geen rating in procenten: k i c k a s s !
Voor actuele prijzen van de hier geteste kaarten kun je terecht in de Tweakers.net Pricewatch:
Guillemot 3D Prophet (FL 598,-)
Hercules 3D Prophet DDR-DVI OEM (FL 646,-)
Creative Labs Annihilator (FL 519,-)
Creative Labs Annihilator Pro (FL 652,-)
(Bovenstaande prijzen zijn van 27 december 1999). Gebruik de Review Database voor een overzicht van meer 3D Prophet en Annihilator Pro reviews.