Vandaag heeft ATi zijn eerste generatie DirectX 10-videokaarten, de Radeon HD 2000-familie, officieel geïntroduceerd. Tweakers.net kreeg voor de lancering de kans om de Radeon HD 2900 XT-videokaart aan de tand te voelen. Onze bevindingen vind je in deze review.Voordat we dieper zullen ingaan op de architectuur van de videokaart eerst een overzicht van Radeon HD 2000-familie. Naast de Radeon HD 2900 XT introduceert ATi tegelijkertijd modellen voor gebruikers met een kleinere portemonnee en voor notebooks. De Radeon HD 2900 XT wordt voorlopig het topmodel van de familie, maar qua prijs concurreert de videokaart niet met de top uit de nVidia-stal. De kaart heeft een adviesprijs van 399 dollar hetgeen omgerekend naar euro’s en rekeninghoudend met btw overeenkomt met circa 350 euro. Hiermee concurreert de kaart qua prijs direct met de 640MB-variant van de GeForce 8800 GTS. Een XTX-versie die de strijd met de GeForce 8800 GTX of GeForce 8800 Ultra aan moet gaan zal waarschijnlijk nog geïntroduceerd worden, maar deze kaart heeft ATi nog niet officieel aangekondigd en het zal nog wel enkele maanden duren alvorens deze verschijnt.
| ATi Radeon | HD 2400 Pro | HD 2400 XT | HD 2600 Pro | HD 2600 XT | HD 2900 XT |
|---|---|---|---|---|---|
| Stream processing units | 40 | 120 | 320 | ||
| Kloksnelheid | 525MHz | 700MHz | 600MHz | 800MHz | 742MHz |
| Multiply-Add-rate | 42GFlops | 56GFlops | 144GFlops | 192GFlops | 475GFlops |
| Pixel processing rate | 4,2 Gpixels/s | 5,6 Gpixels/s | 14,4Gpixels/s | 19,2Gpixels/s | 47,5Gpixels/s |
| Triangle processing rate | 262 Mtri/s | 350 Mtri/s | 600Mtri/s | 800Mtri/s | 742Mtri/s |
| Texture units | 4 | 8 | 16 | ||
| Render Back-Ends | 4 | 4 | 16 | ||
| Geheugencapaciteit | 256MB gddr3 128/256MB gddr2 | 256MB gddr4 256MB gddr3 256MB gddr2 | 512MB gddr3 | ||
| Geheugeninterface | 64bit | 128bit | 512bit | ||
| Geheugenklok | 400MHz | 800MHz | 400MHz | 1100MHz | 828MHz |
| Geheugenbandbreedte | 6,4GB/s | 12,8GB/s | 12,8GB/s | 35,2GB/s | 106GB/s |
| Transistors | 180 miljoen | 390 miljoen | 700 miljoen | ||
| Procestechnologie | 65G+ | 65G+ | 80HS | ||
| Aansluitingen | vga dvi tv-out incl. hdmi-adaptor | 2x dvi tv-out incl. hdmi-adaptor | 2x dvi /w hdcp tv-out incl. hdmi-adaptor | ||
| Leverbaar per | 1 juni | 14 mei | |||
Voor de desktop komt ATi initieel met vijf verschillende videokaarten. Voor de onderkant van de markt, het sub-100$-segment, heeft ATi de Radeon HD 2400-serie. De middenmoot wordt gevormd door de Radeon HD 2600-serie die het segment tussen de 99 en 199 dollar moet opvullen en de bovenkant van de markt wordt bediend met de Radeon HD 2900 XT. Hiermee zet ATi direct bij de lancering al een redelijk uitgebreide familie DirectX 10-videokaarten neer: nVidia had bij de lancering van haar DirectX 10-kaarten alleen twee high-end-modellen, maar daar is ondertussen al verandering in aangebracht. Wat wel opvalt is dat er qua prijs een flink gat zit tussen de HD 2600 en HD 2900 XT, en dat er geen ultra high-end-videokaart in het assortiment zit. De ATi Radeon HD 2900 XT is per direct leverbaar. De overige videokaarten zullen over twee weken, op de eerste van juni, in de winkelschappen verschijnen.
| ATi Mobility Radeon | HD 2300 | HD 2400 | HD 2400 XT | HD 2600 | HD 2600 XT |
|---|---|---|---|---|---|
| Segment | Entry Level | Mainstream Thin & Light | Mainstream Thin & Light | Performance Thin | Gaming Enthusiast |
| Kloksnelheid | 450-480MHz | 350-450MHz | 500-600MHz | 400-500MHz | 600-700MHz |
| Geheugenklok | 400-550MHz | 400-500MHz | 600-700MHz | 550-600MHz | 700-750MHz |
| Proces | 90nm | 65nm | 65nm | 65nm | 65nm |
| DirectX-versie | DX9.0c | DX10 | DX10 | DX10 | DX10 |
| UVD | yes | yes | yes | yes | yes |
| PowerPlay-versie | 6.0 | 7.0 | 7.0 | 7.0 | 7.0 |
| Geheugeninterface | 64/128bit | 64bit | 64bit | 64/128bit | 64/128bit |
| Leverbaar per | mei/juni | juli | juli | juli | juli |
Ook voor het mobiele segment komt ATi met vijf nieuwe videokaarten. Het goedkoopste model is de Mobility Radeon HD 2300 en het topmodel is de Mobility HD 2600 XT. De Mobility Radeon HD 2300 is ontworpen voor notebooks met een prijs tussen de 799 en 999 dollar, de Mobility Radeon HD 2400-serie is voor notebooks met een prijs tussen de 999 en 1199 dollar en voor notebooks met een prijs boven de 1199 dollar is de Mobility Radeon HD 2600-serie. Het opnemen van de Mobility HD 2300 in de productfamilie is enigszins misleidend. Deze kaart heeft wel de ‘Unified Video Decoder’, maar zoals ook te zien is in bovenstaande tabel is het geen DirectX 10-chip. Voor DirectX 10 is de Radeon HD 2400-serie of beter nodig. Verwacht wordt dat de eerste notebooks met de Mobility Radeon HD 2300 in mei of juni op de markt zullen verschijnen terwijl de eerste notebooks met de Mobility Radeon HD 2400 of 2600 in juli zullen verschijnen.

De voor- en achterkant van de Jetway Radeon HD 2900 XT
De R600-architectuur
De R600-architectuur kenmerkt zich door het gebruik van unified shaders, een brede 512bit-geheugenbus en een enorm parallellisme. De Radeon HD 2900 XT is in het bezit van maar liefst 320 ‘stream processing units’ die zowel vertex-, pixel- als geometry-shaders kunnen verwerken. Hiermee kiest ATi voor een andere weg dan nVidia. Ook de nVidia GeForce 8x00-serie maakt gebruik van unified shaders, maar het topmodel heeft er ‘slechts’ 128. Het verschil is dat de shaders van ATi op dezelfde kloksnelheid lopen als de rest van de chip (742MHz) terwijl nVidia de shaders veel hoger klokt. Een ander belangrijk verschil in architectuur is het gebruik van een 512bit-geheugenbus terwijl nVidia niet verder komt dan 384bit bij de GeForce 8800 GTX.

De R600 is de tweede chip van ATi die gebruik maakt van unified shaders. De Xenos die gebruikt wordt in de Xbox 360 maakt ook al van deze techniek gebruik, maar ten opzichte van deze chip is er in de R600 veel verbeterd. De gpu ondersteunt DirectX 10 volledig, de command processor is verbeterd om efficiënter kleine opdrachten te kunnen verwerken, de dispatch processor kan latency beter verbergen en de stream processing units zijn gerangschikt als 5-way superscalar shaderprocessors. Wat dit precies inhoudt en wat dit betekent voor de prestaties van de gpu zullen we in de volgende secties behandelen.
ATi heeft een enorm aantal shaderprocessors geïntegreerd in de R600. Er zijn 320 shaderprocessors aanwezig die allemaal vertex-, pixel- en geometry-shaders kunnen verwerken. Om dit enorme aantal te bereiken heeft ATi een belangrijke concessie gedaan: de shader-processors zijn gerangschikt in groepen van vijf waarbij slechts één shaderprocessor alle functionaliteit bezit. Alle shaderprocessors kunnen 32-bit floatingpoint getallen vermenigvuldigen en optellen, maar de ingewikkelde operaties zoals SIN, COS, LOG en EXP zijn voorbehouden aan de dikke processor. Deze operaties worden relatief weinig gebruikt waardoor het geen probleem is dat 80 procent van de processors deze niet kunnen uitvoeren.

Een uitdaging bij een dergelijke grote hoeveelheid processors die tegelijkertijd kunnen werken is om alle processors aan het werk te houden. De ‘Ultra-Threaded Dispatch Processor’ heeft de taak om iedereen aan het werk te houden. De dispatchprocessor heeft verschillende queues met werk die naar een shaderprocessor gestuurd worden zodra deze niks te doen heeft. Wanneer een programma dat draait op een shaderprocessor moet wachten, bijvoorbeeld voor het ophalen van een texture uit een geheugen, wordt deze direct in de command queue gezet en wordt een ander programma gestart. Het eerste programma gaat weer verder met de uitvoering zodra de texture geladen is in het lokale geheugen en de dispatchprocessor het groene licht geeft. De dispatchprocessor kan honderden threads tegelijkertijd in de queues hebben waardoor de shaderprocessors altijd aan het werk gezet kunnen worden en latencies voor bijvoorbeeld het benaderen van extern geheugen nauwelijks merkbaar zijn.
Een ander verschil tussen de R600 en de vorige generatie videokaarten van ATi is het gebruik van cachegeheugens. DirectX 10-programma’s kunnen bijna een ongelimiteerde lengte hebben en gebruik maken van veel variabelen waardoor het onmogelijk is om alles altijd lokaal op te slaan. De R600 maakt daarom gebruik van een cache om tijdelijke variabelen te bewaren en zonodig te verplaatsen naar het externe geheugen. Ook bij de texture units zien we een toevoeging: de R600 is de eerste videochip die een L2-cache heeft tussen de texture units en het externe geheugen. De Radeon HD 2900 XT is in het bezit van 256KB L2-cachegeheugen, de Radeon HD 2600-serie is uitgerust met 128KB L2-cachegeheugen en de Radeon HD 2400-serie moet het doen met alleen een L1-cache.
De R600 herbergt vele nieuwe mogelijkheden dankzij de ondersteuning van DirectX 10, maar er zijn meer nieuwe features aanwezig. De belangrijkste features: tessellation, CFAA en UVD zullen we op de volgende pagina’s uitgebreid bespreken. Wat verder het vermelden waard is, is de ondersteuning om op volle snelheid 64bit hdr-textures te kunnen filteren hetgeen circa 7x sneller is dan de Radeon X1000-serie. 128Bit floating point textures kunnen op halve snelheid gefilterd worden. Verder is er een nieuw textureformaat toegevoegd (RGBE 9:9:9:5) voor 32bit hdr-textures, kan er gewerkt worden met textures met een resolutie van 67 megatexel en is de compressie van de Z- en stencil-buffers verbeterd.
Ook worden 'depth stencil textures' met 'percentage closer filtering' ondersteund waardoor de kaart zogenaamde zachte schaduwen snel kan tekenen. Als laatste is PowerPlay 7 het vermelden waard. Deze feature zorgt ervoor dat delen van de chip zover mogelijk worden uitgezet wanneer deze niet gebruikt worden om zo notebookgebruikers langer te kunnen laten werken op één accu. Volgens ATi kan PowerPlay 7 zorgen voor 15 tot 32 minuten extra werktijd met een accu ten opzichte van PowerPlay 6.

De R600 is de tweede chip van ATi die gebruik maakt van unified shaders. De Xenos die gebruikt wordt in de Xbox 360 maakt ook al van deze techniek gebruik, maar ten opzichte van deze chip is er in de R600 veel verbeterd. De gpu ondersteunt DirectX 10 volledig, de command processor is verbeterd om efficiënter kleine opdrachten te kunnen verwerken, de dispatch processor kan latency beter verbergen en de stream processing units zijn gerangschikt als 5-way superscalar shaderprocessors. Wat dit precies inhoudt en wat dit betekent voor de prestaties van de gpu zullen we in de volgende secties behandelen.
ATi heeft een enorm aantal shaderprocessors geïntegreerd in de R600. Er zijn 320 shaderprocessors aanwezig die allemaal vertex-, pixel- en geometry-shaders kunnen verwerken. Om dit enorme aantal te bereiken heeft ATi een belangrijke concessie gedaan: de shader-processors zijn gerangschikt in groepen van vijf waarbij slechts één shaderprocessor alle functionaliteit bezit. Alle shaderprocessors kunnen 32-bit floatingpoint getallen vermenigvuldigen en optellen, maar de ingewikkelde operaties zoals SIN, COS, LOG en EXP zijn voorbehouden aan de dikke processor. Deze operaties worden relatief weinig gebruikt waardoor het geen probleem is dat 80 procent van de processors deze niet kunnen uitvoeren. 
Een uitdaging bij een dergelijke grote hoeveelheid processors die tegelijkertijd kunnen werken is om alle processors aan het werk te houden. De ‘Ultra-Threaded Dispatch Processor’ heeft de taak om iedereen aan het werk te houden. De dispatchprocessor heeft verschillende queues met werk die naar een shaderprocessor gestuurd worden zodra deze niks te doen heeft. Wanneer een programma dat draait op een shaderprocessor moet wachten, bijvoorbeeld voor het ophalen van een texture uit een geheugen, wordt deze direct in de command queue gezet en wordt een ander programma gestart. Het eerste programma gaat weer verder met de uitvoering zodra de texture geladen is in het lokale geheugen en de dispatchprocessor het groene licht geeft. De dispatchprocessor kan honderden threads tegelijkertijd in de queues hebben waardoor de shaderprocessors altijd aan het werk gezet kunnen worden en latencies voor bijvoorbeeld het benaderen van extern geheugen nauwelijks merkbaar zijn.
Een ander verschil tussen de R600 en de vorige generatie videokaarten van ATi is het gebruik van cachegeheugens. DirectX 10-programma’s kunnen bijna een ongelimiteerde lengte hebben en gebruik maken van veel variabelen waardoor het onmogelijk is om alles altijd lokaal op te slaan. De R600 maakt daarom gebruik van een cache om tijdelijke variabelen te bewaren en zonodig te verplaatsen naar het externe geheugen. Ook bij de texture units zien we een toevoeging: de R600 is de eerste videochip die een L2-cache heeft tussen de texture units en het externe geheugen. De Radeon HD 2900 XT is in het bezit van 256KB L2-cachegeheugen, de Radeon HD 2600-serie is uitgerust met 128KB L2-cachegeheugen en de Radeon HD 2400-serie moet het doen met alleen een L1-cache.De R600 herbergt vele nieuwe mogelijkheden dankzij de ondersteuning van DirectX 10, maar er zijn meer nieuwe features aanwezig. De belangrijkste features: tessellation, CFAA en UVD zullen we op de volgende pagina’s uitgebreid bespreken. Wat verder het vermelden waard is, is de ondersteuning om op volle snelheid 64bit hdr-textures te kunnen filteren hetgeen circa 7x sneller is dan de Radeon X1000-serie. 128Bit floating point textures kunnen op halve snelheid gefilterd worden. Verder is er een nieuw textureformaat toegevoegd (RGBE 9:9:9:5) voor 32bit hdr-textures, kan er gewerkt worden met textures met een resolutie van 67 megatexel en is de compressie van de Z- en stencil-buffers verbeterd.
Ook worden 'depth stencil textures' met 'percentage closer filtering' ondersteund waardoor de kaart zogenaamde zachte schaduwen snel kan tekenen. Als laatste is PowerPlay 7 het vermelden waard. Deze feature zorgt ervoor dat delen van de chip zover mogelijk worden uitgezet wanneer deze niet gebruikt worden om zo notebookgebruikers langer te kunnen laten werken op één accu. Volgens ATi kan PowerPlay 7 zorgen voor 15 tot 32 minuten extra werktijd met een accu ten opzichte van PowerPlay 6.
Tessellation
Een van de belangrijke features waarmee ATi de Radeon HD 2000-serie wil onderscheiden van de concurrentie is tessellation. Deze feature is overgenomen van de Xenos-gpu die gebruikt wordt in de Xbox 360 en maakt het mogelijk om objecten met veel detail op het scherm te zetten zonder dat alle polygonen van het model individueel opgeslagen moeten worden. Dit maakt het niet alleen mogelijk voor gameontwikkelaars om kleine modellen te gebruiken, doordat de extra polygonen allemaal lokaal op de videokaart aangemaakt worden is dit ook nog eens aanzienlijk sneller.

Bovenstaande illustratie laat goed zien wat mogelijk is met tessellation. De basis is een model met een beperkt aantal polygonen waardoor het gezicht te hoekig is om realistisch te zijn. Met tessellation wordt het aantal polygonen aanzienlijk opgeschroefd en vervolgens wordt er nog meer detail toegevoegd met behulp van displacement mapping. Het toevoegen van extra polygonen is mogelijk omdat van elke polygoon niet alleen beschreven is wat zijn hoekpunten zijn, maar ook aan welke wiskundige vergelijking het oppervlak voldoet (praktisch altijd een soort van kromme). Dit is wat men noemt een hogere orde oppervlak.
Deze oppervlakken worden gebruikt in professionele 3d-tekenprogramma’s en worden vaak gebruikt in computergegenereerde filmbeelden. De tessellation van de R600-serie is flexibel en kan overweg met verschillende soorten hogere orde oppervlakken zoals Bezier, N-Patches, B-Splines, NURBs, NUBs en ‘Loop and Catmull-Clark’ subdivision surfaces. Het gaat te ver voor dit artikel om in te gaan op de verschillende soorten oppervlakken, maar als je geïnteresseerd bent in meer informatie zijn er uitstekende stukken op onder andere Wikipedia te vinden over dit onderwerp.

Het gebruik van tessellation is niet nieuw voor ATi. In 2001 introduceerde het bedrijf al een vorm van tessellation met TruForm, maar deze techniek is nauwelijks gebruikt omdat het niet flexibel was. Met TruForm werden alle oppervlakken simpelweg ronder gemaakt, iets dat vaak niet de bedoeling is. Deze flexibiliteit is er wel bij de Radeon HD 2000-serie en doordat gameontwikkelaars deze feature ook bij de Xbox 360 kunnen gebruiken is het te verwachten dat de verbeterde techniek meer succes zal hebben. Xbox 360-spellen maken er al gebruik van en bij een port naar de pc kan dit simpel meegenomen worden.
Het valt echter te bezien of de techniek direct zal aanslaan. Tessellation is geen onderdeel van de huidige DirectX 10-standaard en aangezien het merendeel van de videokaarten de techniek niet ondersteunt is het voor gameontwikkelaars niet aantrekkelijk om te gebruiken. De nieuwe versie van DirectX gaat de techniek ondersteunen, maar op de korte termijn zal je er als gebruiker weinig mee kunnen. Potentie heeft de techniek wel, zoals de onderstaande slide uit een presentatie van AMD laat zien.


Bovenstaande illustratie laat goed zien wat mogelijk is met tessellation. De basis is een model met een beperkt aantal polygonen waardoor het gezicht te hoekig is om realistisch te zijn. Met tessellation wordt het aantal polygonen aanzienlijk opgeschroefd en vervolgens wordt er nog meer detail toegevoegd met behulp van displacement mapping. Het toevoegen van extra polygonen is mogelijk omdat van elke polygoon niet alleen beschreven is wat zijn hoekpunten zijn, maar ook aan welke wiskundige vergelijking het oppervlak voldoet (praktisch altijd een soort van kromme). Dit is wat men noemt een hogere orde oppervlak.
Deze oppervlakken worden gebruikt in professionele 3d-tekenprogramma’s en worden vaak gebruikt in computergegenereerde filmbeelden. De tessellation van de R600-serie is flexibel en kan overweg met verschillende soorten hogere orde oppervlakken zoals Bezier, N-Patches, B-Splines, NURBs, NUBs en ‘Loop and Catmull-Clark’ subdivision surfaces. Het gaat te ver voor dit artikel om in te gaan op de verschillende soorten oppervlakken, maar als je geïnteresseerd bent in meer informatie zijn er uitstekende stukken op onder andere Wikipedia te vinden over dit onderwerp.

Het gebruik van tessellation is niet nieuw voor ATi. In 2001 introduceerde het bedrijf al een vorm van tessellation met TruForm, maar deze techniek is nauwelijks gebruikt omdat het niet flexibel was. Met TruForm werden alle oppervlakken simpelweg ronder gemaakt, iets dat vaak niet de bedoeling is. Deze flexibiliteit is er wel bij de Radeon HD 2000-serie en doordat gameontwikkelaars deze feature ook bij de Xbox 360 kunnen gebruiken is het te verwachten dat de verbeterde techniek meer succes zal hebben. Xbox 360-spellen maken er al gebruik van en bij een port naar de pc kan dit simpel meegenomen worden.
Het valt echter te bezien of de techniek direct zal aanslaan. Tessellation is geen onderdeel van de huidige DirectX 10-standaard en aangezien het merendeel van de videokaarten de techniek niet ondersteunt is het voor gameontwikkelaars niet aantrekkelijk om te gebruiken. De nieuwe versie van DirectX gaat de techniek ondersteunen, maar op de korte termijn zal je er als gebruiker weinig mee kunnen. Potentie heeft de techniek wel, zoals de onderstaande slide uit een presentatie van AMD laat zien.

CFAA
De tweede unieke feature van de Radeon HD 2000-familie die we belichten is CFAA, oftewel custom filter anti-aliasing. Deze methode belooft een betere kwaliteit dan de huidige technieken en kan in tegenstelling tot tessellation direct in bijna elk spel gebruikt worden.

De huidige anti-aliasing technieken maken gebruik van een simpele boxfilter om de uiteindelijke kleur van een enkele pixel te bepalen. Binnen het oppervlak van een enkele pixel worden enkele samples genomen. Deze samples worden bij elkaar opgeteld en vervolgens gedeeld door het aantal samples waardoor een gemiddelde kleur ontstaat. Bij deze techniek zorgt het toevoegen van meer samples per pixel niet voor een evenredige toename in beeldkwaliteit. Betere prestaties kunnen bereikt worden door ook samples te gebruiken die buiten de pixelgrenzen vallen en de gewichten van de samples in het eindresultaat niet uniform mee te laten wegen.


Met CFAA is het wel mogelijk om samples buiten de pixelgrenzen te gebruiken met non-uniforme gewichten. Hierdoor kunnen bijvoorbeeld bovenstaande filters geïmplementeerd worden. De 12x CFAA narrow tent filter kent het meeste gewicht toe aan samples die uit het centrum van de pixel komen wat resulteert in een scherp beeld. De 16x CFAA wide tent filter kent meer gewicht toe aan samples die buiten het pixelcentrum zijn genomen waardoor dit filter beter in staat is om ‘kartels’ te verwijderen, maar dit gaat ten koste van de scherpte. Doordat verschillende soorten filters geïmplementeerd kunnen worden kan de gebruiker kiezen wat belangrijker is: een scherper beeld of minder kartelige objecten.
Een ander type filter die ATi beschikbaar maakt met CFAA is een filter dat kijkt of een bepaalde pixel randen van polygonen bevat en daarmee bepaalt hoeveel samples er genomen moeten worden. Wanneer een rand gedetecteerd wordt dan worden meer samples genomen in de richting van de rand terwijl een pixel zonder randen gefilterd wordt met minder samples en een simpele boxfilter. Deze methode zorgt voor een maximale anti-aliasing waar dit het meest nodig is zonder dat de prestaties er onder te lijden hebben. Alle CFAA-filters zijn softwarematig in de driver gedefinieerd. Nieuwe filters kunnen toegevoegd worden door middel van een driverupdate en bestaande filters kunnen geüpdate worden.

De huidige anti-aliasing technieken maken gebruik van een simpele boxfilter om de uiteindelijke kleur van een enkele pixel te bepalen. Binnen het oppervlak van een enkele pixel worden enkele samples genomen. Deze samples worden bij elkaar opgeteld en vervolgens gedeeld door het aantal samples waardoor een gemiddelde kleur ontstaat. Bij deze techniek zorgt het toevoegen van meer samples per pixel niet voor een evenredige toename in beeldkwaliteit. Betere prestaties kunnen bereikt worden door ook samples te gebruiken die buiten de pixelgrenzen vallen en de gewichten van de samples in het eindresultaat niet uniform mee te laten wegen.


Met CFAA is het wel mogelijk om samples buiten de pixelgrenzen te gebruiken met non-uniforme gewichten. Hierdoor kunnen bijvoorbeeld bovenstaande filters geïmplementeerd worden. De 12x CFAA narrow tent filter kent het meeste gewicht toe aan samples die uit het centrum van de pixel komen wat resulteert in een scherp beeld. De 16x CFAA wide tent filter kent meer gewicht toe aan samples die buiten het pixelcentrum zijn genomen waardoor dit filter beter in staat is om ‘kartels’ te verwijderen, maar dit gaat ten koste van de scherpte. Doordat verschillende soorten filters geïmplementeerd kunnen worden kan de gebruiker kiezen wat belangrijker is: een scherper beeld of minder kartelige objecten.
Een ander type filter die ATi beschikbaar maakt met CFAA is een filter dat kijkt of een bepaalde pixel randen van polygonen bevat en daarmee bepaalt hoeveel samples er genomen moeten worden. Wanneer een rand gedetecteerd wordt dan worden meer samples genomen in de richting van de rand terwijl een pixel zonder randen gefilterd wordt met minder samples en een simpele boxfilter. Deze methode zorgt voor een maximale anti-aliasing waar dit het meest nodig is zonder dat de prestaties er onder te lijden hebben. Alle CFAA-filters zijn softwarematig in de driver gedefinieerd. Nieuwe filters kunnen toegevoegd worden door middel van een driverupdate en bestaande filters kunnen geüpdate worden.
UVD
De laatste belangrijke feature die we apart zullen bespreken is de universal video decoder. De huidige generatie videokaarten is in staat om het weergeven van high-definition video’s te versnellen. Met de Radeon HD 2000-serie gaat ATi een stap verder. In de R600-chip zit een speciaal stukje hardware dat het decoderen van de video voor zijn rekening neemt waardoor de processor en de videokaart niet zwaar belast worden. Hierdoor is het mogelijk om 1080p hd-media te kijken op een systeem met een budgetprocessor en wordt de accu niet zo snel leeg geslurpt wanneer een notebook hd-media afspeelt.

De UVD is in staat om beeldmateriaal dat gecodeerd is met vc-1 of h.264 te ontcijferen. Het belangrijkste component van de bovenstaande pipeline is de entropy decode. Dit gedeelte wordt bij de huidige generatie videokaarten door de cpu gedaan en is erg rekenintensief. Zeker bij het gebruik van de geavanceerdere Cabac-compressie moet de processor hard werken: bij een 2,8GHz Pentium 4 neemt alleen deze stap 47,8 procent van de rekentijd in beslag bij een film met een bitrate van 40Mbps. Door deze stap in hardware te doen kan er een aanzienlijke winst geboekt worden.
Een Core 2 Duo-systeem met een 2,0GHz-processor heeft ruim 80 procent van de cpu-cycles nodig voor het weergeven van een 1080p hd-dvd. Wanneer de processor wordt geassisteerd door een Radeon X1000-gpu zakt de belasting naar circa 65 procent, maar de echte winst wordt pas gemaakt door de UVD. Wanneer deze wordt gebruikt heeft de processor net iets meer dan tien procent van de cpu-cycles nodig waardoor een aanzienlijke energiebesparing gemaakt kan worden. Volgens ATi zakt het opgenomen vermogen van de Core 2 Duo-notebook van 52 watt naar 37 watt, een besparing van 40 procent.
Het efficiënt afhandelen van high-definition video is niet de enige eigenschap die vooral de goedkope kaarten uit de Radeon HD 2000-familie geschikt maakt voor htpc’s. Alle kaarten zijn standaard uitgerust met tenminste één dvi-aansluiting die door middel van een verloopstukje omgetoverd kan worden tot een hdmi-aansluiting. Deze aansluiting kan gebruikt worden om beveiligde films met hdcp af te spelen. De hdcp-encryptiesleutels zijn ingebakken in de R600-chip en niet zoals bij de huidige generatie videokaarten in een externe CryptoRom. Hierdoor is de hdcp-ondersteuning niet afhankelijk van de videokaartproducent. De hdmi-aansluiting kan naast beeld ook audio versturen. Om dit mogelijk te maken is een audiocontroller ingebakken in de chip die via de pci-express-bus de audiodata van de geluidskaart kan doorsturen naar de hdmi-aansluiting.


De UVD is in staat om beeldmateriaal dat gecodeerd is met vc-1 of h.264 te ontcijferen. Het belangrijkste component van de bovenstaande pipeline is de entropy decode. Dit gedeelte wordt bij de huidige generatie videokaarten door de cpu gedaan en is erg rekenintensief. Zeker bij het gebruik van de geavanceerdere Cabac-compressie moet de processor hard werken: bij een 2,8GHz Pentium 4 neemt alleen deze stap 47,8 procent van de rekentijd in beslag bij een film met een bitrate van 40Mbps. Door deze stap in hardware te doen kan er een aanzienlijke winst geboekt worden.
Een Core 2 Duo-systeem met een 2,0GHz-processor heeft ruim 80 procent van de cpu-cycles nodig voor het weergeven van een 1080p hd-dvd. Wanneer de processor wordt geassisteerd door een Radeon X1000-gpu zakt de belasting naar circa 65 procent, maar de echte winst wordt pas gemaakt door de UVD. Wanneer deze wordt gebruikt heeft de processor net iets meer dan tien procent van de cpu-cycles nodig waardoor een aanzienlijke energiebesparing gemaakt kan worden. Volgens ATi zakt het opgenomen vermogen van de Core 2 Duo-notebook van 52 watt naar 37 watt, een besparing van 40 procent.
Het efficiënt afhandelen van high-definition video is niet de enige eigenschap die vooral de goedkope kaarten uit de Radeon HD 2000-familie geschikt maakt voor htpc’s. Alle kaarten zijn standaard uitgerust met tenminste één dvi-aansluiting die door middel van een verloopstukje omgetoverd kan worden tot een hdmi-aansluiting. Deze aansluiting kan gebruikt worden om beveiligde films met hdcp af te spelen. De hdcp-encryptiesleutels zijn ingebakken in de R600-chip en niet zoals bij de huidige generatie videokaarten in een externe CryptoRom. Hierdoor is de hdcp-ondersteuning niet afhankelijk van de videokaartproducent. De hdmi-aansluiting kan naast beeld ook audio versturen. Om dit mogelijk te maken is een audiocontroller ingebakken in de chip die via de pci-express-bus de audiodata van de geluidskaart kan doorsturen naar de hdmi-aansluiting.

Benchmarks
We hebben van Jetway een Radeon HD 2900 XT gekregen die we getest hebben met behulp van onze VideoMark 2007-testmethodiek. De geteste games zijn Battlefield 2142, Call of Duty 2, Company of Heroes en The Elder Scrolls IV: Oblivion. De prestaties van de kaart hebben we getest op 1680x1050 met 4x anti-aliasing en voor de liefhebbers zijn er ook resultaten van 1280x1024 zonder anti-aliasing en 1024x768 met 4x anti-aliasing in de Tweakers.net Benchmark Database te vinden. Omdat we pas recentelijk de VideoMark 2007-benchmarkset hebben samengesteld is de hoeveelheid vergelijkingsmateriaal helaas beperkt. We hebben de Radeon HD 2900 XT vergeleken met de onlangs geteste Sparkle Calibre GeForce 8800 GTX en de Sparkle GeForce 8800 GTS 320MB. Tevens hebben we het high-end-model van de ATi's vorige generatie meegenomen in de vergelijking. De door ons geteste Jetway X29XTEN512Q Radeon HD 2900 XT-kaart is identiek aan het referentie-ontwerp van ATi, alleen de sticker op de koeler is anders.
Battlefield 2142
De eerste benchmark die we gedraaid hebben is Battlefield 2142. We zien dat de Radeon HD 2900 XT uitstekende prestaties neer weet te zetten: de kaart is bijna even snel als de veel duurdere Sparkle Calibre GeForce 8800 GTX. Vergeleken met de goedkopere GeForce 8800 GTS 320MB wordt een overtuigend verschil neergezet: de Radeon HD 2900 XT is 38 procent sneller. Bij deze benchmarkresultaten moet in het achterhoofd gehouden worden dat de hier geteste GeForce 8800 GTX geen standaard model is: de Sparkle Calibre GeForce 8800 GTX is standaard een krappe 10 procent overgeklokt.
Call of Duty 2
In Call of Duty 2 presteert de Radeon HD 2900 XT minder goed. De Sparkle Calibre GeForce 8800 GTX is maar liefst 45 procent sneller dan de Radeon HD 2900 XT en zelfs de Radeon 1950 XTX zet een hogere framerate neer. Daar staat wel tegenover dat de kaart wel veel en veel sneller is dan de GeForce 8800 GTS 320MB, maar liefst 116 procent. Waarschijnlijk speelt de lage geheugencapaciteit van de GeForce 8800 GTS 320MB hier een rol in.
Company of Heroes
In Company of Heroes presteert de Radeon HD 2900 XT niet onaardig, maar ook niet uitzonderlijk. De Sparkle Calibre GeForce 8800 GTX is 25 procent sneller dan de Radeon HD 2900 XT die op zijn beurt weer 40 procent sneller is dan de GeForce 8800 GTS 320MB. Vergeleken met ATi’s topmodel van de vorige generatie, de Radeon 1950 XTX, is de Radeon HD 2900 XT bijna tweemaal zo snel.
The Elder Scrolls IV: Oblivion
De laatste benchmark laat een vergelijkbaar beeld zien, maar met minder verschillen tussen de scores. De Sparkle Calibre GeForce 8800 GTX is 11 procent sneller dan de Radeon HD 2900 XT en de Radeon HD 2900 XT is 19 procent sneller dan de GeForce 8800 GTS 320MB.
| Battlefield 2142 - 1680x1050 - 4x AA | ||
|---|---|---|
| GPU | VRAM | Score (fps) |
| nVidia GeForce 8800 GTX | 768MB | |
| ATi Radeon 2900 XT | 512MB | |
| nVidia GeForce 8800 GTS | 320MB | |
| ATi Radeon 1950 XTX | 512MB | |
De eerste benchmark die we gedraaid hebben is Battlefield 2142. We zien dat de Radeon HD 2900 XT uitstekende prestaties neer weet te zetten: de kaart is bijna even snel als de veel duurdere Sparkle Calibre GeForce 8800 GTX. Vergeleken met de goedkopere GeForce 8800 GTS 320MB wordt een overtuigend verschil neergezet: de Radeon HD 2900 XT is 38 procent sneller. Bij deze benchmarkresultaten moet in het achterhoofd gehouden worden dat de hier geteste GeForce 8800 GTX geen standaard model is: de Sparkle Calibre GeForce 8800 GTX is standaard een krappe 10 procent overgeklokt.
| Call of Duty 2 - 1680x1050 - 4x AA | ||
|---|---|---|
| GPU | VRAM | Score (fps) |
| nVidia GeForce 8800 GTX | 768MB | |
| ATi Radeon 1950 XTX | 512MB | |
| ATi Radeon 2900 XT | 512MB | |
| nVidia GeForce 8800 GTS | 320MB | |
In Call of Duty 2 presteert de Radeon HD 2900 XT minder goed. De Sparkle Calibre GeForce 8800 GTX is maar liefst 45 procent sneller dan de Radeon HD 2900 XT en zelfs de Radeon 1950 XTX zet een hogere framerate neer. Daar staat wel tegenover dat de kaart wel veel en veel sneller is dan de GeForce 8800 GTS 320MB, maar liefst 116 procent. Waarschijnlijk speelt de lage geheugencapaciteit van de GeForce 8800 GTS 320MB hier een rol in.
| Company of Heroes - 1680x1050 - 4x AA | ||
|---|---|---|
| GPU | VRAM | Score (fps) |
| nVidia GeForce 8800 GTX | 768MB | |
| ATi Radeon 2900 XT | 512MB | |
| nVidia GeForce 8800 GTS | 320MB | |
| ATi Radeon 1950 XTX | 512MB | |
In Company of Heroes presteert de Radeon HD 2900 XT niet onaardig, maar ook niet uitzonderlijk. De Sparkle Calibre GeForce 8800 GTX is 25 procent sneller dan de Radeon HD 2900 XT die op zijn beurt weer 40 procent sneller is dan de GeForce 8800 GTS 320MB. Vergeleken met ATi’s topmodel van de vorige generatie, de Radeon 1950 XTX, is de Radeon HD 2900 XT bijna tweemaal zo snel.
| The Elder Scrolls IV: Oblivion - 1680x1050 - No AA | ||
|---|---|---|
| GPU | VRAM | Score (fps) |
| nVidia GeForce 8800 GTX | 768MB | |
| ATi Radeon 2900 XT | 512MB | |
| nVidia GeForce 8800 GTS | 320MB | |
| ATi Radeon 1950 XTX | 512MB | |
De laatste benchmark laat een vergelijkbaar beeld zien, maar met minder verschillen tussen de scores. De Sparkle Calibre GeForce 8800 GTX is 11 procent sneller dan de Radeon HD 2900 XT en de Radeon HD 2900 XT is 19 procent sneller dan de GeForce 8800 GTS 320MB.
Conclusie
Zoals de benchmarks laten zien is ATi er met de Radeon HD 2900 XT er niet in geslaagd om nVidia de prestatiekroon te ontnemen. De beste prestaties worden geleverd door de al zes maanden geleden geïntroduceerde GeForce 8800 GTX of de onlangs geïntroduceerde GeForce 8800 Ultra. ATi heeft echter goed begrepen dat de prestaties slechts één onderdeel van de vergelijking zijn, de prijs is minstens zo belangrijk. Met een prijs van circa 350 euro is de kaart aanzienlijk goedkoper dan de topmodellen van nVidia en wordt er voornamelijk geconcurreerd met de ongeveer 270 euro kostende GeForce 8800 GTS 320MB en de 330 euro kostende GeForce 8800 GTS 640MB. Hierbij moet opgemerkt worden dat de twee GeForce 8800 GTS-varianten ongeveer gelijkwaardig presteren: alleen op hoge resoluties telt de hogere geheugencapaciteit mee.
Vergeleken met deze videokaarten komt de Radeon HD 2900 XT goed uit de vergelijking. Als je op zoek bent naar een goede videokaart in het 300 à 400 euro prijssegment is de Radeon HD 2900 XT momenteel de beste oplossing. De kaart is niet alleen het snelste, maar biedt ook enkele extra features zoals de universal video decoder, hdmi, cfaa en tessellation. Vooral voor de goedkopere leden van de Radeon HD 2000-familie en de Mobile-varianten is de universal video decoder een pre. Het is ideaal voor een htpc en de accubesparing die mogelijk is bij het kijken van een hd-film is niet gering. ATi heeft een interessante serie videokaarten op de markt gezet met de Radeon HD 2000-serie, maar het is jammer dat een high-end Radeon HD 2900 XTX-model ontbreekt.

Dankwoord: Met dank aan Dollarshops voor het leveren van de Jetway Radeon HD 2900 XT.
Vergeleken met deze videokaarten komt de Radeon HD 2900 XT goed uit de vergelijking. Als je op zoek bent naar een goede videokaart in het 300 à 400 euro prijssegment is de Radeon HD 2900 XT momenteel de beste oplossing. De kaart is niet alleen het snelste, maar biedt ook enkele extra features zoals de universal video decoder, hdmi, cfaa en tessellation. Vooral voor de goedkopere leden van de Radeon HD 2000-familie en de Mobile-varianten is de universal video decoder een pre. Het is ideaal voor een htpc en de accubesparing die mogelijk is bij het kijken van een hd-film is niet gering. ATi heeft een interessante serie videokaarten op de markt gezet met de Radeon HD 2000-serie, maar het is jammer dat een high-end Radeon HD 2900 XTX-model ontbreekt.

Dankwoord: Met dank aan Dollarshops voor het leveren van de Jetway Radeon HD 2900 XT.