Hoofdcategorieën
Device Settings

Larrabee: op het kruispunt van gpu en cpu

Door Wouter Tinus, donderdag 14 augustus 2008 11:40, views: 67.424

Larrabee

Intel heeft nog geen concrete details bekendgemaakt over specifieke implementaties van Larrabee, maar duidelijk is wel dat chips met 8 tot en met 64 cores tot de mogelijkheden behoren. Men zal op basis van de yields en prestaties van de samples een afweging moeten maken over concrete producten voor verschillende doelgroepen, maar daar is het op dit moment mogelijk nog te vroeg voor. Intel heeft het vooralsnog alleen maar over simulaties gehad.

Binnen een chip worden tot 16 cores en andere onderdelen aan elkaar geknoopt door een 1024 bit brede ringbaan, waarbij de helft linksom gaat en de andere helft rechtsom. Naast de cores zelf kunnen ook andere zaken op de bus worden aangesloten, zoals gddr-geheugencontrollers, een pci-express-interface, Quickpath of eenheden met een bijzondere functie, zoals een video-encoder. Versies van Larrabee met meer dan 16 cores zullen meerdere ringen gebruiken die elkaar kruisen aan de randen.

Intel Larrabee-architectuur
Een van de weinige grafische functies die de Larrabee-core uitbesteedt aan een stuk vaste hardware is het filteren van textures. Intel heeft berekend dat dit afhankelijk van de compressie 12 tot 40 keer trager zou lopen op een x86-core, waardoor de keuze voor een vast stuk hardware snel gemaakt was.

Vrijwel alle andere stappen van het renderen houdt Intel echter op softwareniveau. Dit gaat tot op zekere hoogte ten koste van de efficiëntie, maar het heeft ook zijn voordelen. Zo kan er geen sprake zijn van een specifieke bottleneck in de chip: hij is snel genoeg of niet, maar het zal niet voorkomen dat een traag onderdeel de rest tegenhoudt.

Verder geeft een software-implementatie veel flexibiliteit. Er is een redelijk goede kans dat Larrabee alleen een nieuwe driver nodig heeft om bijvoorbeeld Directx 11 of 12 aan te kunnen. Dit terwijl een gpu vaak blijft steken op een oudere versie omdat er net een feature aangepast moet worden die hard in de hardware zit gebakken.

Tot slot draagt Intel aan dat eenheden met vaste functies een blok aan het been van de schaalbaarheid kunnen vormen. De fabrikant heeft overwogen om ook het rasteren efficiënter te maken door het in hardware te implementeren, maar de synchronisatie en coördinatie die daarbij komt kijken zouden het lastig maken om naar grote aantallen cores te schalen. Vandaar dat ze wat inefficiëntie in deze stap voor lief nemen en dit deels compenseren met nieuwe instructies.

F.E.A.R. rendertijd uitgesplitst
De hoeveelheid rekenkracht die nodig is voor verschillende stappen van het renderen verschilt van frame tot frame. Tussen verschillende spellen zijn de verschillen nog groter. Intel redeneert dat flexibele hardware die aan het hele proces kan meewerken beter is dan een vastgebakken stuk dat een onderdeel afhandelt, zelfs wanneer laatstgenoemde tot op zekere hoogte efficiënter werkt.

Volgende pagina (Software en schaalbaarheid - 4/5)


Inhoudsopgave

VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011