Lijkt mij een voorbijgaande zaak...
Juist niet. GPUs worden steeds flexibeler. En er zijn al sterke geruchten dat Microsoft met DirectX 11 een physics API wil voorzien, die zowel op de CPU, GPU als PPU geïmplementeerd kan worden. NVIDIA en ATI hoeven niet veel meer aan de GPU te veranderen om de PPU van de kaart te vegen, als dat al nodig was.
De PPU kan meer interactie aan, en koppelt dat ook aan meer (effectieve) rekenkracht. De PPU is immers nog altijd een massief parallelle processor, waar de CPU bijna compleet lineair is.
Als de PPU inderdaad met local storage werkt is het juist moeilijker om interactie te hebben, net zoals Cell. En daarbij lijkt het ook veel op een GPU, waarbij resultaten pas een tijdje later bij een andere pijplijn/core terecht kunnen komen. De CPU daarentegen is de eenvoudigste van al door het volledig gedeelde geheugen en de lineariteit.
Dat zegt natuurlijk niks. Hogere kloksnelheid houdt niet automatisch in dat hij z'n berekeningen ook daadwerkelijk sneller uitvoert.
Zo hebben bv videokaarten ook minder klokcycli nodig dan CPUs voor matrix/vector berekeningen, omdat hun instructieset en implementatie daar specifieker voor ingericht is, dus winnen ze daar weer terug op hun 'gebrek' aan kloksnelheid.
Inderdaad, en de CPU wint van de PPU terug op z'n paralleliteit via z'n kloksnelheid. Het werkt in beide richtingen he. Zoals ik dus zei, een CPU hoeft het parallelisme van de PPU niet dankzij z'n 10x hogere kloksnelheid. De specificatie van AGEIA voor het aantal sphere collision tests toont duidelijk aan dat de CPU niet moet onderdoen in rekenkracht. En als dit hetgene is waar de PPU het best in is, is het maar zielig gesteld en kan ik me alleen voorstellen welke horror ze hebben uitgehaald met de softwareversie.
Behalve dan dat deze cores heel inefficient met elkaar kunnen communiceren, in verhouding met de units in een PPU.
Onzin, data kan heel snel via de L2 cache uitgewisseld worden. Bovendien beschikt de CPU over out-of-order execution en speculatieve loads die de latentie verbergen. De PPU heeft, afgaand op het patent, lokaal geheugen per VPU, en geheugen in een MCU voor een groepje VPUs. Het diagram duidt ze zelfs aan met L1 en L2. Tussen MCUs wordt data uitgewisseld via een DME, die gecontroleerd wordt door de PCU. Er wordt met geen woord gesproken over snooping of iets dergelijks, dus het zaakje zal slechts gesynchroniseerd worden wanneer de taak uitgevoerd is (zoals Cell). Da's heel wat minder efficiënt communiceren dan CPU cores.
Het verschil tussen een dualcore en quadcore-processor is groter, veel groter.
Ik heb een Athlon 64 X2 gekocht toen die nog 500 ¤ kostte, nu heb je dezelfde voor 100 ¤. Hetzelfde zal gebeuren met quad-core. Reken dan nog eens mee dat een CPU veel meer doet dan alleen physics voor een spel (en dan nog alleen deze die van PhysX gebruik maken), en het loont al snel de moeite om op quad-core over te gaan wanneer AMD en Intel daar hun strijd voortzetten.
Daarom vind ik het nogal vreemd te rijmen met jouw constante betoog dat de CPU het beter kan.
Minstens goed genoeg om geen 170 ¤ investering te moeten doen om van alle mogelijkheden van een spel te genieten. Een GPU kan het echter op vlak van eye-candy physics wel significant beter. NVIDIA toont al een tijdje het goede voorbeeld, met meer dan voldoende interactiviteit. Daar is een 170 ¤ investering veel meer waard dan een PhysX kaart.
Ik denk dat de PPU een veel betere prijs/prestatie-verhouding heeft dan de CPU op het gebied van physics.
Op dit moment, louter voor physics, alleen voor Cellfactor, ten opzichte van de CPU, wel ja. Maar dan kijk je niet naar de toekomstige waarde van zo'n investering ten opzichte van de andere mogelijkheden.
Cellfactor is duidelijk ontworpen om AGEIA op artificiële wijze een exclusieve voorsprong te geven. Wanneer de nieuwe generatie DirectX 10 spellen verschijnen die gebruik maken van een combinatie van de CPU en GPU voor physics, zoals Crysis, zal duidelijk worden dat een PPU een nutteloze aankoop is.