Hoofdcategorieën

Gratis Cellfactor-versie moet Ageia populairder maken

Door Dimitri Reijerman, woensdag 11 april 2007 13:57
Bron: The Inquirer, views: 39.054

Ageia zal het spel Cellfactor: Revolution vanaf 8 mei gratis ter download aanbieden. De producent van de physics-accelerator PhysX hoopt met de weggeefactie zijn hardware beter onder de aandacht van de gaminggemeenschap te krijgen.

Hoewel de first person shooter ook zonder PhysX-kaart draait, leunt het spel van Artificial Studios en Immersion Games zwaar op de Ageia-hardware. Cellfactor: Revolution zou met de bijbehorende hardware volgens de makers levensechte physics kennen, waardoor effecten als golvend water, wapperende stoffen en instortende gebouwen overtuigender op de speler moeten overkomen. De mogelijkheden van de PhysX-hardware worden ook benut om de speler te sturen. Zo kan een trillend spinnenweb een naderende vijand verraden en een lekkend olievat geeft een potentieel gevaar aan. De speler kan ook diverse objecten, waaronder wapens en voertuigen, gelijktijdig manipuleren.

Gamers die een PhysX-kaart in hun pc hebben geprikt, zijn in staat om in vier multiplayer-modi zowel menselijke als computergestuurde tegenstanders te bestrijden. Ageia-lozen moeten het doen met minder levels en uitsluitend door de cpu gecontroleerde vijanden. Wel krijgt de modding-community van de developers gereedschappen aangereikt om zelf nieuwe levels te bouwen, maar of daarmee multiplayer-maps gebouwd kunnen worden, is nog niet bekendgemaakt.

Cellfactor Revolution

Volgende 14:46
Vorige 12:07

Reacties

«  1  2  3  »

Ze hadden al eens een demo vrijgegeven die ik gedraaid heb zonder physX kaart. daarvoor was een exe parameter nodig maar ik kon vervolgens het spel met alle toeters en bellen aan spelen.

vervolgens heb ik op internet benchmarks gezien van het spel met en zonder physx kaart op het zelfde systeem, het scheelde ongeveer 4 fps.

lang leve physX :s

Dus dat betekend dat je dezelfde performance hebt zonder de PhysX-kaart, maar wel met de levensechte physics, die je zonder die kaart niet hebt.

Kaartje doet dan dus blijkbaar goed z'n werk.

Ik weet niet of die levensechte physics een toeter of een bel is, maar hij zegt toch echt "met alle toeters en bellen aan spelen."

Kaartje doet dus blijkbaar vrij weinig, zelfs in een voor die kaart gemaakt spel.

Waarom snapt toch niemand dat die kaart niet alleen is om prestaties qua fps te verbeteren, maar ontzettend veel meer dingen op het scherm tovert?! Dat is met name de meerwaarde, niet het ontlasten van de gpu voor dingen die diezelfde gpu zelf helemaal niet kan laten zien....

Al die toeters die de gewone gpu kan laten zien zijn niet dezelfde dingen die extra op het scherm komen als die Ageia erbij komt. Dat zijn de bellen, waarvoor je dus extra betaalt, en ook veel meer van geniet, meer puin en exploderende zooi op het scherm, daar gaat het om. Uiteraard levert dat dan geen extra fps op, omdat het juist meer kracht kost om deze bellen te laten zien...

Ik snap de denkfout van de meeste lui gewoon niet :D

@Tha Man : "Meer dingen op het scherm toveren"?
Je bedoelt dat als je de kaart niet hebt, je maar een half spel kan spelen, omdat de rest is uitgeschakeld.

Dus het is niet een kwestie van MEER krijgen, maar juist van MINDER krijgen. Geen wonder dat ze de spelletjes gratis moeten maken.

Dit is gewoon een kansloze manier om de kaart te verkopen. Van mij mogen ze best een co-processor verkopen (is amd ook van plan), maar zorg dan dat de spellen ook gewoon werken met alleen een normale CPU.

Waarom snapt toch niemand dat die kaart niet alleen is om prestaties qua fps te verbeteren, maar ontzettend veel meer dingen op het scherm tovert?!
Omdat je ook geen of nauwelijks prestaties verliest wanneer je die toeters en bellen niet op een PPU maar op de CPU of GPU laat berekenen. Indien de software daar tenminste deftig voor geoptimaliseerd is.

Kijk, ik kan een USB-kabeltje knopen rond een dode rat, en dan een spel ontwikkelen dat bij de aanwezigheid van de dode rat veel leuker speelt dan zonder. Betekent dit dat het 150 ¤ kostende knaagdier een goede investering is?

AGEIA verkoopt echte hardware, maar het is niks bijzonders qua ontwerp en de prijs / prestaties van een GPU is veel beter. Voor een multi-core CPU is de verhouding ongeveer hetzelfde, maar je CPU is dan ook nuttig voor veel meer dan physics.

das niet echt helemaal waarheidsgetrouw. Bijvoorbeeld bij ghost recon worden physics in een basic mode gedraaid op een cpu. Als je echter een ppu erbij hebt dan worden explosies veel realistischer met veel meer fragmenten ed.

@Tha Man
Die kaart zorgt ervoor dat die pracht en praal draait met een redelijke FPS -> uiteindelijke doel dus...

@Mister_X:
Nee, jij tuint ook in die denkfout.
Als je die PhysX kaart hebt zie je dingen die je niet ziet zonder. Die extra dingen worden dus niet eens berekend/getoond.

en die iedereen loopt te roepen dat ze de demo ook op hun CPU goed konden draaien hebben alleen de eerste demo gedraait... de grap is ze hebben daar allerlei zooi uit gehaalt... bijvoorbeeld real cloth en fluid control (of hoe ze dat ook maar mogen noemen....)

als je op 1 van de barrels schiet komt er normaalgesproken olie die realistisch wegvloeit uit en daar na explodeert maar zonder die kaar zie je de olie niet. ook zit er in de demo een hele grote (destructable) vlag maar ook zonder de physx hardware zie je die niet.

omdat er zoveel mensen dachten (en blijkbaar nog steeds denken) dat hun cpu dit alles tegelijk kan berekenen hebben ze een 2e demo opgezet waarin de vlag WEL is geimplementeerd. Als je zonder de kaart naar de vlag kijkt en er op schiet enzo dan daalt de FPS van 40 naar 4 (en zelfs nog wel lager) met deze kaart blijft hij op 40 FPS. ook als er grotere explosies plaatsvinden met meer brokstukken enzo zie een enorme dip naar 20fps terwijl je met die kaart gewoon op 40 blijft.

ik weet dit uiteraard omdat ik zo'n kaartje in mijn PC met een Dualcore AMD Opteron 165 (@2,5ghz) en een 7900GTX512MB heb. Omdat ik een dualcore heb heb ik ook even naar het processorgebruik gekeken met de kaart ingeschakeld en zonder, deze is in beide gevallen gelijk en worden gewoon BEIDE cores van mijn processor gebruikt.

ook heeft AGEIA een cellfactor Benchmark opgezet die je laat zien wat voor voordeel de Physxkaart heeft (probleem is voor de vergelijking heb je al wel zo'n kaart nodig) die is vanaf hier te downloaden: http://www.ageia.com/physx/rm.html (378MB)


specs:
AMD Opteron 165 (@2,5GHz)
Asrock 939Dual-SataII
2GB RAM in DC
Geforce 7900GTX 512MB
Soundblaster X-FI XtremeMusic
Asus Physx P1 128MB
Intel Pro/1000GT Desktop Adapter

ook heeft AGEIA een cellfactor Benchmark opgezet die je laat zien wat voor voordeel de Physxkaart heeft (probleem is voor de vergelijking heb je al wel zo'n kaart nodig)
Hét probleem voor de vergelijking is dat het een AGEIA benchmark is voor een AGEIA product. Natuurlijk dat ze alles in het werk stellen om de softwareversie een heel pak trager te laten lopen dat de hardwareversie.

en die iedereen loopt te roepen dat ze de demo ook op hun CPU goed konden draaien hebben alleen de eerste demo gedraait... de grap is ze hebben daar allerlei zooi uit gehaalt... bijvoorbeeld real cloth en fluid control (of hoe ze dat ook maar mogen noemen....)
Ik heb een demo gespeeld met de commandline parameter en dus geheel op CPU. Ik kon genieten van de realtime cloth simulatie en de fluid (wat trouwens niet echt realtime fluid is maar metaparticles, maar dat terzijde). Waarschijnlijk was dit dan inderdaad de tweede demo, maar volgens mij waren het er ook meer dan twee.

Dit deed ik toendertijd op een AMD64@2.6GHz (3700+) i.c.m. 7800GTX en 1GB ram.
Toegegeven dat dit uiteraard minder goed draait dan op jouw systeem, maar ik denk wel dat een dualcore en de goede optimalisaties in het spel de PhysX kaart overbodig maken. Je betaalt nog steeds voornamelijk voor het "unlocken" van effecten die eigenlijk niet veel meer voorstellen dan een gimmick van Ageia. Cellfactor is zover ik weet ook het enige spel dat "echt" wat doet met de PPU.

Verder is er nog ghost recon waar je iets meer particles op je scherm krijgt en de physic simulation op de objecten werkt iets anders. Zo kan uiteindelijk een auto op zijn kop belanden na een explosie waar je dat zonder PPU niet voor elkaar krijgt. (wat met Havok ook makkelijk kan)
Dit resulteert ook nog eens in het scenario waar je door de auto heen kan lopen (in multiplayer) omdat verschillende spelers de auto ergens anders kunnen hebben liggen door verschillende physics berekeningen.

Tevens zag ik met de PPU berekening de auto zo nu en dan weleens door de muur zweven waar dat met de CPU niet gebeurde.

Dan hebben we nog een lijstje aan andere spellen waar de PPU iets zou moeten doen (bijvoorbeeld CoH en CoV) maar in geen geval beinvloed het de gameplay, het zijn alleen maar suffe effectjes waar je in veel gevallen naar op zoek moet gaan om ze te zien en die vooral erg makkelijk te imiteren zijn met conventionele methodes.(GPU/CPU)

nogmaals, lang leve PhysX

Wat simen zegt is dat je met een commandline parameter de geavanceerde physics ook aan kan zetten zonder physics kaart en dat dat maar 4 fps langzamer is als met kaart!

En volgens mij klopt dat toch niet helemaal, ik had ooit een review gelezen oid, en als ik het me goed herinner kan je inderdaad met een commandline parameter de physics gewoon door de cpu laten doen, maar TOCH ontbreken er nogsteeds bepaalde effecten op die manier. Ik meende ook te hebben gelezen dat het 'cloth' werk enkel met de ageia werkt, en als deze door de cpu gedaan moet worden dit extreem veel framerates kost.

Ik ben dus niet helemaal overtuigt dat meneer bovenaan met een simpele commandline ook EXACT de zelfde effecten heeft als MET ageia. Ik denk dat je je vergist, sommige dingen kunnen enkel met de ageia berekent worden, je mist dus altijd iets, en daarmee gaat je statement niet op.

Als ik iets mis, zou ik niet weten wat.

Daarnaast, ik heb gezien wat ageia te bieden heeft in ghost recon, city of heroes en nog wat spellen, maar geen van deze effecten zijn revolutionair of niet te behalen met GPU/CPU.
Daarnaast mogen we in bijna geen van alle gevallen als consumenten zelf ondervinden waar de ageia kaart de prestaties mogelijk maakt, want de effecten zijn in bijna alle gevallen uitgeschakeld voor consumenten zonder ppu.

Het argument dat een PPU geen prestaties verbeterd maar nieuwe effecten mogelijk maakt is onzin, ik heb ieder van de tot nu toe gepresenteerde effecten al gezien op GPU/CPU kracht, daarnaast heb je voor cellfactor ook nog steeds een behoorlijke bak nodig, met of zonder PPU.

(voorbeeldje ter versteviging van mijn punt; als je in cellfactor de cloth optie aanzet, krijg je een realtime cloth simulatie, ziet er mooi en aardig uit, maar zonder PPU draait dit aanzienlijk slechter dan met. Desondanks kan ik exact dezelfde simulatie tot stand brengen in 3ds Max d.m.v. Havok simulatie zonder moeite te hebben, zelfs al doe ik het met 20 iterations)

Je kan het beter andersom zien. De ontwikkelaars van het spel hebben hun werk goed gedaan.

Waarom? Omdat het spel ook prima draait zonder de speciale hardware ipv dat het voor geen meter loopt.

Ik heb die demo ook gespeeld. En bij mij scheelde het toch wel meer dan 4 fps. Zodra een van de objecten in beeld kwam die veel gebruik maakt van de PhysX kaart zakte de framerate van 15-20 fps naar 1-2 fps.

Ik heb het daarna vergeleken bij een collega die wel de PhysX kaart heeft en bijna hetzelfde systeem en daar zakte de fps ook een beetje in maar naar ongeveer 10-15 fps.

Wel is het een goede zet van Ageia om dit spel gratis te verspreiden. Hier kunnen ze veel mensen mee overtuigen (en dat hebben ze ook nodig aangezien Ati en nVidia bezig zijn met een soortgelijke techniek)

@DeadKennedy & martijnve hierboven: Je kon de effecten wel aanzetten via die commandline parameter, maar ik betwijfel dat het bij hem dan maar zo weinig verschil maakte. Er was bijvoorbeeld een "veld" met olievaten. Je kon hier gewoon langslopen en de framerate bleef gelijk, maar zodra je op deze vaten deed schieten en er dus beekeningen gedaan werden voor realistische botsingen en vloeistoffen die eruit liepen zakte de framerate heel erg in. (zoals ik al zei naar 1-2fps). Zodra een physx kaart aanwezig was werden deze berekeningen gedaan door deze kaart en niet meer door de cpu en liep het vloeiend.

Als ik het mij goed herinner werd, indien het spel zonder PhysX gedraaid werd, een groot deel van de effecten uitgeschakeld. Dat verklaart de geringe performantiewinst, maar er wordt dus meer gewonnen dan enkel performantie.

dat staat ook in de tekst..
Hoewel de first person shooter ook zonder PhysX-kaart draait, leunt het spel van Artificial Studios en Immersion Games zwaar op de Ageia-hardware.
dit ligt gewoon aan het feit dat er dan éxtra berekeningen worden berekend, waardoor er meer oogsnoep aan kan kleven...

de physicsengine zal bij de toekomstige spellen ook wel degelijk een rol gaan spelen wat snelheid betreft.

Er moet simpel genoeg nog worden voor ontwikkeld, Unreal Tournament 2007 zou er schijnbaar gebruik van maken. En ook de Playstation 3 heeft de technology van Ageia ge-licenseert. Dus het heeft een toekomst als het bedrijf de komende jaar overleeft. En met geld van sony (licenties kosten geld) hebben ze in ieder geval een vaste grond voor investeringen.

Nu nog de PC wereld veroveren en natuurlijk game studios ervan overtuigen dat het de moeite waard is ervoor te programeren. Nu is er namelijk een probleem voor game studios.

Als ze het willen gebruiken ZONDER mensen die gaan physx hebben het hoofd te stoten moeten ze het zo programmeren dat je een game ook zonder physx kan spelen. Daarom ook in GRAW..het enige verschil was daar dat je meer "rubble" had als je een physx kaart had.

Of dat nou 250 euro waard was..voor vele niet! Dus daar zit het probleem, de software physics engines en de dual cores kunnen nu nog genoeg bieden om een Physx niet als nodig te beschouwen!

UT3, Splinter Cell:Conviction, gezien GRAW1 het gebruikte, GRAW2 wss ook, Killing Day, en er zullen er nog komen :)

Een verschil van 4 fps zegt niet veel. Als het met physx kaart 30 fps is en zonder 26, dan heb je er niet veel aan.
Als het echter 6 om 2 is, dan wel.

Niet dat 6 fps goed speelbaar is...

4fps bij hoeveel bewegende objecten?

Als je in half-life 2 een zooi kratten bijelkaar gooi en er een granaat tussen werpt, zie ik ook mijn framerate droppen :P

Als je in half-life 2 een zooi kratten bijelkaar gooi en er een granaat tussen werpt, zie ik ook mijn framerate droppen
Door de extra objecten (rook, vonken, brokstukken, belichting) die je GPU moet tekenen (miljoenen pixels), niet door de fysische berekeningen (een tiental objecten).

Download voor de gein eens Garry's Mod (sowieso een aanrader) en zet een stuk of 50 kratten naast elkaar. Je spel zal dan nog redelijk draaien. Ga je ze echter opstapelen dan zakt je framerate behoorlijk in en gooi je vervolgens de hele stapel om, dan zit je naar een dia-show te kijken. En dan rendert je videokaart nog steeds alleen maar dezelfde kratten die nog vloeiend werden weergegeven toen ze naast elkaar stonden :Y)
* Demoniac wordt zo onderhand doodmoe van mensen die de bedoeling van deze kaartjes niet willen zien... :Z

Rook, vonken, brokstukken zijn misschien wel extra objecten, maar toch ook objecten die goed door een physics-kaart berekent kunnen worden.

Demoniac, zou al die gein niet gedaan kunnen worden door mijn 2e CPU? Ik heb 2 fysieke CPU's van elk 1,7Ghz. in me kast zitten. Wat is er anders aan physics berekeningen dan de berekeningen die je CPU continue uitvoert?

Also note dat de multi-cores ook in opmars zijn.

Helaas maken game engines daar nog weinig gebruik van. Alleen de Linux versie van UT2004 heeft een appart proces voor het geluid.

Als er nou ook nog een appart proces komt voor de physics heb ik die Ageia kaart niet meer nodig.

..tenzij die Ageia kaart echt zoveel briljant sneller is als een Xeon @1,7Ghz.

Download voor de gein eens Garry's Mod (sowieso een aanrader) en zet een stuk of 50 kratten naast elkaar. Je spel zal dan nog redelijk draaien. Ga je ze echter opstapelen dan zakt je framerate behoorlijk in en gooi je vervolgens de hele stapel om, dan zit je naar een dia-show te kijken.
Belachelijk, een CPU doet tientallen miljarden berekeningen per seconde, en zou nog geen 50 kratten aankunnen?

Probeer eens even de Newton Game Dynamics demos. Honderden objecten zonder enige moeite. En dat terwijl ze nog geen goed gebruik maken van SSE.

Dit illustreert ook maar eens hoe belangrijk algorithmische optimalisaties zijn. In Gary's Mod zal men wellicht de interactie van elk krat met de 49 andere berekenen, terwijl met een slimme partitionering meteen kan nagegaan worden met welke ze zullen interageren en welke niet.

Garry's Mod is een mod voor Half-Life 2, die dus Havok gebruikt, wat we wel als referentie-standaard voor game physics kunnen zien, en daar zit echt wel slimme partitionering in (en ook optimalisaties voor SSE, en blabla).

...en daar zit echt wel slimme partitionering in...
Blijkbaar niet he. Wanneer 50 kratten zorgen voor een diashow en de amateuristische Newton physics engine boven de 60 FPS blijft in zo'n situatie...

Het zou kunnen liggen aan de complexere omgeving. Maar ook daar bestaat een groot verschil in de prestaties van het gebruikte algoritme. 50 objecten mag dan ook geen enkel probleem opleveren. Dit zal gewoon nooit echt aandacht gekregen hebben voor Half-Life 2 omdat die aan een half dozijn objecten genoeg heeft.

Dit is ook waarom ik niet geloof dat hardware physics ooit zal doorbreken. Zelfs al heb je extra rekenkracht, vele spellen hebben het gewoonweg niet nodig. Het schaalt niet mee, en de CPU en GPU kunnen ruimschoots volstaan. Bovendien worden die ook voor andere zaken gebruikt, terwijl en PPU volstrekt idle draait wanneer er geen fysische berekeningen (meer) te doen zijn.

Dit illustreert ook maar eens hoe belangrijk algorithmische optimalisaties zijn. In Gary's Mod zal men wellicht de interactie van elk krat met de 49 andere berekenen, terwijl met een slimme partitionering meteen kan nagegaan worden met welke ze zullen interageren en welke niet.
Als we een slimme partitionering gaan gebruiken om de interactie van de 50 vaten als geheel te berekenen krijgen we dus inderdaad hetgene waar Ageia ons vanaf probeert te helpen: statische berekeningen. Het probleem van jouw slimme partitionering is dat die stapel van 50 kratten altijd op dezelfde manier zal omvallen. Probeer je het in het eggie te doen dan zal je zien dat de kratten altijd verschillend vallen. Om dit na te bootsen kan alleen een heel log algoritme worden gebruikt zodat ieder krat een op zich staand vrij object is dat enkel gebonden is aan de "natuurwetten" zoals ze bepaald zijn door de programmeur; kortom de interactie van ieder krat met alle 49 andere berekenen en natuurlijk doe je dit zo'n 60 keer per seconde; nou.. zo'n ageia kaartje is wel lekker dan :)

Het probleem van jouw slimme partitionering is dat die stapel van 50 kratten altijd op dezelfde manier zal omvallen.
Je hebt geen benul waar je het over hebt. De partitionering waar ik over spreek is dynamisch en heeft geen invloed op de fysische correctheid. Het is een pure algoritmische optimalisatie. Bij de ene engine is het echter al wat beter geïmplementeerd dan de andere.
kortom de interactie van ieder krat met alle 49 andere berekenen en natuurlijk doe je dit zo'n 60 keer per seconde; nou.. zo'n ageia kaartje is wel lekker dan
En totaal niet meer nodig als je van een O(n²) algoritme naar O(n) gaat...

Rook, vonken, brokstukken zijn misschien wel extra objecten, maar toch ook objecten die goed door een physics-kaart berekent kunnen worden.
Die volgen gewoon een paraboolbaan. Dat kost twee optellingen per frame. Kan een CPU even goed, en wel miljarden per seconde. De PPU heeft echt geen enkel onderdeel dat uniek is voor fysische berekeningen.

vergeet na de parabool niet de omgekeerde invalshoek bij collisie om sparkles te laten stuiteren.

Brokstukken zijn zelfs ingewikkelder want daarbij worden werkelijk de fysieke vorm in overweging genomen bij het berekenen van de beweging.

Blijkbaar niet he. Wanneer 50 kratten zorgen voor een diashow en de amateuristische Newton physics engine boven de 60 FPS blijft in zo'n situatie...
Hoezo 'blijkbaar' niet?
Je kunt helemaal geen conclusies verbinden aan een framerate en aantal kratten als de rest van de software COMPLEET anders is.
Misschien is die NPE wel sneller omdat ie veel minder stabiel is, of omdat de mate van detail/precisie lager is, of gewoon omdat bij die NPE demootjes veel minder randzaken meedraaien als in een compleet spel zoals Half-Life 2.
Ik ken geen andere spellen die significant betere/snellere physics hebben dan Half-Life 2.
Ik weet wel dat de NovodeX SDK wat demootjes had die ook meer dan 50 objecten gestapeld had, en ook sneller was dan het genoemde voorbeeld. Maar ook van Havok heb ik wel eens wat snellere demootjes gezien, maar dan zonder compleet spel eromheen natuurlijk.

Misschien is dat ook wel het hele punt... zodra er een compleet spel omheen zit, heb je de CPU-kracht misschien niet meer over om ook nog eens snelle physics te doen.

Het feit dat het aantal kratten niet hetgeen is dat de framerate beinvloedt, maar de rangschikking ervan (naast elkaar is sneller dan op elkaar), geeft toch wel aan dat er slim wordt gerekend waar dat kan. Maar alles op elkaar is worst case natuurlijk. Hoe wil je dat uberhaupt partitioneren?

vergeet na de parabool niet de omgekeerde invalshoek bij collisie om sparkles te laten stuiteren.
Een vector reflecteren kost geen moeite hoor. Er zijn zelfs real-time raytracers voor de CPU die per pixel reflecties berekenen (en nog zoveel meer). Miljoenen per seconde dus. En weerom is dit een bewerking waar de CPU even goed voor is uitgerust als de PPU. Optellingen en vermenigvuldigingen.
Brokstukken zijn zelfs ingewikkelder want daarbij worden werkelijk de fysieke vorm in overweging genomen bij het berekenen van de beweging.
Vergt enkel een intertiematrix. Transformatie kost drie instructies met SSE4, anders vier. En een GPU doet het ook in drie. Hoogstwaarschijnlijk net hetzelfde voor de PPU.

...of gewoon omdat bij die NPE demootjes veel minder randzaken meedraaien als in een compleet spel zoals Half-Life 2.
Als je framerate zonder de kratten 60 Hz is en wanneer ze omvallen een diashow veroorzaken, dan heeft de spelomgeving er niks mee te maken he.
Ik ken geen andere spellen die significant betere/snellere physics hebben dan Half-Life 2.
Half-Life 2 is wel al wat jaartjes oud intussen, en de versie van Havok is wellicht van vóór het jaar vertraging dat ze ondervonden hebben. Kan dus gerust minder optimaal zijn dan wat ze nu allemaal demonstreren. En zoals ik al zei hoeft dat geen probleem te zijn. Gary's Mod belast de physics engine zwaarder dan waar het spel zelf voor ontwikkeld was.

Een mogelijke verklaring voor de tegenvallende prestaties is dan ook dat de omgeving niet optimaal naar de Havok engine gestuurd wordt. Een gebalanceerde BSP is heel wat efficiënter dan elke driehoek in een sector te testen voor botsingen.

Gelijkaardig weetje van de Source engine: Bij de DirectX DrawIndexPrimitive functie wordt niet de minimale range van indices doorgegeven. Drivers moeten het dus zelf berekenen, wat minder efficient is dan het in de applicatie bij te houden.
Maar alles op elkaar is worst case natuurlijk. Hoe wil je dat uberhaupt partitioneren?
Sweep-and-Prune met Separating Axis Theorem en insertion sort. O(n) in praktijk en kan realtime duizenden complexe objecten aan op een doorsnee systeem. Zelfs op een hoopje zal voor elk krat slechts een vijftal collision tests gebeuren. Maakt dus praktisch niet uit hoe ze geschikt zijn. Het is dan ook verbazend dat het in Gary's Mod zo'n grote invloed heeft, en ik kan er alleen maar uit concluderen dat de gebruikte algoritmes verre van optimaal zijn.

Als je framerate zonder de kratten 60 Hz is en wanneer ze omvallen een diashow veroorzaken, dan heeft de spelomgeving er niks mee te maken he.
Vind je?
Ik vind 60 fps wel HEEL weinig voor alleen wat kratjes.
Een modern systeem moet dat met duizenden fps kunnen tekenen.
Als er 'maar' 60 fps uitkomen, verwacht ik juist wel dat er een hoop randzaken bij zitten.
Sweep-and-Prune met Separating Axis Theorem en insertion sort. O(n) in praktijk en kan realtime duizenden complexe objecten aan op een doorsnee systeem. Zelfs op een hoopje zal voor elk krat slechts een vijftal collision tests gebeuren. Maakt dus praktisch niet uit hoe ze geschikt zijn. Het is dan ook verbazend dat het in Gary's Mod zo'n grote invloed heeft, en ik kan er alleen maar uit concluderen dat de gebruikte algoritmes verre van optimaal zijn.
Ik vind het nogal natte-vingerwerk.
Verder snap ik niet hoe je aan een vijftal collision tets per krat komt.
Als ze allemaal op elkaar staan, heb een continu 'wankele' toren, waarbij alles elkaar dus tot in het oneindige beinvloedt, en je alleen met een iteratieve benadering in de buurt van de realiteit kunt komen.
Het aantal iteraties dat je kiest zal vooral bepalend zijn, zowel voor de snelheid als voor het realisme van de simulatie.
Kortom, ten eerste denk ik dat je Havok totaal onderschat, wat nogal arrogant overkomt. Ten tweede denk ik dat je de complexiteit van het probleem niet goed begrijpt, en je rekenvoorbeeldjes totaal geen hout snijden.

Ik ben er klaar mee.

Als er 'maar' 60 fps uitkomen, verwacht ik juist wel dat er een hoop randzaken bij zitten.
Dat is niks relatief ten opzichte van de physics. 60 FPS dat is 17 ms voor de 'randzaken'. Wanneer dat een diashow wordt (stel 6 FPS, ookal is dat een rappe dia), dan is dat 150 ms voor de physics. Als de randzaken maar 1 ms innemen (1000 FPS), dan duurt een frame met physics 151 ms, dus 6.6 FPS. Ook diashow, dus de physics overwegen zwaar de randzaken. Dus, deze physics engine is zeer inefficient, en dat heeft niks te zien met dat de CPU zich ook bezig houdt met de spelomgeving.
Verder snap ik niet hoe je aan een vijftal collision tets per krat komt.
Gooi een paar kratten op een hoop, hoeveel kratten komen er dan echt dicht in de buurt van een specifiek krat? Een vijftal, soms wat minder, soms wat meer, maar alle 49 andere testen is duidelijk totaal overbodig.
Als ze allemaal op elkaar staan, heb een continu 'wankele' toren, waarbij alles elkaar dus tot in het oneindige beinvloedt, en je alleen met een iteratieve benadering in de buurt van de realiteit kunt komen.
Hiervoor analyseert men meestal of het object stilstaat of niet. Dat is niet te moeilijk, gewoon alle krachten optellen en wanneer die kleiner is dan de wrijvingskracht wordt alle overblijvende energie geabsorbeerd en staat het object stil. Zo kan een toren van kratten snel stabiliseren, en zolang er geen extra kracht bijkomt kost het nauwelijks rekenkracht. Eens het boeltje in beweging is gezet volstaat het om in iedere iteratie enkel de impulsen van de botsende kratten te beschouwen. Hoogstens twee impulsen per krat dus, voor een toren.
Kortom, ten eerste denk ik dat je Havok totaal onderschat...
Het gaat hier om, en ik quote Wikipedia, "a heavily modified version of the Havok physics engine". Hij is dus aangepast om aan de noden van Half-Life 2 te voldoen. Daar slaagt het perfect in, maar efficiënt 50 kratten opeenstapelen behoort niet tot de vereisten. Het had niet productief geweest om dat tot het uiterste te optimaliseren als het nooit meer dan een tiental objecten aan moet kunnen in het eigenlijke spel. Brute-force collision detection is dus voldoende.

Bovendien stond Havok nog slechts in z'n kinderschoenen toen de ontwikkeling van Half-Life 2 begon. De versie van Half-Life 2 is dus waarschijnlijk de eerste versie die voldeed aan de noden. Ten tijde van de release hadden ze ongeveer de beste physics voor een spel, maar dat betekent niet dat het intussen niet veel beter kan.

Oke, dit programma NEWTON programma gaat ook HEEL snel over de zeik. Niet alleen door wat blokje of een auto te laten spawnen, maar door multiple joint.
Probeer maar eens een x aantal humans te laten generen achter elkaar. >>> POEF en een dikke crash icm een FPS van 0.22

Voor dit soort berekeningen heb je echt een physics kaart nodig, want een fps van 0.22 was niet echt fijn. Zelfs een powerpoint presentatie was sneller.

Dat is niks relatief ten opzichte van de physics. 60 FPS dat is 17 ms voor de 'randzaken'. Wanneer dat een diashow wordt (stel 6 FPS, ookal is dat een rappe dia), dan is dat 150 ms voor de physics. Als de randzaken maar 1 ms innemen (1000 FPS), dan duurt een frame met physics 151 ms, dus 6.6 FPS. Ook diashow, dus de physics overwegen zwaar de randzaken. Dus, deze physics engine is zeer inefficient, en dat heeft niks te zien met dat de CPU zich ook bezig houdt met de spelomgeving.
Dit is dus onzin. Je stelt de tijd van de physics engine als constante, terwijl je die net zo min weet als de randzaken. Conclusies over efficientie zijn dus nergens op gebaseerd.
Gooi een paar kratten op een hoop, hoeveel kratten komen er dan echt dicht in de buurt van een specifiek krat? Een vijftal, soms wat minder, soms wat meer, maar alle 49 andere testen is duidelijk totaal overbodig.
Daar hadden we het niet over. We hadden het over alles opstapelen. Je loopt dus compleet langs ons heen te praten. Dit is niet relevant.
Hiervoor analyseert men meestal of het object stilstaat of niet. Dat is niet te moeilijk, gewoon alle krachten optellen en wanneer die kleiner is dan de wrijvingskracht wordt alle overblijvende energie geabsorbeerd en staat het object stil. Zo kan een toren van kratten snel stabiliseren, en zolang er geen extra kracht bijkomt kost het nauwelijks rekenkracht. Eens het boeltje in beweging is gezet volstaat het om in iedere iteratie enkel de impulsen van de botsende kratten te beschouwen. Hoogstens twee impulsen per krat dus, voor een toren.
Onder de aanname dus dat het uberhaupt stabiliseert, wat alleen het geval is als de kratten perfect opgestapeld zijn, iets dat zo goed als onmogelijk is in HL2. En als je toren 50 meter hoog is, dan beginnen er aardig wat krachten op de onderste kratten te komen, en valt de toren eigenlijk per definitie altijd wel om na een tijdje.
Aan de door jou gesuggereeerde optimalisaties heb je dus weinig in deze situatie, en uit de post van s4nd3r hieronder begrijp ik dat Newton niet significant sneller is als er echt gerekend moet worden.
Het had niet productief geweest om dat tot het uiterste te optimaliseren als het nooit meer dan een tiental objecten aan moet kunnen in het eigenlijke spel. Brute-force collision detection is dus voldoende.
Dit is slechts gebaseerd op een vermoeden van jou dat dergelijke optimalisaties niet nodig zijn, en daarom niet in HL2 zitten.
Dat kun je niet bewijzen. Sowieso, als die optimalisaties er al in zitten, en in sommige situaties nuttig zijn, zonder kostbaar te zijn (zoals jij zelf beweert), dan zie ik niet in waarom men bij HL2 specifiek dergelijke optimalisaties eruit zou halen. Ik vind jouw vermoeden dus ook niet eens logisch.
Afgezien daarvan vind ik jouw manier van discussieren niet geweldig. Je hebt flauwe vermoedens die je als harde waarheid presenteert, en foute aannamen of verkeerde scenarios vanuit waar jij dingen 'voorrekent'.
Dat vind ik nogal flauw. Het lijkt wel alsof je er belang bij hebt om Ageia onderuit te halen, want je deinst kennelijk nergens voor terug.
Gelukkig trap ik er niet in, en ik hoop dat de rest dat ook niet doet.

Weer iemand die het verkeerd begrijpt. In de softwaremodus waren sommige effecten uitgeschakeld. Tegenwoordig -in de nieuwe demo- kun je bv. cloth simulation ook aanzetten in software modus. Resultaat: een FPS van 3 of 4 ofzo. Met de PhysX kaart echter gerust 40 of 50.

En voor de duidelijkheid, al eerder gezegd: de PhysX kaart is er nìet voor hogere FPS! Vaak met een PhysX kaart heb je zelfs lagere FPS vanwege de extra PhysX effecten die gerenderd moeten worden. Een PhysX kaart zorgt voor meer, mooiere en betere physics effecten.

* Wildfire heeft zelf een PhysX kaartje

Tegenwoordig -in de nieuwe demo- kun je bv. cloth simulation ook aanzetten in software modus. Resultaat: een FPS van 3 of 4 ofzo. Met de PhysX kaart echter gerust 40 of 50.
Dit bewijst enkel hoe slecht hun software is, niet dat hun hardware iets waard is. Een CPU en PPU hebben vergelijkbare rekenkracht, indien je gebruik maakt van SSE instructies. Hun software is dus opzettelijk ongeoptimaliseerd.

'Hun' software is de software van NovodeX, die al lang voor de komst van de PhysX-kaart bestond (men heeft deze API aangenomen als de standaard-API voor de PhysX-kaart), en ook in een aantal spellen commercieel gebruikt is (voor meerdere platformen, en ook multi-CPU).
Ik denk dat het qua performance vergelijkbaar is met een concurrent als Havok.
Het is zeker geen ongeoptimaliseerde troep, het is allemaal SSE-geoptimaliseerd, en ook voor multiprocessing.
Ik heb een tijd terug nog wat met de SDK geexperimenteerd (toen er nog geen sprake van PhysX was), en dat viel me niet tegen.

CPU en PPU hebben juist geen vergelijkbare rekenkracht. Een PPU heeft soort van logic gate configuratie die veel voorkomende physics berekeningen bijv binnen 1 clockcyclus uitvoert. Een CPU heeft geen gespecialiseerde
unit om physics berekeningen te doen. Dus daarom zal de CPU meerdere clockcycli moeten draaien voor dezelde berekeningen. Als het om physics gaat dan heeft een PPU echt wel meer performance dan een CPU. En ik weet uit ervaring dat je SSE opcodes moeilijk kunt gebruiken voor physics berekeningen, ten eerte omdat XMM registers integer registers zijn, terwijl je voor physics floating point nodig hebt en ten tweede omdat je geen SIMD strategie kunt toepassen op physics berekeningen. Bij video encoding kun je weer wel SIMD toepassen.

Ze zouden hun software mode extra slecht kunnen maken, maar ik denk niet dat ze risico's zouden willen nemen door een nutteloze for loop van een miljoen iteraties in hun code te plaatsen, omdat er toch wel ergens in deze grote wereld een gek zal zijn die de SDK binaries van Ageia zal reverse engineeren.

@sse2
Een PPU heeft soort van logic gate configuratie die veel voorkomende physics berekeningen bijv binnen 1 clockcyclus uitvoert. Een CPU heeft geen gespecialiseerde
unit om physics berekeningen te doen. Dus daarom zal de CPU meerdere clockcycli moeten draaien voor dezelde berekeningen.
Maar de Ageia kaart zit op de PCI bus en de CPU aan de veel snellere CPU bus.
Voor je de PCI bus opmag kunnen er ook wel een aardig aantal clockcycles voorbij zijn, zeker als er op dat moment al een ander apparaat bezig was.

Ik vraag me nogsteeds af wat die kaart (of z'n firmware) meer te bieden heeft dan Havok in een appart proces op een apparte core/fysieke CPU

Het is zeker geen ongeoptimaliseerde troep, het is allemaal SSE-geoptimaliseerd, en ook voor multiprocessing.
Ik heb NovodeX eens geprofileerd met VTune, en daar kwam een helemaal ander beeld uit naar voor. Hier en daar komt wel een enkele SSE instructie voor, maar het is verre van de 'tight' code die ik verwachtte. De bottlenecks waren allemaal oude FPU code.

Mijn eigen code is negen maal sneller met SSE optimalisaties aan. Hierbij is het SSE-pad handgeoptimaliseerd en het andere pad C code. Via autovectorisatie is dat C pad de helft sneller, maar dus nog steeds verre van wat goede SSE optimalisaties kunnen opleveren.

CPU en PPU hebben juist geen vergelijkbare rekenkracht.
AGEIA claimt 530 miljoen sphere collision tests per seconde. Dit is geen enkel probleem voor een 24000 MFLOPS Core 2 Cuo.
Een PPU heeft soort van logic gate configuratie die veel voorkomende physics berekeningen bijv binnen 1 clockcyclus uitvoert. Een CPU heeft geen gespecialiseerde
unit om physics berekeningen te doen.
En wat zijn die 'physics berekeningen' dan wel? Gewone floating-point optellingen en vermenigvuldigingen zoals je die ook op de CPU en GPU vindt.

@c0d1f1ed

Ok een voorbeeld:
Fluid simulation met behulp van de wave equation:
d^2u/dt^2 = d^2u/dx^2 + d^2u/dy^2 + mu*du/dt
Probeer deze differentiaalvergelijking maar eens op te lossen met een CPU binnen 100 clock cycli met de runga-kutta integratiemethode over een tijdsspan van zeg maar 10*dt. Je wilt wilt het toch met simpele optellingen en vermenigvuldigingen doen? Ik zeg je alvast dat het je nooit lukt om het in 100 clocks te doen.
Maar een PPU zou die vergelijking kunnen oplossen mbv een ingebouwde logic gate array, waarvan de gates zo met elkaar zijn verbonden dat het de oplossing van de vergelijking binnen 1 clockcyclus zou kunnen geven. Het gaat om dat soort berekeningen en niet om simpele sphere collision tests(ja een cpu kan een ppu inhalen met het aantal sphere collision tests, maar die test is ook echt zo simpel: test collision 2 bollen: kijk of afstand tussen middelpunt bol 1 en middelpunt bol 2 kleiner is dan straal bol 1 + straal bol 2: 3xsubstract(voor afstand)+1xrelational test+1xoptellen = 4 instructies per test, zeg maar in ergste geval 6 instructies => een 24000 MFLOPS doet dan grofweg 4000 miljoen tests per sec), die weinig rekenkracht vereisen t.o.v. differentiaalvergelijkingen.

@merethan
datzelfde probleem heb je net zo goed met grafische kaarten en het wordt opgelost door alleen eenmalig een lijst commando's te versturen naar de kaart, waarna de kaart de resultaten in zijn geheugen stopt. Het geeft zijn resultaten pas terug als het de flush commando heeft ontvangen. Dus als je maar genoeg commando's verstuurt kun je die PCI bus hit net zo goed verwaarlozen. Ik weet het niet zeker maar ik vermoed dat het bij Ageia ongeveer op dezelfde manier is geregeld.

Ik zeg je alvast dat het je nooit lukt om het in 100 clocks te doen.
Da's 800 floating-point bewerkingen op een Core 2 Duo. Voor RK4 bekom ik 108 bewerkingen voor de golfvergelijking. Maple optimaliseert dit tot 73 bewerkingen. Zeg nooit nooit.
Maar een PPU zou die vergelijking kunnen oplossen mbv een ingebouwde logic gate array, waarvan de gates zo met elkaar zijn verbonden dat het de oplossing van de vergelijking binnen 1 clockcyclus zou kunnen geven.
Dat is niet zo. Zie het Physics Processing Unit Instruction Set Architecture patent. De PPU moet het ook met optellingen en vermenigvuldigingen stellen.
kijk of afstand tussen middelpunt bol 1 en middelpunt bol 2 kleiner is dan straal bol 1 + straal bol 2: 3xsubstract(voor afstand)+1xrelational test+1xoptellen = 4 instructies per test,
Je vergeet een deel. Afstand berekenen kost 3 subtract, 3 multiply, 2 addition, 1 square root. De vierkantswortel kan echter geëlimineerd worden door te kwadrateren aan de andere zijde. Maakt niet uit voor de conclusie dat een CPU hier zeer goed in is.
...die weinig rekenkracht vereisen t.o.v. differentiaalvergelijkingen.
Toch verbijsterend dan dat AGEIA juist dat als performantiemaat aangeeft, niet? GFLOPS hebben ze nooit durven vernoemen, en de enige reden die ik kan bedenken is dat daarmee duidelijk wordt dat een CPU even krachtig of krachtiger is.

Ik heb de patent gelezen en ja je hebt gelijk zoals ageia het doet is niet de beste manier, dan kun je maar beter geen physics kaart kopen. Maar als je het met een soort FPGA doet dan wordt het verhaal anders. Helaas is er geen PPU die gebruik maakt van een FPGA, want dat zou namelijk een enorme performancewinst opleveren tov van de CPU.

Hehe had ff vergeten de grootte van de afstandsvector te berekenen, maar dan is de CPU natuurlijk nog snel tov van de Physics kaart.

Had ff geen rekening gehouden met het feit dat een core 2 duo 4x2cores instructies kan uitvoeren per clock. Maar weet je zeker dat die 73 bewerking alleen maar gebruik maken van FADD, FSUB, FMUL en FDIV? Zo ja, dan is dat netjes gedaan. En met wat andere opcodes zou je natuurlijk een groot aantal clocks kunnen besparen.

cloth simulation? Zit dat niet al in Hitman 1? En draait dat niet op een redelijk oude bak? :+

Tuurlijk, maar de nieuwste hype is dat je er 170 ¤ aan nieuwe hardware voor nodig hebt. Oh boy...

@Wildfire

Thank you!!! Tenminste nog een ziel die het licht gezien heeft :) Je legt het goed uit, beter dan ik geprobeerd heb te doen!

leuk gratis spel, maar de hardware zullen ze aan niemand die ik ken kwijt raken en daar zitten best grote gaming nerds tussen.

hun quad core-duo is sneller dan een ageia kaartje, mischien als hij 10 euro is ofzo.

4x dual core? Is dat niet een beetje overdreven?
Of is het quad core?

Gewoon dual Xeon 5360 :P

All hail de nerderige vriendengroep van Stewie. Zijn blijkbaar representatief genoeg voor iedereen.. :Y)

Euh...sowieso lijkt me een quad core duo als game systeem een verspilling van geld... maar los daarvan weet je niet eens of deze software wel overweg kan met meerdere CPU's(of cores).

Iemand ervaring met zo'n kaart die het idee heeft dat het echt een veel mooier game geeft (niet paar fps meer ofzo maar echt een verschil in hoe het spel eruit ziet en doet.) iemand?

zoek maar eens in google ;) het levert totaal niets extra's.

Op zich zou ik er niets op tegen hebben om zo'n kaart aan te schaffen, echter wil ik en zo te zien aan alle reacties iedereen, niet zo'n hoog bedrag er voor neertellen. Tevens zijn er al onderzoeken gedaan naar het energieverbruik en dat was niet mals (ff zoeken op Tweakers naar Ageia en er is wat te vinden).

Ik heb de Cellfactor demo eens gespeeld zonder mijn PhysX kaart. Geen pretje :)

Hoe het spel eruitziet wordt volledig bepaald door de applicatie, niet door de hardware.

De prestaties hangen wel af van de hardware, maar ook van de software die erop draait. Zo hebben een CPU en een PPU vergelijkbare rekenkracht, maar zonder gebruik te maken van SSE optimalisaties verlies je een grote factor van de prestaties op een CPU. Met een debugger kan je nagaan dat AGEIA's software geen gebruik maakt van SSE en dus geen eerlijke vergelijking geeft met hun hardware-implementatie.

Nee dus, een dedicated physics processor zal altijd sneller zijn dan een allrounder. Zie ook de posts hierboven van ddbruijn en sse2.

Nee dus, een dedicated physics processor zal altijd sneller zijn dan een allrounder.
Iets is pas 'dedicated' wanneer het logica bevat die enkel voor die taak ontwikkeld is en je nergens anders terugvindt. De PPU bevat echter enkel floating-point units die in niks verschillen van die van de CPU of de GPU's shader units. Een GPU is echter dedicated voor graphics dankzij texture samplers, rasterizers en ROPs, die specifiek zijn voor grafische bewerkingen en je niet terugvind op een CPU.

Ja maar je kan een graka ook voor andere dingen gebruiken, vooral processen met enorm veel threads (molecuulmodelen enzo) dus dan zou die ook niet meer dedicated zijn,... die ppu is ook gewoon dedicated. Namelijk voor natuurkundige berekeningen, en dan kan dan zowel in spelletjes zijn maar ook in andere applicaties...

GPU is ook dedicated. Maar wordt ook misbruikt voor GpGPU doeleinden.

PPU architektuur kan zoiets als een grote aantal aan shader achtige units zijn.
De architektuur is patented (pending) en alleen de patenten zijn bekend. Hiervan zou je al wat van kunnen afleiden. Het zijn ex 3dFx engineers en natuurlijk maak je ene achitektuur die optimaler is voor Physics berekeningen. Daarom dus ook de patenten.
Zoals Branching. en heel veel unit's. 'n soort multicore ding.

We weten nog steeds niet hoe PPU vs GPU en CPU verhouden met verschillende mixen van Physics features en loads kwa performance.

één test voldoet niet er zijn een dozijn aan Physics features die allemaal anders kunnen reageren op design keuzes.

En dan komt er 'n 80nm versie aan van de PPU 130nm nu. zie liever ene next gen PPU2. ben dus benieuwed hoe het uitpakt.

iig ben ik benieuwd hoe revolution en warmonger gaan uitpakken.

Ik heb dus Cellfactor CT gespeeld in Lan aangezien ik wel twee Pc heb met elk 'n PPU erin.

Dat is ene leuke ervaring en zal nog vetter zijn met Revolution en Warmonger. Omdat ze nagenoeh of een PPU moet hebben kunner er veel dingen gedaan worden die nog niet op CPU mogelijk zijn. En dat dan ook een diep in gameplay verwoven

De lang verwachte Gameplay Physics daar waar de Potentie en d erevolutie voor PPU ligd. Ipv van wat vettere effectphysics zoals graw. Niet dat ik niet will effect Physics zijn ook welcom.
Gameplay heeft gewoon meer impact.

kijk als ze nou een 8800 GPU+12 Ageia physics cores doen, dan levert het mischien wel iets op.

ageia moet de hardware/specs gewoon verkopen aan ati/nvidia die het dan in hun GPU verwerken.

Denk je dat een van hun twee daar geld voor over heeft? Ze zijn beide bezig met hun videokaarten het klusje te laten klaren, zo kun je bijvoorbeeld een s1950xtx als videokaart gebruiken en dan een x1300 ofzo de physics laten doen (de x1300 is echt stukke goedkoper dan die physics kaart,...).

Ook had ik gehoord dat je misschien bij de nieuwere borden de igp kon laten werken als physics kaart,...

kijk als ze nou een 8800 GPU+12 Ageia physics cores doen, dan levert het mischien wel iets op.
Waarom? Een PPU is niks anders dan SIMD eenheden, en de shader cores van een GPU zijn net hetzelfde. Een huidige GPU is dus reeds perfect in staat de functies van een PPU uit te voeren. Er zit niks in een AGEIA chip waar NVIDIA of ATI interesse zou ik kunnen hebben. In tegendeel, hun shader cores zijn enorm efficient.

Het gaat vooral om het geavanceerde netwerk tussen de verschillende processing-eenheden.
De PPU is ontwikkeld door een bedrijf dat van oorsprong specialist was op het gebied van packetswitching en dergelijke.
De infrastructuur binnen de PPU is dus heel krachtig, waardoor resultaten snel geforward kunnen worden. Een GPU is veel meer een rechttoe-rechtaan pipeline, en is veel minder flexibel.
De PPU blinkt dus uit wanneer er veel objecten elkaar beinvloeden. Rekenkracht is daar van minder belang.

Bij een CPU heb je wel weer de flexibiliteit die de GPU niet heeft, maar heb je weer niet de extreem parallele rekenkracht.

De PPU is gewoon een interessant compromis.

Een GPU is veel meer een rechttoe-rechtaan pipeline, en is veel minder flexibel.
Weet ik, maar hij is dus uitermate geschikt voor "eye-candy" physics.
De PPU blinkt dus uit wanneer er veel objecten elkaar beinvloeden. Rekenkracht is daar van minder belang.
Voor sterk interagerende zaken die iets minder rekenkracht vereisen is de CPU zeer geschikt.
Bij een CPU heb je wel weer de flexibiliteit die de GPU niet heeft, maar heb je weer niet de extreem parallele rekenkracht.
Hoeft ook niet, de CPU heeft een 10x hogere kloksnelheid. Daarbij, dual-core is nu de standaard, en quad-core zal snel volgen. Dus het voordeel van parallelisme verliest de PPU ook weeral.
De PPU is gewoon een interessant compromis.
Een veel te duur compromis, en daarom juist níet interessant. Veel kost-effectiever is de CPU te gebruiken voor physics met veel interactie en de GPU voor eye-candy physics. Hierdoor kan je de 170 ¤ van een PPU investeren in de CPU en GPU en in totaal een veel interessanter systeem bekomen, dat ook voor applicaties met weinig of geen physics z'n voordeel bewijst. Ook voor spelontwikkelaars is dit de beste optie omdat ze dan aan iedereen dezelfde spelervaring kunnen aanbieden.

Weet ik, maar hij is dus uitermate geschikt voor "eye-candy" physics.
Lijkt mij een voorbijgaande zaak...
Dingen als vonkjes en particles die verder onderling weinig of geen interactie hebben, en verder niet meer gemanipuleerd kunnen worden... Leuk, maar uiteindelijk absoluut niet realistisch, en zal vervangen worden door een realistischer variant zodra we die mogelijkheid hebben.
Voor sterk interagerende zaken die iets minder rekenkracht vereisen is de CPU zeer geschikt.
Behalve dan dat bij de PPU de verhoudingen anders liggen. De PPU kan meer interactie aan, en koppelt dat ook aan meer (effectieve) rekenkracht. De PPU is immers nog altijd een massief parallelle processor, waar de CPU bijna compleet lineair is.
Ik denk dus dat de CPU het in alle praktische/realistische situaties aflegt tegen de PPU, en hooguit in een kunstmatige rangschikking van objecten misschien ooit sneller is.
Hoeft ook niet, de CPU heeft een 10x hogere kloksnelheid.
Dat zegt natuurlijk niks. Hogere kloksnelheid houdt niet automatisch in dat hij z'n berekeningen ook daadwerkelijk sneller uitvoert.
Zo hebben bv videokaarten ook minder klokcycli nodig dan CPUs voor matrix/vector berekeningen, omdat hun instructieset en implementatie daar specifieker voor ingericht is, dus winnen ze daar weer terug op hun 'gebrek' aan kloksnelheid.
Daarbij, dual-core is nu de standaard, en quad-core zal snel volgen. Dus het voordeel van parallelisme verliest de PPU ook weeral.
Behalve dan dat deze cores heel inefficient met elkaar kunnen communiceren, in verhouding met de units in een PPU. De vergelijking slaat dus nergens op.
Een veel te duur compromis, en daarom juist níet interessant.
Dat vind ik een rare bewering als je net hierboven begint over quadcores.
Zo heel duur zijn die PhysX kaartjes niet.
Het verschil tussen een dualcore en quadcore-processor is groter, veel groter.
Daarom vind ik het nogal vreemd te rijmen met jouw constante betoog dat de CPU het beter kan.
Ik denk dat de PPU een veel betere prijs/prestatie-verhouding heeft dan de CPU op het gebied van physics.

Lijkt mij een voorbijgaande zaak...
Juist niet. GPUs worden steeds flexibeler. En er zijn al sterke geruchten dat Microsoft met DirectX 11 een physics API wil voorzien, die zowel op de CPU, GPU als PPU geïmplementeerd kan worden. NVIDIA en ATI hoeven niet veel meer aan de GPU te veranderen om de PPU van de kaart te vegen, als dat al nodig was.
De PPU kan meer interactie aan, en koppelt dat ook aan meer (effectieve) rekenkracht. De PPU is immers nog altijd een massief parallelle processor, waar de CPU bijna compleet lineair is.
Als de PPU inderdaad met local storage werkt is het juist moeilijker om interactie te hebben, net zoals Cell. En daarbij lijkt het ook veel op een GPU, waarbij resultaten pas een tijdje later bij een andere pijplijn/core terecht kunnen komen. De CPU daarentegen is de eenvoudigste van al door het volledig gedeelde geheugen en de lineariteit.
Dat zegt natuurlijk niks. Hogere kloksnelheid houdt niet automatisch in dat hij z'n berekeningen ook daadwerkelijk sneller uitvoert.
Zo hebben bv videokaarten ook minder klokcycli nodig dan CPUs voor matrix/vector berekeningen, omdat hun instructieset en implementatie daar specifieker voor ingericht is, dus winnen ze daar weer terug op hun 'gebrek' aan kloksnelheid.
Inderdaad, en de CPU wint van de PPU terug op z'n paralleliteit via z'n kloksnelheid. Het werkt in beide richtingen he. Zoals ik dus zei, een CPU hoeft het parallelisme van de PPU niet dankzij z'n 10x hogere kloksnelheid. De specificatie van AGEIA voor het aantal sphere collision tests toont duidelijk aan dat de CPU niet moet onderdoen in rekenkracht. En als dit hetgene is waar de PPU het best in is, is het maar zielig gesteld en kan ik me alleen voorstellen welke horror ze hebben uitgehaald met de softwareversie.
Behalve dan dat deze cores heel inefficient met elkaar kunnen communiceren, in verhouding met de units in een PPU.
Onzin, data kan heel snel via de L2 cache uitgewisseld worden. Bovendien beschikt de CPU over out-of-order execution en speculatieve loads die de latentie verbergen. De PPU heeft, afgaand op het patent, lokaal geheugen per VPU, en geheugen in een MCU voor een groepje VPUs. Het diagram duidt ze zelfs aan met L1 en L2. Tussen MCUs wordt data uitgewisseld via een DME, die gecontroleerd wordt door de PCU. Er wordt met geen woord gesproken over snooping of iets dergelijks, dus het zaakje zal slechts gesynchroniseerd worden wanneer de taak uitgevoerd is (zoals Cell). Da's heel wat minder efficiënt communiceren dan CPU cores.
Het verschil tussen een dualcore en quadcore-processor is groter, veel groter.
Ik heb een Athlon 64 X2 gekocht toen die nog 500 ¤ kostte, nu heb je dezelfde voor 100 ¤. Hetzelfde zal gebeuren met quad-core. Reken dan nog eens mee dat een CPU veel meer doet dan alleen physics voor een spel (en dan nog alleen deze die van PhysX gebruik maken), en het loont al snel de moeite om op quad-core over te gaan wanneer AMD en Intel daar hun strijd voortzetten.
Daarom vind ik het nogal vreemd te rijmen met jouw constante betoog dat de CPU het beter kan.
Minstens goed genoeg om geen 170 ¤ investering te moeten doen om van alle mogelijkheden van een spel te genieten. Een GPU kan het echter op vlak van eye-candy physics wel significant beter. NVIDIA toont al een tijdje het goede voorbeeld, met meer dan voldoende interactiviteit. Daar is een 170 ¤ investering veel meer waard dan een PhysX kaart.
Ik denk dat de PPU een veel betere prijs/prestatie-verhouding heeft dan de CPU op het gebied van physics.
Op dit moment, louter voor physics, alleen voor Cellfactor, ten opzichte van de CPU, wel ja. Maar dan kijk je niet naar de toekomstige waarde van zo'n investering ten opzichte van de andere mogelijkheden.

Cellfactor is duidelijk ontworpen om AGEIA op artificiële wijze een exclusieve voorsprong te geven. Wanneer de nieuwe generatie DirectX 10 spellen verschijnen die gebruik maken van een combinatie van de CPU en GPU voor physics, zoals Crysis, zal duidelijk worden dat een PPU een nutteloze aankoop is.

Juist niet. GPUs worden steeds flexibeler. En er zijn al sterke geruchten da