Hoofdcategorieën

ATi introduceert 'stream computing'

Door Hielko van der Hoorn, zaterdag 30 september 2006 16:08
Bron: ATi, views: 32.545

ATi heeft gisteren onder de noemer stream computing een nieuwe technologie geïntroduceerd waarmee de rekenkracht van de gpu niet alleen voor het tekenen van plaatjes gebruikt kan worden, maar ook voor andere applicaties. Mogelijke toepassingen van de rekenkracht die door ATi worden genoemd zijn onder andere wetenschappelijk onderzoek, financiële voorspellingen, het zoeken in databases en gezichtsherkenning. ATi werkt samen met het bedrijf PeakStream om een software platform te leveren om de rekenkracht van de gpu’s te ontsluiten. Tevens werkt ATi samen met AMD om een co-processing platform te ontwikkelen gebaseerd op AMD’s Torrenza-initiatief.

Het inzetten van de videokaart kan vele taken aanzienlijk versnellen. Volgens ATi kunnen Monte-Carlosimulaties die gebruikt worden bij het inschatten van financiële risico’s met een factor zestien versneld worden, seismische modellen die gebruikt worden bij het opsporen van olie en gas kunnen twintig maal zo snel uitgevoerd worden en de Folding@Home-client werkt zelfs een factor veertig sneller. Aanstaande maandag zal een nieuwe Folding@Home-client beschikbaar gesteld worden die kan draaien op de Radeon X1900 en X1950-kaarten. Momenteel werken ongeveer 200.000 computers mee aan het Folding@Home-project, een prestatie die volgens ATi geëvenaard kan worden door ‘slechts’ 5.000 videokaarten.

Folding@Home visualisatie

Volgende 20:02
Vorige 14:34

Reacties

«  1  2  3  »

Zou dit ook niet komen voor de ps3?

Vandaar die deal met AMD...

een GPU is in sommige aspecten een beter FPU dan een CPU.
waarom zou je die mogenlijk er niet uit halen als je hem toch niet altijd echt gebruikt.

idd, dit vroeg ik me ook al langer af... zoveel berekeningen, zoveel rekenkracht...

voor spelletjes alleen?!
dit vond ik een beetje absurd
wie weet krijgen we op den duur als gewone rekenkracht voor je pc cpu+gpu... dat zou de max zijn

Of we hebben ooit geen videokaarten meer:-)

Zo werkt het dus net weer niet, aangezien de taakspecifieke dingen op een GPU onmisbaar zijn voor een GPU en overbodig zijn op een CPU, dat neemt niet weg dat in sommige applicaies de GPU er wel extra bij kan worden gezet en zelfs betere prestaties neer kan zetten.

ik snap niet dat ze nog steeds 2 dimensionaal werken!

Als je een chip in 3D maakt, heb je veel meer winst m.b.t. bussnelheden (afstanden die korter zijn), daarnaast is koeling veel efficienter, omdat hitte danwel koeling aan alle kanten kan ontsnappen/ kan toegevoegd worden.

Wel zal het hele idee van 'atx' overboord gegooid moeten worden.

Een stuk hardware ziet er dan uit als een soort piramide, waarbij het rekengedeelte zich in de punt bevindt, en waar in de punt zich tevens de openingen bevinden voor luchstromen/vloeistofstroming langs de chips.
De rest van de pyramide wordt gebruikt voor verdere koeling en regelschema's.

De verschillende stukken hardware (pyramides) worden bijelkaar gevoegd tot een soort veelvlak (zoals een Romboëdrisch kuboctaëder) , waarbij de punten allemaal in het middenpunt bijelkaar komen in een soort 'superbus' .

Niet alleen het begrip ATX zal overboord gegooid moeten worden, maar ook ide, sata, pci-e, usb etc.
Verder zal ook het productieprocede opnieuw ontwikkeld moeten worden.

Daarbij moet er meer gebruik gemaakt worden van 'licht' om hitteproblemen verder te voorkomen. (cold computing)

Hmm.. Ja... Interesant.. Pyramides.. ATX weg.. Oftoppic.. Hmm..

Maak er eens een draadje van op GOD zou ik zeggen.
Het heeft teveel nadelen om die hier allemaal op te noemen...

jij kijkt teveel star-trek.

chips zijn bovendien al 3D. Er zijn meerdere lagen silicium boven elkaar wat ook de nodige extra problemen meebrengt voor koeling, routing van signalen etc.

Los daarvan wil ik jou wel eens een productieproces zien bedenken om op dat micro-niveau een processor in 3D te bouwen. Quasi onmogelijk dus.

GOD? Gathering Of Dweakers?
TWeaKLeGeND heeft zeker een verstopte deus.... :+

Maar wel een mooie ontwikkeling, ik was dus niet de enige die me afvroeg waarom GPU power niet nuttig gebruikt kon worden voor andere dingen dan video beelden weergeven.

Lijkt me geen goed idee..

-De FPU kan je niet zomaar uit de cpu halen zonder daarbij een heleboel backwardcompatability te verliezen.

-De FPU van een GPU werkt alleen sneller als er een grote data flow is die erg voorspelbaar, voorbeeld:
[i]for(int i = floatarray.length; i<0; i--)
{floatarray *= 5,6;}
Er kan daar gewoon een opdracht naar de GPU gestuurd worden om alle getallen in de array met 5,6 te multipliceren.

Maar bij:
if(floatB*floatBlah == 11,2) { etc..} moet eerst de GPU aangesproken worden om de berekening uit te voeren, daarna pas kan de CPU de if uitvoeren. Omdat de GPU op een pci slot zit en niet op de CPU zelf, duurt het 'transport' van de data een heel stuk langer.

Dus voor grote data berekeningen als Folding en het berekenen van pixels is een GPU sneller, maar bij korte berkeningen is de CPU sneller.

Het probleem dat er geen niet graphisch programma gebruik maakt van de GPU is omdat je er niet altijd op kan vertrouwen dat de GPU er zit en je een heleboel verschillende versies moet schrijven voor verschillende GPU's. Dat zie je ook hier weer: [quote]
die kan draaien op de Radeon X1900 en X1950-kaarten
[/quote]. 2 GPU's is nou niet echt daverende support.

Dat zie je ook hier weer: die kan draaien op de Radeon X1900 en X1950-kaarten. 2 GPU's is nou niet echt daverende support.
Dat staat wel in ATI's persbericht, maar je geeft onderzoekers natuurlijke je snelste product zodat ze de beste resultaten neer kunnen zetten en jij als fabrikant het beste uit de bus komt. Aangezien alle kaarten uit de X1k-serie bijvoorbeeld ook met Avivo overweg kunnen zullen ze dit ook allemaal wel kunnen. De belangrijkste verschillen tussen de low-end en de high-end kaarten in die serie zijn toch wel de hoeveelheid shader processors, kloksnelheden en dergelijke.

if(floatB*floatBlah == 11,2) { etc..} moet eerst de GPU aangesproken worden om de berekening uit te voeren, daarna pas kan de CPU de if uitvoeren. Omdat de GPU op een pci slot zit en niet op de CPU zelf, duurt het 'transport' van de data een heel stuk langer.
De pixelshaders van tegenwoordig ondersteunen ook on-GPU 'if constructies' en de beste kaarten ondersteunen zelfs for loops(zie GLSL specs).

Maar daarvoor moet je je hele programma (of hele functies) door de gpu laten uitvoeren. En stel dat je klant een onboard gpu heeft? Dan moet je het uiteindelijk toch nog op de cpu kunnen schrijven, wat niet kan als je cpu geen fpu heeft.
(leuk, al die op elkaar lijkende afkortingen)

Als de mogelijkheden er zijn is het zinvol om die mogelijkheden te gebruiken. Natuurlijk is een GPU niet voor alle berekeningen zinvol maar voor bepaalde toepassingen is de GPU gewoon beter geschikt dan een CPU.
Ook is het natuurlijk mogelijk om net zoals nu bij de SSE instructies gebeurd te testen op de aanwezigheid van de geschikte kaart te detecteren en afhankelijk daarvan de data op de CPU of GPU te verwerken.

Feit is dat de processorkracht van de GPU nu in veel gevallen ongebruikt blijft liggen. En dat is zonde

Omdat de GPU op een pci slot zit en niet op de CPU zelf, duurt het 'transport' van de data een heel stuk langer.
Als er MEER data kan worden getransporteerd, duurt het wel langer, maar uiteindelijk win je wel.

Een GPU IS een FPU..alleen met 20x zoveel pipes ^_^

Amiga was zijn tijd idd ver voor.... Helaas zijn ze een beetje op hun lauweren gaan rusten en werden ze op den duur ingehaald door anderen (lees M$)

Als het echt doorontwikkeld was............. ik durf er haast niet aan te denken wat voor mogelijkheden we zouden hebben

een gpu is alles behalve een fpu.

een gpu is een stream computer. MAW veel dezelfde bewerkingen uitvoeren op een stream van data. daar hebben floatingpoints weinig mee te maken. je kunt namelijk ook gewoon een reeks bewerkingen laten uitvoeren op een stream van ints oid.

Met 20x meer pipes maar met 1000x grotere latency. Zoals reeds eerder gezegd biedt dit pas voordeel als je de latency kan wegwerken door heel veel keer dezelfde bewerking achter elkaar te starten. Dat komt vaak voor bij 3D verwerking maar minder bij andere applicaties. De CPU/FPU is gespecialiseerd om veel verschillende berekeningen met minimale latency af te werken, dus die zal niet zomaar overbodig worden.

ik gok dat er veel Tweakers/DPC'ers zijn met een X1900? :Y)
Maar werkt ie alleen op een X1900 of ook op een lagere kaart?

Ook op lage kaarten. Maar de X1900 is gewoon de snelste. Echter hebben de mensen op Xtremesystems nog meer van die kaarten en zijn ze ook nog een overclocked. Dus ik denk dat die nog veel hoger komen dan wij. Dat is op dit moment ook bij Rosetta@home. XS heeft DPC heel erg ingehaald. Ik denk wel dubbel. Ze hebben daar gewoon te veel snelle cpu's.

Maar het gaat uiteindelijk om het goede doel, dus iedere kaart is al goed als die extra ingezet kan worden. Dat we dan dalijk niet op nummer 1 staan, tsja, je kunt jezelf beter als winaar benoemen met ieder berekening, daar draait het toch om.

Ik ben er iig een van. Met een X1900XTX dus :+

Ik vraag me af of ik mijn 9500 later ook mee kan doen.
Dan de ik rosetta op de CPU en F@H op de GPU

Nee.
Je hebt een SM3 kaart nodig, en dan met name ook eentje met een snelle branch prediction.

Vandaar dat ATI pas actief is geworden met GPGPU initiatieven met de X1000 serie.
En dat tweede punt is de reden waarom de ATI kaarten daar zoveel beter voor geschikt zijn dan de Nvidia SM3 kaarten.

Kom maar op met een Boinc client :P Dan ga ik me X1900 XTX daar wel eens even voor inzetten :P

Gaan we even scores opkrikken :P

Als nu wat meer real-life applicaties er gebruik van gaan maken, zoals DivX encoding, dan kan dit nog wel eens een belangrijke stap worden in de concurrentiestrijd met nVidia.

Alle respect voor Folding@Home daargelaten, maar daar valt voor mij niet de beslissing over om voor een ATi kaart te gaan.

Aangezien de videokaart via de PCI-Express poort zit, kan dit eventueel ook via de nieuwe Intel Geneseo PCI-Express uitbreidingen gaan, i.p.v. het AMD Torrenza HT-systeem. Dat maakt ook meteen duidelijk waarom AMD niet afkeurend tegenover dit voorstel van Intel staat.

@Rafe, het gaat er dus om dat DivX, XviD en andere software de mogelijkheid krijgt om het direct in hun software te implementeren. Zolang het DivX codec als voorbeeld dus geen directe ondersteuning heeft, krijg je dus geen maximale winst. AMD heeft het Torrenza systeem en goedkeuring aan Geneseo niet voor niks gedaan. Het is de bedoeling dat andere software fabrikanten dus veel beter/gemakkelijker van de extra kracht gebruik kunnen maken.

Als nu wat meer real-life applicaties er gebruik van gaan maken, zoals DivX encoding, dan kan dit nog wel eens een belangrijke stap worden in de concurrentiestrijd met nVidia.
Is al mogelijk met Avivo :)

Voorlopig nog alleen decoding.
(tenzij ze heel recentlijk encoding hebben toegevoegd, maar de laatste keer dat ik keek was het nog softwarematig)

het inschatten van financiële risico’s met een factor zestien versneld worden, seismische modellen die gebruikt worden bij het opsporen van olie en gas kunnen twintig maal zo snel uitgevoerd worden en de Folding@Home-client werkt zelfs een factor veertig sneller.
Ten opzichte van een telraam?

Of je leest ook de links in het artikel.. "Based on Stanford University's testing that compares work unit processing on an Intel® Pentium® 4 2.8 GHz processor vs. similar processing being conducted on a Radeon X1900 XT."

ja dat is natuurlijk appels met peren vergelijken.

Een high end videokaart, met een cpu van 4 jaar oud...

Dat hebben ze waarschijnlijk als "gemiddelde cpu" genomen. Een top cpu van nu zal ook niet meer dan 3 à 4 keer zo goed presteren als een P4 2.8GHz. Dus nog altijd veel trager dan zo'n X1900 kaartje.

Maar die CPU van vier jaar oud kun jij weer vergelijken met iedere CPU die je wil, dus het is een mooie indicator.
Ik gok dat die 2,8 ongeveer 2/3 van de berekeningen doet vergeleken met een core 2 duo op 2,13 of 2,4Ghz.

Inderdaad, als Intel of AMD met een nieuw topmodel cpu komen dan wordt ie ook vergeleken met de huidige top. Ik zie de headlines al voor me:

Nieuwe Core 2 Duo is 20x zo snel als een Pentium III 450!

Universal Audio heeft al jaren een audio processing kaart die gebaseerd is op een GPU, de UAD-1

Dan was er nog even het bedrijf BionicFX wat ook beloofde software uit te brengen waardoor je vst plugins kon draaien op nvidia hardware. Spijtig genoeg bleek het vaporware, maar het is mogelijk en zou geweldig zijn. Ik denk dat zelfs mijn budget FX5500 wel enkele reverbs zou kunnen draaien ;)

Hier ook een X1900XTX, maar met stockkoeler lijkt het me geen pretje op de GPU @100% te draaien.. :'(

Financiële risico's? Seismische modellen? Ik dacht altijd dat banken, verzekeringen en mijnbedrijven met zware multicore workstations werkten, en niet met doorsnee gamesysteempjes van bij de lokale computerboer?

Klopt, maar die zijn wel véél duurder dan een videokaartje GPU (Generalpurpose Processing Unit) ;) :P

Ik werk voor een bedrijf dat software maakt voor de olie en gas industrie (dus ook seismische modellen).
Waar je vroeger zag dat er vrijwel alleen Sun en Silicon machines gebruikt werden, zie je steeds meer de overstap naar win32 machines.

Windows XP is stabiel zat en met 32-bit kom je nog een heel eind.
Omdat ik niet wil spammen, maar een link van de concurrent.
«  1  2  3  »

Op dit item kan niet meer gereageerd worden.

Volgende 20:02
Vorige 14:34
VNU Media logo Powered by True

© 1998 - 2008 Tweakers.net - Alle rechten voorbehouden

Uitgever van: