Hoofdcategorieën
Device Settings

IBM, Sony en Toshiba onthullen Cell-processor

Door Wouter Tinus, dinsdag 8 februari 2005 00:00
Bron: Electronics Weekly, views: 26.822

IBM, Sony en Toshiba hebben vandaag op ISSCC 2005 in San Francisco meer technische details onthuld en zelfs een demonstratie gegeven van de Cell-processor, het kloppend hart van de PlayStation 3 en andere toekomstige multimediaproducten. Er gaan een hoop wilde verhalen rond over Cell. Voornamelijk gevoed door de marketingafdeling van Sony meldden veel sites vandaag dat de chip krachtiger is dan de gemiddelde supercomputer, vanwege het grote aantal gigaflops dat het ding in theorie kan leveren. Het grootste deel van deze kracht put de Cell uit acht "Synergistic Processor Elements": gespecialiseerde vectoreenheden die globaal het idee van bijvoorbeeld SSE of AltiVec volgen, maar nog eenvoudiger zijn opgebouwd. Deze elementen hebben ieder twee pipelines, waar getallen in groepen van vier doorheen worden gestuurd. In totaal kan de 234 miljoen transistors tellende chip in iedere klokcyclus dus 64 getallen verwerken. Met een verwachte frequentie van meer dan 4GHz met 65nm-productie is het niet moeilijk om te zien waar de verhalen over de enorme rekenkracht van 256 gigaflops vandaan komen. De vandaag gepresenteerde chip was overigens nog met 90nm-transistors gemaakt, waarvan geen kloksnelheid werd genoemd.

Sony Cell - close-up van een SPE
Close-up van een Synergistic Processor Element

Een ander innovatief punt van de architectuur is de strakke koppeling tussen de eenheden onderling; de zogenaamde Element Interconnect Bus. Deze bestaat uit vier 128-bits brede ringen tussen de cores, ondersteund door een 64-bits tagbus op halve kloksnelheid. Iedere core heeft daarnaast 256KB aan cache tot zijn beschikking, dat is getest tot snelheden van 5,4GHz. Naast de slimme interne bus heeft de chip ook een bloedsnelle externe interface om verbindingen met andere Cell-chips te kunnen leggen. Met behulp van Rambus' XDR en FlexIO-technologie is een bus met een bandbreedte van maar liefst 100GB/s gerealiseerd. Om het stroomverbruik binnen de perken te houden heeft Cell tien digitale thermometers aan boord en is de 221mm² grote plak zand verdeeld in vijftien afgescheiden gebieden die apart geregeld kunnen worden qua stroomverbruik. Of dit al de techniek van Transmeta is werd niet bekendgemaakt.

Sony Cell-core
De volledige Cell

De SPE's kunnen echter lang niet alles. Om er optimaal gebruik van te kunnen maken moet een algoritme goed parallelliseerbaar zijn, beschreven kunnen worden in termen van floating point vectoren en weinig tot geen vertakkingen hebben. De grootste uitdaging voor Sony en ontwikkelaars van software voor Cell is dus het vinden van manieren om de gespecialiseerde eenheden op een nuttige manier in te zetten, zonder dat het programmeer- en testwerk te veel tijd in beslag gaat nemen. Als het een programma niet lukt om de SPE's te benutten dan zal er van de 'supercomputerkracht' van de chip namelijk ook ineens een heel stuk minder overblijven. Hoewel er met name op het gebied van multimedia een hoop geschikte toepassingen liggen voor een chip als Cell, beseft ook Sony zelf dat de krachtige SPE's verre van alleskunners zijn. Daarom zit er naast de acht vectoreenheden ook een normale IBM PowerPC-core aan boord, en zal er in de PlayStation 3 een GPU van nVidia zitten.

Volgende 09:05 Alternatieve browsers kwetsbaar voor phishing
Vorige 20:42 CDT en Ilford samen in onderzoek PLED-displays
Advertentie

Reacties

«  1  2  3  4  »

Voor meer info, zie:

http://www.blachford.info/computer/Cells/Cell0.html

Dit is een stukje dat gaat over de diepenliggende achtergrond, op basis van de orginele patenten.

Zijn er al elementaire verschillen te vinden, tussen het orgineel en deze versie??

Informatief doch een hoog "Amiga rulez", "Linux will crush Windows" gehalte.

Je ziet de schrijver als het ware genieten terwijl hij een scenario beschrijft waarin Cell technologie het magische wapen is waarmee de jarenlange heerschappij van de PC ten einde komt. misschien heeft ie wel gelijk, lijkt me wel een beetje sterk.

Valt me sowiso op dat iedereen klakkeloos achter de marketingafdeling aanloopt van Sony. ("emotion chip" - anyone?)

Kort samengevat hebben we het hier over een schaalbare vector processor. Ik denk dat het zeker zijn nut zal hebben, maar verwacht er nou ook niet te veel van jongens :)

Gewoon meer van hetzelfde maar dan beter dus. En nee - je hoeft je super computer nog niet op ebay te zetten. Je kunt de chips voor geen meter vergelijken. Een 6800 GPU is ook niet sneller dan 40 Athlon 64 processoren. Ja wel als je 3D graphics laat tekenen, maar echt niet in alle situaties.

natuurlijk de amiga ruled, maar daarnaast deze chip is een inovatief stukje techniek wat je niet moet onderschatten, er zijn geen vergelijkbare chips. natuurlijk je stelling van gpu/processor klopt wel maar denk wel dat ding gemaakt is voor hoge grafische eisen, dit zou ook interessant zijn voor nog een tal van andere toepassingen bv. extreem renderwerk of andere extreme primaire berekeningen. voor gewone software is deze chip inderdaad niet zo krachtig maar nog steeds iets wat je nie tmoet onderschatten. sony & ibm hebben hier veel tijd en geld in gestoken en het is dan ook absoluut niet de bedoeling dat dit een ps3 only processortje wordt, daar is het te duur voor

De reden dat er geen vergelijkbare chips zijn (in dit segment) is dat er nauwelijks toepassingsmogelijkheden zijn voor dit type chip. Zo expliciet parallel (8 threads) programmeren zonder pad-logica (herhalingen en condities), dat kan bijna voor geen enkele applicatie.
Ik kan me voorstellen dat het nut heeft bij standaard taken bij het opbouwen van een scherm, voor FSAA heeft het wellicht ook zin, maar als je ziet dat de trend bij videokaarten juist is om herhalingen en condities mogelijk te maken en uit te breiden, vraag ik me af wat de zin is van dit soort processoren in een moderne games console (Zeker als die nog aan een ouderwetse lage-resolutie tv komt te hangen).

Reactie op Roarman.

Deze chip is voornamelijk interesant voor 3D games voor het doorrekenen van projectielen objecten etc. De kunst wordt om de game engine er ook optimaal voor te gebruiken. Verder is het ding vast ook wel als supercomputer inzetbaar op bepaalde fronten (doorrekenen van weerkundige modelen etc). Alleen moet dan waarschijnlijk ook die software eerst hiervoor aangepast worden en dan is de vraag hoeveel cores krijg je tegelijk an het werk.

En volgens mij is er wel iets vergelijkbaars, namelijk de T&L units op GPU's die bestaan ook uit meerdere vector eenheden en kunnen ook meer GFLOPS verwerken dan een P4. Alleen zijn deze nog beperkter in opzet en nog statischer in gebruik.

http://www2.tweakers.net/nieuws/34134

HDTV's zijn al in opkomst, zeker in VS. Hierdoor zullen ook de consoles vroeg of laat aan die resolutie moeten geloven!

hmmz ... ik dacht altijd dat het wel wat overdreven zou zijn, maar als ik dit lees ...

dan denk ik dat zo'n chip toch wel sneller zou moeten zijn dna de huidige processors

mits ze die kloksnelheid kunnen halen

Nu nog wachten totdat ze de Playstation 3 hacken met een ander OS, dan zullen we nog wat leuks zien :)

De Playstation 2's zijn ook eens in een cluster gezet, die mensen hadden daar ook nog leuke resultaten mee..

misschien is sony weer zo aardig. En bieden ze een kit aan zoals bij de ps2.

Ik denk dat je deze rekenkracht voor een deel moet zien als die van een videokaart. In theorie is deze veeel groter dan die van een CPU, maar in real life omstandigheden kan je er niet (nauwelijks) optimaal programma's op draaien.
Nu kan er voor de Cell wel rekening gehouden worden bij het ontwerp van de software, en voor bepaalde toepassingen zal ie megasnel zijn. Maar al met al zal het niet de computerwereld op zijn kop zetten.
Als je daarnaast bedenkt dat hij enorm groot is (groter dan een dual core prescott), en dus niet heel goedkoop om te maken, denk ik niet dat hij echt heel veel zal vernieuwen.

Met een beetje moderne nvidia GPU, een Cell processor en rambus geheugen, zal de PS3 zeker niet goedkoop te maken zijn, vrees ik.
Voor toekomstige HD-videorecorders en andere multimedia aparaten zullen de parralelle bewerkingen mogelijk wel veel nieuwe mogelijkheden bieden.

8 synergistic processor elements en ook nog eens een PowerPC core en een GPU van nVidia...GPU kan nog wel eens de bottleneck worden of krijgen ze een speciaal door nVidia gemaakte GPU

Daarom zit er naast de acht vectoreenheden ook een normale IBM PowerPC-core aan boord
het lijkt erop dat er een POWER 5 lite + Altivec/VMX/"Velocity Engine" als core gebruikt wordt, de core heeft 2 threads. misschien kunnen we binnenkort ook de G6 voor apple verwachten?

""" Contains 64-bit Power ArchitectureTM with VMX that is a dual thread SMT design """

bron: ms word document van scee (sony):
http://www.scee.presscentre.com/imagelibrary/downloadMedia.asp?MediaDe tailsID=25555

, en zal er in de PlayStation 3 een GPU van nVidia zitten.
ik weet niet of er een _GPU_ van nvidia in de PS3 zit, wie weet wordt er nvidia Intellectual property op de SPE's gedraaid? of er wordt een gedeelte van de 3D gfx rekensommen op de SPE's gedraaid en een low level gedeelte op een wat simpele, stripped down GPU...
edit:
@Wouter
nooit ergens expliciet gezien dat het om een fysieke GPU ging altijd ging het over IP samenwerking/overeenkomst etc. vergelijk het met de huidige PS 2 daar zit ook geen discrete GPU in maar wordt alles uitgerekend op eigen Sony/MIPS (?) cores. misschien gaan ze nu dezelfde route volgen alleen dan met "software"/IP 3d algorithmen van nvidia die op de SPE's draaien..
[edit2]@Wouter
van het sony persbericht :
“In the future, the experience of computer entertainment systems and broadband-ready PCs will be fused together to generate and transfer multi-streams of rich content simultaneously. In this sense, we have found the best way to integrate the state-of-the-art technologies from NVIDIA and SCEI,” said Ken Kutaragi, executive deputy president and COO, Sony Corporation, and president and Group CEO, Sony Computer Entertainment Inc. “Our collaboration includes not only the chip development but also a variety of graphics development tools and middleware, essential for efficient content creation.”
"integrate state-of-the-art technologies from NVIDIA".. absorberen van GPU in de CELL?

nvidia heeft het over custom GPU maar dit hoeft niet een discrete GPU te zijn. ik verwacht echt dat een significant gedeelte van de PS 3 3d gfx pipeline op de PSE's draait maar we zullen zien :-)
[/edit2]

[edit3]

nog een leuke vergelijking om het CELL vs GPU verhaal wat in perspectief te zetten... :

nvidia ultra 6800 GPU:
die size : 287 mm^2
GFLOPS : 41,6 GFLOPS

IBM CELL :
die size : 221 mm^2
GLFOPS : 256 GFLOPS

qua GFLOPS past het makkelijk een GPU van nvidia te absorberen. waar zou je die gigantische hoeveelheid CELL GFLOPS anders voor inzetten dan voor visueel geweld? en dan ook nog het verhaal dat er 4 CELLS in een playstation 3 gaan.. totaal 1000 GIGAFLOPS!!! (1 TERAFLOP)... ik voorzie dat er nvidia 3d algorithmen op de SPE's gaan draaien met een custom sony framebuffer/PAL/NTSC/HD TV chip als backend...

overigens :

AMD opteron 90nm/SSE2/3
die size : 115mm^2
GLFOPS : 10 GFLOPS


[/edit3]

Het wordt een losse GPU voor zover ik heb begrepen, maar wel een speciaal ontworpen versie die direct aangesloten kan worden op die Cell-interconnects.
edit:
Dan heb je blijkbaar nooit veel over die overeenkomst gelezen. Alle bronnen die ik kan vinden (inclusief het originele persbericht) hebben het over een custom GPU. Dat Sony er ook aan meewerkt en hem zelf gaat produceren kun je opvatten als een overdracht van IP (hoewel het onduidelijk is hoeveel inzicht ze krijgen in nVidia's techniek, om een chip te bouwen hoef de architectuur niet te kennen), maar het is in ieder geval niet zo dat Cell zelf grafische dingen gaat doen.

Die Cell interconnect waar de GPU op wordt aangeslotem is een van de meer interessante aspecten van dit ontwerp. De tag-bus impliceert dat delen van de 256KByte lokaal geheugen van een Cell processor ook als shared geheugen geconfigureerd kunnen worden.
Overigens bevat die 256 KByte ook de programma instructies voor de cell processor. De bandbreedte van die bus is behoorlijk wat lager dan de throughput van alle Cell processoren samen (1TByte/sec processing throughput tegen 64GByte/sec interconnect bus transport rate).

ik weet niet of er een _GPU_ van nvidia in de PS3 zit
Er zit wel een nvdia gpu in de PS3. Misschien was het persbericht niet echt duidelijk voor jou, maar het interview op xbitlabs (http://www.xbitlabs.com/a...rial/display/ces2005.html) maakt veel duidelijk:
As you know we don’t talk about next generation products but it’s our next generation of GPU. And we’ve been working with them to produce a customized version that is customized specifically to connect that to the cell processor, so that they could work together...

...there is not much we can say about the actual technology itself. First, because we don’t talk about our new technologies. We will be rolling a new graphics solution out as a GPU in addition to what we are doing with Sony...

...with Sony, it’s a licensing deal. Sony will actually be manufacturing the chip themselves...
Niks nieuw hier, nv maakt zelf geen chips, of het nu tmsc, ibm of sony is maakt niet uit
And because we’ve been working on this next generation GPU, we have already been developing a lot of that material. So, I think in that sense compared to how Sony did it before, they did that in-house: they had to normally develop the technology, but then also develop all the tools for the platform to actually give to the developers to create content. There is an advantage to them in not having to do that. They can work with us because we are developing prototype anyway.
De laatste zin zegt alles. Het gaat dus over een volledige GPU.

Als ik het dus goed begrijp is het A. Verschikkelijk duur om er voor te programmeren B. Een plak van 221mm² drukt niet echt de kost prijs dus duur C. Met al die gepattenteerde snufjes van rambus en transmeta wordt hij nog duurder.

Dus met een best dure productie prijs wat is nou het voordeel tegen over een traditionele processor. ??

ten eerste zal de PS 3 chip op 65 nm gebakken worden ipv dit prototype op 90 nm

ten tweede kan de PS 3 chip misschien wel eens minder SPE's hebben dan 8 om em goedkoper te maken maar dat verwacht ik niet.

CELL is namelijk een concept waarbij al naar gelang de rekenbenodigdheden van de toepassing SPE's toegegevoegd of weggelaten kunnen worden (van PDA tot supercomputer schaalbaar..)

en ten derde: _als_ de nvidia 3d "software" op de SPE's draait heb je geen aparte GPU meer nodig wat natuurlijk in de totale systeemkosten weer scheelt.. integratie van de GPU met de PS 3 "CPU". SoC is goedkoper met grote aantallen dan discrete componenten.

en ten vierde had de emotion engine in de oorspronkelijke PS 2 een die size van : 240 mm^2@180nm :-)

http://www.psillustrated.com/psx2/psx2_emotionstats.html

Eerder meer dan minder inderdaad, ik geloof dat ze nog twijfelen om er op de uiteindelijke 65nm-versie tien te doen.

Nou de vertex berekeningen en dus polygoon performance worden door de Cell berekend.
Aangezien die zowat een bodemloze put aan rekenkracht heeft zal de polygooncount een vertex shader complexiteit onwerkelijk hoog zijn en moet je niet straks raar op je neus kijken als Finding Nemo en the Incredibles graphics realtime kunnen en de PS3 5 tot 10x of misschien zelfs meer kracht heeft als de Xbox 360 (naam van de Xbox 2).

De PS3 krijgt toch 4 Cell's met ieder 256Gflop/s?
Vandaar ook dat Sony zei dat de PS3 1Tflop/s kan.

Hoeveel Gflop/s kan dan bijvoorbeeld een AMD 3000+ 64bit aan?

Geen idee, maar een 6800 zou 50 Gflop/s moeten kunnen doen. Da's dus 2.5 keer langzamer. Het is echter ook appels met peren vergelijken. Zo is de hoeveelheid informatie op een grammofoonplaat miljoenen keer groter dan op een CD. Iedereen weet echter dat deze stelling nergens op slaat en dat je niet zo kunt zien.

Tussen haakjes, Zitten die Cel dingen ook niet in de Xbox 3? Xbox gebruikt immers ook een custom chip van IBM.

Tussen haakjes, Zitten die Cel dingen ook niet in de Xbox 3? Xbox gebruikt immers ook een custom chip van IBM.
Nee, Microsoft krijgt een heel andere processor tot zijn beschikking. Ik meen dat dit een PPC-variant is die compleet apart ontwikkeld is.

Het zou natuurlijk ook een beetje vreemd zijn als Sony zijn grote concurrent op console-gebied zomaar zijn meest geavanceerde technologie in handen zou geven

ongeveer 4gigaflops ofzo. maar hangt ook van de taak af, maar minimaal 4gigaflops. deze 256gigaflops die hier geven worden kan hij alleen halen met de taken waarvoor hij gespecializeerd is, net als een vid kaart er tot 40 of meer gigaflops kan halen maar dan alleen in 3d berekening.

'... raar opkijken als Finding Nemo etc...'

Toy Story is al 10 jaar oud. No way dat je met wat voor videokaart dan ook die Graphics van toen nu real-time kan berekenen.

Tussen TS en Finding Nemo/Incredibles zit zo'n 10 jaar. Ik vrees dus dat we zelfs over 10 jaar die graphics niet eens realtime kunnen berekenen, tenzij de ontwikkelingen flink gaan versnellen....

Toy Story zou je nu in real-time kunnen doen.
Nvidia liet in 2001 een demo zien van de Pixar Lamp demo in real-time op een Nvidia 3Ti en deze gebruikte dezelfde shaders en models als Toy Story.

het hypen gaat iig al weer gestaag... :Y)

Waar ik benieuwd naar ben is wanneer deze cpu op de markt komt (wanneer komt de PS3 uit?) en wanneer het in consumenten desktops gaat komen! En welke leveranciers allemaal gfebruik mogen gaan maken van deze chip (en welke besturingssytemen er op zullen draaien) Gaat Apple deze cpu bijv. gebruiken? En gaat Microsoft wel een licentie krijgen? Of wil IBM juist een hak terug zetten? En kunnen Intel en Amd met iets komen wat de strijd kan aangaan? Ik heb wel op tweakers gelezen dat Intel met iets cell achtigs bezig is (zie gerelateerde links)

de kans dat er ooit een cell in een desktop machine terechtkomt, en dan nog als cpu, lijkt me zo goed als onbestaande. Die chip werkt immers volledig anders dan hedendaagse cpu's voor desktopsysteemn (x86, powerpc). Letterlijk àlle software zou herschreven moeten worden om het überhaupt te laten werken...
Nee, Intel en AMD hebben voorlopig op desktop gebied niets te verzen van de cell. Als hij ooit zal worden toegepast (en dat is al zeer te betwijfelen) zal het als co-processor zijn voor zeer specifieke taken, en dan is het nog de vraag welke :)
Als CPU is gewoon niet realistisch; zelfs in de ps3 zit een powerpc-processor als CPU, dat zegt toch al wel iets ;)

* 786562 the_stickie

En wa als ze nu eens 2 cell-processors in ne pc steken waarvan ene zich alleen maar bezighoud met omzetten van x86 naar cell-commando's? En met de powerpc-processor die er in zit zou het geen probleem mogen geven er mac-software op te draaien (mits wa aanpassingen natuurlijk hé)

allé kkan helemaal mis zijn hé en tis missch ni goedkoop van die 2 cell-processors maar het heeft missch wel potentieel.

Of ze missch gebruiken op zo'n insteekkaart (pci-express is best wel snel om gegevens aan te leveren dus ja)

Maar kwil toch voorzichtig zijn en nog geen gat id lucht springe, tis afwachten zeker

Letterlijk àlle software zou herschreven moeten worden om het überhaupt te laten werken...
Klein nuanceverschil... alle software moet opnieuw gecompileerd worden om het te laten werken en een klein deel van het OS moet herschreven worden.

Voor Windows gaat dit ws minder snel gebeuren dan voor Linux, aangezien dat al op alles van je horloge tot een supercomputer draait. MS heeft wat minder ervaring met alternatieve architecturen dan de Linux developers.

Wat het echte probleem gaat worden voor Windows is de applicaties. De software developers zullen niet direct warmlopen om alles op meer dan 1 platform uit te brengen. Dat is meer werk en levert niet onmiddelijk een economisch voordeel op.

Linux heeft dit probleem niet omdat de meeste software Open-Source is en dus iedereen dat kan hercompileren, niet alleen de developer. De software werkt voor het grootste deel al op tientallen platformen prima en zal dat ws op de Cell ook ongewijzigd (maar dan dus niet optimaal) blijven doen.

Je zult toch echt handmatig je programma moeten aanpassen zodat het gebruik kan maken van die 8 "Synergistic Processor Elements". Het is een beetje vergelijkbaar met het ombouwen van een singlethreaded programma naar een multithreaded programma. Ook dat kan de compiler niet eventjes voor je doen.

In dit geval krijg je dus 1 core die alles aankan en 8 "cores" die enkel een bepaald soort deeltaak aankunnen. De ontwikkelaar moet dus het programma herschrijven dat die routines die door de "Synergistic Processor Elements" uitgevoerd zouden kunnen worden ook daadwerkelijk op die "Synergistic Processor Elements" draaien en niet op de Power based core. Daarvoor moet je het programma handmatig aanpassen.

Na hercompilatie draait het, maar natuurlijk verre van optimaal.
Gewoon in PPC mode, die vector cores zullen uberhaupt nouwlijks gebruikt kunnen worden.
Niet zo erg lijkt me, het gaat tenslotte om het idee, net als linux op een xbox draaien.

er word op dit moment anders hard gewerkt om GCC 4.0 (die over niet al te lange tijd uit komt) auto-vectorisatie te geven, ofwel het automatisch verbouwen van code zodat et WEL lekker op die cel kan draaien. Het zal nog niet optimaal zijn, maar snelheidsverbeteringen van 10 tot 50 x zijn niet vreemd. toch best leuk...

maw kort samnegevat het gebruikt in dat geval de Cell amper, of zelfs helemaal niet en leunt vooral op de aanwezige powerpc-cpu

Dit is een waardeloze processor voor de pc. Het is gen general-purpose processor. Je kan hier geen Word op draaien (niet parallelliseerbaar, geen condities/herhalingen, geen floating point), of in ieder geval op veel lagere snelheden. Je kan bestaande programmatuur niet op een zinvollle wijze hier naar toe compileren, een single-threaded programma blijft singlethreaded en gebruikt dus maar 1/128 (8 units * 2 threads * 4 getallen) van de capaciteit. het is waarschijnlijk een in-order processor, hij is waarschijnlijk niet in staat om instructie-volgorde te optimaliseren. Kortom, voor het "Gewone" pc werk is dit ding (met name het SPE-gedeelte, die powerpc zal best een beetje mee kunnen komen) waardeloos.
«  1  2  3  4  »

Op dit item kan niet meer gereageerd worden.

Volgende 09:05 Alternatieve browsers kwetsbaar voor phishing
Vorige 20:42 CDT en Ilford samen in onderzoek PLED-displays
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011