Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

IBM plant teraflopchip gebaseerd op Cell-architectuur

IBM is hard bezig om het ontwerp van de Cell-processor aan te passen voor gebruik in supercomputers. Naast een speciale versie voor de petaflopmachine Roadrunner, werkt het bedrijf aan een volgende generatie die een teraflop moet kunnen leveren.

De Cell, zoals die wordt toegepast in de PlayStation 3, heeft een algemene core en acht hulpeenheden speciaal voor numerieke bewerkingen. Ieder van deze eenheden kan acht flops per kloktik leveren, voor een totaal van 205 gigaflops op 3,2GHz. De grote valkuil hier is dat het gaat om rekenen met 32bits getallen. Veel wetenschappelijk werk moet met 64bits precisie gebeuren en Cell is daar ruim tien keer zo traag mee. Kortom, de 'echte' gigaflops die als maatstaaf voor supercomputers dienen schieten tekort.

Voor Roadrunner, die halverwege 2008 de boeken in moet gaan als de eerste petaflop supercomputer, heeft IBM daarom al een nieuwe versie ontwikkeld. De 'Enhanced Cell' heeft nog steeds dezelfde opzet als het origineel, maar kan efficiŽnter met 64bits getallen omgaan. Verder heeft men ondersteuning voor de fmac-instructie toegevoegd, die als twee flops telt. Hierdoor kan de nieuwe versie zelfs met 64bit getallen nog 102 gigaflops klokken. Ook heeft het bedrijf de Rambus xdr-geheugencontroller vervangen voor een standaard ddr2-interface, zodat goedkoper geheugen gebruikt kan worden.

Dit is echter pas de eerste stap, want over een paar jaar wil IBM een afgeleide van de Cell uitbrengen die nog vijf keer zo snel is. Met 32bits getallen zou deze dus in de buurt van de teraflop moet komen. De chip zou 2 algemene en 32 floatingpointcores krijgen.

Cell roadmap

Door Wouter Tinus

26-11-2007 • 20:12

32 Linkedin Google+

Reacties (32)

Wijzig sortering
Alle reacties hierboven me zijn wel leuk maar hebben helemaal niets te maken met waar het hier om gaat. De 32 vs 64 bits CPUs waarover gesproken wordt hebben voornamelijk te maken met de grootte van de general purpose integer registers, en helemaal niets met floating point registers. Zelfs oude 16 bit machines met een aparte FPU ondersteunden gewoon 32, 64 en 80-bits floating point getallen. De PPU van de Cell is overigens gewoon een 64 bits CPU. Het is trouwens niet per se waar dat 64 bits een hele verbetering is tov 32 bits. Zo moet je er even bij stilstaan dat alle generieke data zoals ints en geheugenaddressen in een programma ineens 2x zo groot worden, waardoor het meer geheugen verbruikt en cachemisses daardoor sneller zullen optreden. In de meeste applicaties is het geheugen nog altijd de bottleneck, dus een omschakeling van 32 naar 64 bits helpt alleen als je de geheugenbus en de cacheline 2x zo breed maakt en de hoeveelheid cache verdubbelt. Anders zal het voor de gemiddelde applicatie al snel nadelig uitpakken.

Een SPU is echt compleet anders - hij is volledig SIMD, en heeft daarom 128 * 128-bits general purpose registers, die als alles dienst kunnen doen: 8 * 16-bits ints, 4 * 32-bits ints, 4 * 32-bits floats en 2 * 64-bits floats (en in beperkte mate 16 * 8-bits ints, 16 individuele bytes dus, en 1 * 128-bits voor bitwise operaties) (en uiteraard ondersteunt ie ook gewoon scalar operaties, waardoor alleen de eerste 8, 16, 32 of 64 bits van een register gebruikt worden). De opmerking in het artikel dat een SPU puur bedoeld is voor floating point operaties is dus onjuist.

De reden waarom 64 bits floating point operaties een stuk langzamer zijn is simpelweg gewoon omdat de "oude" cell zoals die in de PS3 zit daar niet op is geoptimaliseerd. Het kost een hoop transistors meer om de zogenaamde 'doubles' in een clockcycle te kunnen verwerken terwijl ze doorgaans veel minder gebruikt worden dan 'singles', dus het was gewoon een kostenbesparing. Nu er vraag naar snelle double verwerking vanuit de wetenschap is gaan ze de chip aanpassen.

Voor de mensen de geÔnteresseerd zijn in de details van de SPU architectuur: klik

[Reactie gewijzigd door .oisyn op 27 november 2007 01:53]

Op dit item kan niet meer gereageerd worden.


Apple iPhone XS Red Dead Redemption 2 LG W7 Google Pixel 3 XL OnePlus 6T FIFA 19 Samsung Galaxy S10 Google Pixel 3

Tweakers vormt samen met Tweakers Elect, Hardware.Info, Autotrack, Nationale Vacaturebank en Intermediair de Persgroep Online Services B.V.
Alle rechten voorbehouden © 1998 - 2018 Hosting door True