Japanse onderzoekers bouwen chip met 512 cores

Onderzoekers van de universiteit van Tokio hebben een chip gebouwd die maar liefst 512 cores bevat. De Grape DR-chip is ontwikkeld als floating point co-processor en dankzij een kloksnelheid van 500MHz is de chip in staat om 256 miljard instructies per seconde uit te voeren. De chip bestaat uit 16 groepen met elk 32 cores waarbij elke core in staat is om één specifieke bewerking, zoals optellen of vermenigvuldigen, uit te voeren. De Grape DR bevat een gedeelde geheugencache, meet 17 bij 17 millimeter, bevat 300 miljoen transistors, verbruikt 60 Watt en kan in een syteem geplaatst worden door middel van een PCI-X-insteekkaart. De onderzoekers zijn van plan om de Grape DR-processor de komende jaren verder te ontwikkelen zodat snelheden van meer dan een petaflop mogelijk worden. In 2008 moet twee petaflop, oftewel twee biljard berekeningen per seconde, gehaald worden. De Grape DR is voornamelijk ontwikkeld voor het accelereren van het doorrekenen van systemen waarin grote hoeveelheden deeltjes met elkaar interactie hebben.

Vorig nieuwsartikel Volgend nieuwsartikel

Door Hielko van der Hoorn

Feedback • 06-11-2006 18:54 53

06-11-2006 • 18:54

Bron: Channel Register

Lees meer

Intel bouwt prototype processor met tachtig cores Nieuws van 27 september 2006

Computers

Reacties (53)

-Moderatie-faq

Wijzig sortering

Maverick 6 november 2006 18:57

klinkt leuk, 265 miljard instructies en een petaflop. Maar hoe staat dit in verhouding met de huidige gebruikelijke cpu's? Denk dat niet iedere tweaker die kennis meteen parraat zal hebben.

Auteur

Hielko @Maverick • 6 november 2006 19:14

Aantal instructies per seconde is gewoon de kloksnelheid maal het aantal instructies dat een processor per kloktik kan uitvoeren. Volgens mij kunnen de meeste desktop cpu's in de bestcase iets van 3 instructies per kloktik uitvoeren, dus dat zou dan bij een kloksnelheid van 3,33GHz neerkomen op 10 miljard instructies per seconde. In de praktijk haalt ie veel minder, maar dat zal ongetwijfeld ook gelden voor het Japanse rekenmonster.

LoermansA @Hielko • 7 november 2006 08:19

Berekeningen met een vloeiende komma behoren, samen met instructies die het geheugen benaderen, tot de zwaarsten. Die 10 ga je niet halen.

stappel_ @LoermansA • 7 november 2006 08:27

daar noem je wat: geheugen. waar moet hij de instructies vandaan halen? hij kan nooit 265 miljard instructies tegelijketijd uitvoeren want dat krijgt hij niet aangevoerd op die snelheid.

dat was met de P4 alzo. de P4 had 4 exec units, maar de pipeline kreeg er maar 3 per tik door.

peke @LoermansA • 7 november 2006 14:10

Voor oa branch predcition zal er altijd meer berekend worden dan nodig is.
Ook komen de meest voorkomende instructies uit de cache en niet uit het geheugen, denk daarbij bvb aan lussen.
En nog iets: als de geheugenbandbreedte de bottleneck niet is dan is het aantal execution units dat. Het is of het ene of het andere, perfect afstemmen kan nooit, en rara wat is de goedkoopste oplossing?

Verwijderd @Hielko • 7 november 2006 08:27

Stel dat de desktop cpu slechts 50% van die 10 haalt, dan nog haalt de Japanse cpu er meer als die slechts 20% van de 256 haalt. De vraag is echter: kun je dat wel met elkaar vergelijken gezien de verschillende doeleinden van beide soorten cpu's?

Bonez0r @Maverick • 7 november 2006 09:59

Pak er eens een benchmark proggie bij zoals Sisoftware Sandra. De snelste processor in mijn versie, de Intel Core 2 XE X6800, haalt iets meer dan 18 Gigaflops. Die Grape is dus 14 keer zo snel in floating point berekeningen.

Verwijderd @Maverick • 6 november 2006 19:04

Deze chip is gebouwd voor floating point berekeningen, dit terwijl een echte desktopchip veel meer verschillende dingen moet kunnen.

Lijkt me op zich wel een goede uitbreiding voor een P4 gebaseerd systeem aangezien die het vooral van hun integer prestaties moesten hebben en ze op deze manier aardig aangevuld kunnen worden op fp gebied.

Verwijderd @Verwijderd • 7 november 2006 17:39

Tegen de tijd dat dit ding beschikbaar is praten we over de p5 of p6 denk ik zo...

multipasser 7 november 2006 05:46

We hebben al enkele keren zo'n nieuwspost gehad waar we nieuwe soorten cpu's zien die 10x 100x 1000x sneller zijn dan de huidige cpu's. Maar we merken daar steeds weinig van. Nu is de physics kaart uit maar op zich doet één core hetzelfde werk (quadcore, Alan Wake).

Wanneer gaan mensen nu eens software/plugins schrijven zodat we in godsnaam deze kaarten kunnen gebruiken in echte programma's zoals 3dsmax/LIghtwave/C4D/Maya/Photoshop/Realflow/... ?

Verwijderd @multipasser • 7 november 2006 09:14

dat gebeurt pas als multi-core mainstream is...

PrinsEdje80 7 november 2006 06:54

Grape staat voor Gravity Pipe (ja, ik heb hem ook niet bedacht..) Deze proc is puur bedoeld voor berekeningen die iets te doen hebben met zwaartekracht interacties. Veelal gebruikt voor Sterrenkundige simulaties...

Reinstein 6 november 2006 19:04

Kunnen ze em niet zo maken dat hij via HyperTransport met een Opteron CPU kan praten, dat lijkt mij veel handiger.

Dit soort CPU's zijn superhandig voor clusters die atoom botsingen moeten berekenen, aangezien dat allemaak Floatingpoint getallen zijn.

Verwijderd @Reinstein • 7 november 2006 10:44

Ja, dat zeggen ze zelf toch ook al

De Grape DR is voornamelijk ontwikkelt voor het accelereren van het doorrekenen van systemen waarin grote hoeveelheden deeltjes met elkaar interactie hebben.

Daarnaast is deze CPU juist voor FP getallen ontwikkeld, waarom zou je er dan een Opeteron bij willen?

leuk_he @Verwijderd • 7 november 2006 11:46

Je wil er een opteron bij hebben om je data gewoon te kunnen representeren en een OS te kunnen draaien. Niet voor je echte berekeningen. Net zoals in de PS/3 core processor er voor elke 7 number crunchers 1 generieke processor zit.

Je moet dit soort processor zien als een soort co-processor, net zolas je een GPU gebruikt voor beeld bewerkingen, kun je dit soort hardware als zwaartekacht simulator gebruiken.

Echter, als ik dit zo lees is de definitie van "core" voor deze processor nogal vrij gebruikt. Dan kun je een GPU met 16 pipelines ook 16 cores noemen...

Wivern @Verwijderd • 7 november 2006 12:30

grote hoeveelheden deeltje en interactie...
Physics?

successor 6 november 2006 19:15

ik denk dat heel veel kunnen rekenen heel handig kan zijn bij het bereken van botsingen en deeltjes die met elkaar interactie hebben .... bij het spelen van een computerspel , dan is de PCI-E interface wel heel handig ...

al denk ik dat voor servers en blades een socket F veel beter was geweest. dan kan die chip via HTT veel sneller communiceren met de CPU (opteron ? ), wat het geheel veel vlotter zal laten werken

Mr. Detonator 6 november 2006 19:15

Kan dit niet gebruikt worden om ingame physics te berekenen ?

Verwijderd @Mr. Detonator • 7 november 2006 03:15

Denk echter dat deze chip vele malen duurder zal zijn dan de Physix versie, of bijvoorbeeld een extra videokaart van ATi of nVidia die ook hier mee aan het spelen zijn.

Microsoft is echter wel bezig om een soort standaard te definiëren voor dit soort kaarten en in DirectX te implementeren. Dan is alleen je budget de limiet, zolang deze makers er tenminste een DirectX driver voor schrijven.

Verwijderd 6 november 2006 18:58

Waar is dit precies nuttig voor?
Het enige wat ik me kan bedenken is voor een grote webserver, voor de rest kan ik me geen software bedenken die 512 berekeningen tegelijk kan doen.

Eerst was er een race voor aantal mhz, daarna de meest zuinige en nu is het de meeste cores?

SRI @Verwijderd • 6 november 2006 18:59

Denk dat het veel toegepast gaat worden voor atoommodelen en natuurkundige voorspellingen.

Dark Angel 58 @SRI • 6 november 2006 19:03

of games..... denk maar aan bijv... 1000 soldaten met een eigen wil.

ReLexEd @Dark Angel 58 • 7 november 2006 07:47

Klinkt als een brak leger... soldaten met een eigen wil....

Hebben die niet gewoon orders?

Darude1234 @Dark Angel 58 • 7 november 2006 11:22

En wat nou als ze allemaal vakantie willen...

Verwijderd @Verwijderd • 6 november 2006 19:03

De Grape DR is voornamelijk ontwikkelt voor het accelereren van het doorrekenen van systemen waarin grote hoeveelheden deeltjes met elkaar interactie hebben.

Daar is het nuttig voor .

Black Sparrow @Verwijderd • 6 november 2006 19:06

Leiden Classical, ook een projectje van DPC.

Verwijderd @Verwijderd • 8 november 2006 01:19

de wereld der computers reikt verder dan je desktop

of je counter-strike frames per second. ..

*weersvoorspellingen, klimaatstudies (aarde na proberen te bootsen en zoeken naar patronen, voorspellingen proberen te creëren, geschiedenis onderzoeken...)
*analyses van gigantische databases
*dna/wetenschap/medische grafische voorstellingen en voorspellingen berekenen/...
*ruimtevaart/het hardere rekenwerk om miljardenprojecten in goede banen te leiden
*grafische opdrachten mss zelfs? zoals pixarfilms, hollywoodstudio-effecten (lord of the rings?) of zit ik hier ook fout?
*berekeningen op hoe'n effect explosies/implosies/instortingen,.... hebben op andere objecten

man man man bijsterend interessant allemaal

darkfader 7 november 2006 05:14

ca. half miljoen transistoren per core is misschien wel 100 keer minder dan een conventionele CPU.
Da's best aardig bedacht denk ik.

Verwijderd @darkfader • 7 november 2006 08:21

Ik denk als je de FPU (Floating Point Unit) eruit haalt van je gewone CPU dat die nog kleiner is

knirfie244 @darkfader • 7 november 2006 09:16

Daarom kan elke core in principe ook bijna niets, waar 1 CPU core bijna elk mogelijke instructie uit moet kunnen voeren, daar kan bij deze chip elke core maar één speciefieke functie uitvoeren...

Beetje appels met peren vergelijken hè?

Silvan 7 november 2006 08:21

Ik krijg zolangzamerhand sterk de indruk dat de techniek harder gaat dan de software die er voor ontwikkeld (kan?) worden.

Zonde!:?

Kan moeilijk helemaal andersom...

Verwijderd @Silvan • 7 november 2006 09:45

Inderdaad.... en water is nat.

Greyh0und @Verwijderd • 7 november 2006 09:52

Inderdaad.... en water is nat.

Echt waar???

Hmmm. Misschien zit ik toch iets teveel op T.net en GoT

HatzaFlatsa @Silvan • 7 november 2006 11:53

Is niet helemaal waar.
Vroeger (ik heb het over 30 jaar geleden) werd er nog wel eens software geschreven voordat processors daadwerkelijk geleverd was.
Er werd dan puur en alleen op de specs van de processor fabrikant geprogrammeerd.
Ik denk zelf eigenlijk dat dat nog steeds wel gebeurd alhoewel procs tegenwoordig wel een stuk complexer zijn geworden.

Verwijderd 7 november 2006 07:58

Ik krijg zolangzamerhand sterk de indruk dat de techniek harder gaat dan de software die er voor ontwikkeld (kan?) worden.

Zonde!

Verwijderd @Verwijderd • 7 november 2006 08:21

Dat is niet nieuw, software loopt altijd achter hardware aan.

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (53)

Sorteer op:

Weergave: