Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 53 reacties
Bron: Channel Register

Onderzoekers van de universiteit van Tokio hebben een chip gebouwd die maar liefst 512 cores bevat. De Grape DR-chip is ontwikkeld als floating point co-processor en dankzij een kloksnelheid van 500MHz is de chip in staat om 256 miljard instructies per seconde uit te voeren. De chip bestaat uit 16 groepen met elk 32 cores waarbij elke core in staat is om één specifieke bewerking, zoals optellen of vermenigvuldigen, uit te voeren. De Grape DR bevat een gedeelde geheugencache, meet 17 bij 17 millimeter, bevat 300 miljoen transistors, verbruikt 60 Watt en kan in een syteem geplaatst worden door middel van een PCI-X-insteekkaart. De onderzoekers zijn van plan om de Grape DR-processor de komende jaren verder te ontwikkelen zodat snelheden van meer dan een petaflop mogelijk worden. In 2008 moet twee petaflop, oftewel twee biljard berekeningen per seconde, gehaald worden. De Grape DR is voornamelijk ontwikkeld voor het accelereren van het doorrekenen van systemen waarin grote hoeveelheden deeltjes met elkaar interactie hebben.

Lees meer over

Moderatie-faq Wijzig weergave

Reacties (53)

klinkt leuk, 265 miljard instructies en een petaflop. Maar hoe staat dit in verhouding met de huidige gebruikelijke cpu's? Denk dat niet iedere tweaker die kennis meteen parraat zal hebben.
Aantal instructies per seconde is gewoon de kloksnelheid maal het aantal instructies dat een processor per kloktik kan uitvoeren. Volgens mij kunnen de meeste desktop cpu's in de bestcase iets van 3 instructies per kloktik uitvoeren, dus dat zou dan bij een kloksnelheid van 3,33GHz neerkomen op 10 miljard instructies per seconde. In de praktijk haalt ie veel minder, maar dat zal ongetwijfeld ook gelden voor het Japanse rekenmonster.
Berekeningen met een vloeiende komma behoren, samen met instructies die het geheugen benaderen, tot de zwaarsten. Die 10 ga je niet halen.
daar noem je wat: geheugen. waar moet hij de instructies vandaan halen? hij kan nooit 265 miljard instructies tegelijketijd uitvoeren want dat krijgt hij niet aangevoerd op die snelheid.

dat was met de P4 alzo. de P4 had 4 exec units, maar de pipeline kreeg er maar 3 per tik door.
Voor oa branch predcition zal er altijd meer berekend worden dan nodig is.
Ook komen de meest voorkomende instructies uit de cache en niet uit het geheugen, denk daarbij bvb aan lussen.
En nog iets: als de geheugenbandbreedte de bottleneck niet is dan is het aantal execution units dat. Het is of het ene of het andere, perfect afstemmen kan nooit, en rara wat is de goedkoopste oplossing?
Stel dat de desktop cpu slechts 50% van die 10 haalt, dan nog haalt de Japanse cpu er meer als die slechts 20% van de 256 haalt. De vraag is echter: kun je dat wel met elkaar vergelijken gezien de verschillende doeleinden van beide soorten cpu's?
Pak er eens een benchmark proggie bij zoals Sisoftware Sandra. De snelste processor in mijn versie, de Intel Core 2 XE X6800, haalt iets meer dan 18 Gigaflops. Die Grape is dus 14 keer zo snel in floating point berekeningen.
Deze chip is gebouwd voor floating point berekeningen, dit terwijl een echte desktopchip veel meer verschillende dingen moet kunnen.

Lijkt me op zich wel een goede uitbreiding voor een P4 gebaseerd systeem aangezien die het vooral van hun integer prestaties moesten hebben en ze op deze manier aardig aangevuld kunnen worden op fp gebied.
Tegen de tijd dat dit ding beschikbaar is praten we over de p5 of p6 denk ik zo...
We hebben al enkele keren zo'n nieuwspost gehad waar we nieuwe soorten cpu's zien die 10x 100x 1000x sneller zijn dan de huidige cpu's. Maar we merken daar steeds weinig van. Nu is de physics kaart uit maar op zich doet één core hetzelfde werk (quadcore, Alan Wake).

Wanneer gaan mensen nu eens software/plugins schrijven zodat we in godsnaam deze kaarten kunnen gebruiken in echte programma's zoals 3dsmax/LIghtwave/C4D/Maya/Photoshop/Realflow/... ?
dat gebeurt pas als multi-core mainstream is...
Grape staat voor Gravity Pipe (ja, ik heb hem ook niet bedacht..) Deze proc is puur bedoeld voor berekeningen die iets te doen hebben met zwaartekracht interacties. Veelal gebruikt voor Sterrenkundige simulaties...
Kunnen ze em niet zo maken dat hij via HyperTransport met een Opteron CPU kan praten, dat lijkt mij veel handiger.

Dit soort CPU's zijn superhandig voor clusters die atoom botsingen moeten berekenen, aangezien dat allemaak Floatingpoint getallen zijn.
Ja, dat zeggen ze zelf toch ook al :?
De Grape DR is voornamelijk ontwikkelt voor het accelereren van het doorrekenen van systemen waarin grote hoeveelheden deeltjes met elkaar interactie hebben.
Daarnaast is deze CPU juist voor FP getallen ontwikkeld, waarom zou je er dan een Opeteron bij willen?
Je wil er een opteron bij hebben om je data gewoon te kunnen representeren en een OS te kunnen draaien. Niet voor je echte berekeningen. Net zoals in de PS/3 core processor er voor elke 7 number crunchers 1 generieke processor zit.

Je moet dit soort processor zien als een soort co-processor, net zolas je een GPU gebruikt voor beeld bewerkingen, kun je dit soort hardware als zwaartekacht simulator gebruiken.

Echter, als ik dit zo lees is de definitie van "core" voor deze processor nogal vrij gebruikt. Dan kun je een GPU met 16 pipelines ook 16 cores noemen...
grote hoeveelheden deeltje en interactie...
Physics?
ik denk dat heel veel kunnen rekenen heel handig kan zijn bij het bereken van botsingen en deeltjes die met elkaar interactie hebben .... bij het spelen van een computerspel , dan is de PCI-E interface wel heel handig ...


al denk ik dat voor servers en blades een socket F veel beter was geweest. dan kan die chip via HTT veel sneller communiceren met de CPU (opteron ? ), wat het geheel veel vlotter zal laten werken
Kan dit niet gebruikt worden om ingame physics te berekenen ?
Denk echter dat deze chip vele malen duurder zal zijn dan de Physix versie, of bijvoorbeeld een extra videokaart van ATi of nVidia die ook hier mee aan het spelen zijn.

Microsoft is echter wel bezig om een soort standaard te definiëren voor dit soort kaarten en in DirectX te implementeren. Dan is alleen je budget de limiet, zolang deze makers er tenminste een DirectX driver voor schrijven.
Waar is dit precies nuttig voor?
Het enige wat ik me kan bedenken is voor een grote webserver, voor de rest kan ik me geen software bedenken die 512 berekeningen tegelijk kan doen.

Eerst was er een race voor aantal mhz, daarna de meest zuinige en nu is het de meeste cores?
Denk dat het veel toegepast gaat worden voor atoommodelen en natuurkundige voorspellingen.
of games..... denk maar aan bijv... 1000 soldaten met een eigen wil.
Klinkt als een brak leger... soldaten met een eigen wil....

Hebben die niet gewoon orders? :+
En wat nou als ze allemaal vakantie willen... :P
De Grape DR is voornamelijk ontwikkelt voor het accelereren van het doorrekenen van systemen waarin grote hoeveelheden deeltjes met elkaar interactie hebben.

Daar is het nuttig voor . ;)
de wereld der computers reikt verder dan je desktop ;) of je counter-strike frames per second. ..

*weersvoorspellingen, klimaatstudies (aarde na proberen te bootsen en zoeken naar patronen, voorspellingen proberen te creëren, geschiedenis onderzoeken...)
*analyses van gigantische databases
*dna/wetenschap/medische grafische voorstellingen en voorspellingen berekenen/...
*ruimtevaart/het hardere rekenwerk om miljardenprojecten in goede banen te leiden
*grafische opdrachten mss zelfs? zoals pixarfilms, hollywoodstudio-effecten (lord of the rings?) of zit ik hier ook fout?
*berekeningen op hoe'n effect explosies/implosies/instortingen,.... hebben op andere objecten

man man man bijsterend interessant allemaal
ca. half miljoen transistoren per core is misschien wel 100 keer minder dan een conventionele CPU.
Da's best aardig bedacht denk ik.
Ik denk als je de FPU (Floating Point Unit) eruit haalt van je gewone CPU dat die nog kleiner is ;)
Daarom kan elke core in principe ook bijna niets, waar 1 CPU core bijna elk mogelijke instructie uit moet kunnen voeren, daar kan bij deze chip elke core maar één speciefieke functie uitvoeren...

Beetje appels met peren vergelijken hè? :Y)
Ik krijg zolangzamerhand sterk de indruk dat de techniek harder gaat dan de software die er voor ontwikkeld (kan?) worden.

Zonde!:?
Kan moeilijk helemaal andersom...
Inderdaad.... en water is nat.
Inderdaad.... en water is nat.
Echt waar??? :D

Hmmm. Misschien zit ik toch iets teveel op T.net en GoT :P
Is niet helemaal waar.
Vroeger (ik heb het over 30 jaar geleden) werd er nog wel eens software geschreven voordat processors daadwerkelijk geleverd was.
Er werd dan puur en alleen op de specs van de processor fabrikant geprogrammeerd.
Ik denk zelf eigenlijk dat dat nog steeds wel gebeurd alhoewel procs tegenwoordig wel een stuk complexer zijn geworden.
Waarom zetten ze dit ding op een PCI-X kaart? PCI-E is dan toch veel boeiender lijkt mij?

Laten we eerlijk zijn, wie heeft er nou nog PCI-X in z'n bak hangen?
waarschijnlijk de mensen met servers... lijkt me duidelijk, aangezien meeste servers dit hebben (ook oudere dus)
PCI-X is toch met 3 flappen met aansluitpunten IPV de gebruikelijke 2?

Als dat zo is heb ik dat ook, daar heb ik me SCSI kaart in zitten.

Edit: Helaas voor mij, PCI-X is 4 flappen met aansluitgoud.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True