Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 32 reacties
Bron: Ace's Hardware

Bij Ace's Hardware is een artikel verschenen waarin wordt ingegaan op de architectuur van de Niagara-processor van Sun. Deze processor zal in het begin van 2006 op de markt verschijnen en is de eerste chip gebaseerd op het "Throughput Computing" concept. De Niagara is niet gericht om zo snel mogelijk single threaded programma's uit te voeren zoals het geval is bij bijvoorbeeld de Pentium 4 en de Athlon 64, maar is er op gericht om zo veel mogelijk threads tegelijkertijd uit toe voeren. De Pentium 4 kent natuurlijk wel HyperTreading als soort van tussenoplossing, maar de mate van parallelliteit van de Niagara wordt bij lange na niet gehaald. De Niagara is een 340 vierkante millimeter grote chip uitgerust met een achttal processorcores die elk vier threads tegelijkertijd kunnen verwerken. Hiermee komt het aantal threads dat tegelijkertijd verwerkt kan worden op maar liefst 32.

Hierdoor kunnen bepaalde problemen omzeild worden waarmee traditionele processors kampen zoals hoge performance penalty's bij branch mispredictions en stalls door bijvoorbeeld geheugen latencies. De Niagara-processor zal in het geval van een stall van een thread simpelweg over kunnen schakelen naar een andere thread waardoor de rekenkracht efficiŽnt benut kan worden. Daarnaast zullen branch mispredictions minder vaak voorkomen omdat er in het geval van een thread waarbij gegokt moet gaan worden welke instructies nodig zijn eerst overgeschakeld kan worden na een andere thread. Onder andere dankzij deze voordelen claimt Sun dat de chip maar liefst 30x zo snel zal zijn als een 1,2GHz UltraSPARC III. Hoe de Niagara-chip in de praktijk zal gaan presteren is uiteraard slechts gissen, maar de architectuur heeft in ieder geval potentie. Sun is echter niet de enige fabrikant die de potentie van deze techniek ziet, ook AMD, Intel en IBM zijn bezig met de ontwikkeling van multicore/multithreading chips.

De plek van de Niagara-chip in de rest van Sun familie
Moderatie-faq Wijzig weergave

Reacties (32)

ik ben benieuwd of sun nu wel meer inside info gaat vrijgeven over hun hardware. met de sparc III deden ze dit dus niet en was er voor de linux omgeving een groot probleem om hier een goede aanpak op te verzinnen.
daar in tegen 8 cores die ieder 4 threads kunnen uitvoeren (32 in het totaal) in een cluster omgeving zou het goed mogelijk zijn om relatief een goedkope cluster te bouwen. mede door de 32 cores zou je veel ruimte kunnen besparen
Huh? Sparc is toch een open standaard? Alle specificaties zijn bekend.
hmm idd, ik was altijd in de veronderstelling dat sparc ook echt open was, blijkbaar niet...
Ze geven/gaven die informatie ook vrij... men moet gewoon een NDA ondertekenen. De Linux kernel-hackers deden dit en konden zonder problemen de architectuur benutten.
Voor OpenBSD was dit echter wel een probleem.
Theo De Raadt weigerde de NDA te ondertekenen. En Theo staat nu eenmaal bekend om een eigenzinnig iemand (om hem geen arrogante %$@^*& te noemen)
Als ik zo naar dat plaatje kijkt zijn die cpu's stukken sneller dan de opteron/xeon.. klopt dit?
Bedenk je wel dat deze porcessor pas in 2006 het daglicht zal zien, tegen die tijd zullen Xeons en Opterons ook een stuk sneller zijn, en beter met multi-threaded software overweg kunnen (denk aan verbeterde htt en multi-core processoren). Bovendien is dit een schattig, om je een idee te geven van wat de voordelen van deze processor zullen zijn. Over hoe het uiteindelijk precies uitpakt is nog niet echt veel bekend.

Het blijft wel een feit dat het idee van SUN heel vernieuwend is, en dat het best eens heel erg goed zou kunnen gaan werken. Wel zal software hiervoor geoptimaliseerd moeten worden, zodat er werkelijk veel threads zijn. Bij servertoepassingen is dit meestal toch al het geval en aangezien dit net DE markt is, voor deze processoren zou het best eens kunnen dat voor bepaalde taken deze processor niets van de Opterons/Xeons heel laat.
Zolang er geen samples zijn is dat plaatje pure marketing blaat.
Ik vind het heel knap dat ze nu al de performance van de de cecundary CMT kunnen voorspellen.
Meestal moet je eerst een studie doen en zo. En dat heeft SUN 'blijkbaar' plotsklaps voor handen.
Om dit mogelijk te maken is de 340 vierkante millimeter grote Niagara-processor uitgerust met een achttal processorcores die elk vier threads tegelijkertijd kunnen verwerken.
Gaaf! multi-core processors!

maar kan de software hier ook mee overweg?
(lijkt me een beetje het zelfde idee als HyperThreading, maar dan in het echt en 8 cores ipv 2)

En gaat Sun nou ook een virual machine bouwen zodat java de VM zelf ook in meerdere threads kan werken?
(nu werkt java ook wel met threads, maar als het bv. op een dual-processor pc draait, maakt de VM gebruik van 1 processor ipv alle 2)

On-die cache per core
"Fat" cores need lots of cache to reduce memory latency. TLP optimised designs are less latency sensitive, so less cache is needed.
Dit snap ik niet helemaal, iemand die kan toelichten waarom die TLP cores niet zo gevoelig zijn voor de latency?
Zodra ze een cache miss hebben gaan ze met een andere thread verder, hierdoor hoeft er niet gewacht te worden op de geheugen fetch als de andere thread tenminste geen cache miss heeft.
cache misses heb je al haast niet met ultrasparc. en als je die wel hebt dan gebruik je gewoon een erg slechte compiler.

er is namelijk een prefetch instructie (eentje die overigens mist in x86 instructieset) die het mogelijk maakt om voordat je een functie uit wil voeren alle gegevens op te halen. Als de compiler slim is doet hij dit ruim vantevoren zodat er niet een cachemiss is. overigens is hij zelfs bij een cachemiss niet eens zoveel kwijt, er wordt heel anders omgegaan daarmee dan op intel processoren.
0F 18 /0 prefetchnta
0F 18 /1 prefetcht0
0F 18 /2 prefetcht1
0F 18 /3 prefetcht2

geintroduceerd samen met SSE
De Sun JVM voor UltraSparc is wel *iets* meer advanced dan de PC x86 versie... Die is zwaar geoptimaliseerd puur voor het sparc platform en zijn multi-cpu-omgeving. Ik vermoed dat dit dingetje wel gebaseerd zal zijn op de UltraSparc-architectuur, waardoor dingen bijkomend optimaliseren niet zo heel veel werk zal zijn, en wat ze dan ook wel gegarandeerd zullen doen...
Hum, hum, was er een tijdje geleden niet wat ophef toen de Solaris-afdeling van Sun kloeg dat JavaSoft niet genoeg energie stak in de Solaris/UltraSPARC JVM, waardoor de Windows en Linux versies veel sneller zijn?
De Sun JVM voor UltraSparc is wel *iets* meer advanced dan de PC x86 versie...
Valt mee hoor. Mischien voor de allernieuwste UltraSparcs. Op de Universiteit Leiden hebben we bv een 2 jaar terug een vector editor gemaakt en op zeer veel platformen getest (oa PowerPC, Wintel, Lintel en dus ook UltraSparc). De Solaris/UltraSparc performance was zeker niet de beste...
Vooral de laatste paragraaf staat me erg aan, want wat SUN zoal van plan is is weinig relevant voor ons gewone stervelingen :)

Gek eigenlijk dat men hier nu pas over na gaat denken, op een gemiddelde desktop pc draait nu al rustig een procesje of honderd. Ronduit bizar dat men nog steeds met single threaded CPU's werkt. Zelfs als je alleen met Word of zelfs maar patience zit te spelen zal er op elk willekeurig moment meer dan 1 proces om CPU tijd vragen!

Maar ja het gaat erom wat verkoopt he, stel je voor dat 1 enkele thread niet alle systeem resources kan benutten, wat een schande zou dat zijn!! En hoe moet je godsnaam uitleggen dat de snelheid komt door een aantal goed op elkaar afgestemde chips die allemaal erg goed zijn in hun specifieke ding??

Nee geef ons maar vet coole gigahertz monsters die moeten zwoegen om wat gedaan te krijgen, werken kreng ... om het met auto's te zeggen, een dikke door AMG gereviseerde Ferrari F12 in een oud kadetje met vastgeroeste wielen :+

Weet je wat ik denk, dat dat verhaal van SUN over 30x de performance van de huidige platformen best wel een waar kan zijn ;)
Een single threaded CPU was altijd een goede oplossing doordat de latency problemen e.d. altijd wel met wat meer cache konden worden opgelost. Daarentegen waren multicore designs gewoon te complex en moet je bij multiprocessor systemen relatief veel performance inleveren tov van een single processor systeem.

Hierdoor waren (zijn) single thread processoren vaak een hele efficiente oplossing. Nu de processorfabrikanten tegen verschillende grote problemen oplopen met deze processoren is het logisch dat ze die problemen proberen te omzeilen door alternatieven te verzinnen. Een alternatief is een multicore processor. Voor Sun is het te hopen dat de performance niet erg gaat tegenvallen ťn dat de productiekosten in de hand zijn te houden. Maar in ieder geval in theorie is het de goede weg.
Echter, men zei jaren geleden ook dat RISC processoren de toekomst hadden, maar toch zijn de Athlon en P4 nog steeds vrij sucessvol ....
Ben geen expert op dit gebied maar weet wel zeker dat het hier om meer gaat dan alleen meerdere cpu's op 1 chip. Zal denk ik al heel fijn zijn als het op 'consumer' nivo leidt tot nieuwe designs die beter afgestemd zijn op multitasking en multimedia toepassingen.

En zowieso wat jij stelt geldt natuurlijke voor rauwe performance, weinig interessant buiten benches en render farm achtige toepassingen. Denk dat het vanuit het perspectief van de gemiddelde gebruiker veel beter is dat een pc 'lekker blijt klikken' als jij of je OS flink bezig is, dan dat je met de juiste settings wel 100 fps kunt halen in spel zus of zo of een kernel in minder dan 10 seconden kunt bakken .....
Ik wil het 'nieuwtje' natuurlijk niet bederven, maar wil toch nog even de aandacht vragen voor een aantal zaken:

Ten eerste heeft de niagara processor NIET meerdere CPU's aan boord, maar isset een single CPU met meerdere (8) cores. Deze cores zijn vervolgens weer voorzien van enkele CMT (concurrent multri-threading) voorzieningen, waardoor ze de gebruikte energie beter kunnen verdelen over de op de core aanwezige transistors. Deze 8 cores zijn samen nog steeds 1 'processing unit', en dus 1 CPU.

Verder is deze ontwikkeling helemaal niet nieuw. Cray gebruikt deze techniek nu al geruime tijd in hun HUIDIGE systemen (zie bijv. http://www.cray.com/products/systems/sv1/).

Dat dit concept nu ook begint door te lekken naar de grotere enterprise servers, is helemaal niks nieuws, en (wanneer je de ontwikkelingen op het gebied van supercomputing volgt) een heel voorspelbare ontwikkeling.

Zo voorspel ik dat binnen korte tijd Intel, Sun, AMD of IBM ook zal komen met een vorm van direct-dye cooling, waardoor huidige problemen met wartme-ontwikkelingen (een belangrijke bottleneck in de snelheid van systemen) straks ook een stuk minder belangrijk zullen zijn.

Alleen, ik vraag me af of een Multi-CPU, Multi-Core, direct dye-cooled concurrent multri-threading systeem wel op z'n plaats is op het bureau van Jan en Alleman.

Ik denk zelf dat dit soort exotische hardware voorlopig nog wel weggelegd zal blijven voor hele grote bedrijven met hele diepe zakken.

Maar goed, drie jaar geleden moest je voor een paar miljoen dollar een Cray kopen om over deze technologie te beschikken...straks kun je al 'volstaan' met een Sun van bijna een half miljoen euro's ;p

Lang leve de vooruitgang! ;p
Het stelt ook nix meer voor he, 340vierkante millimeter. Grofweg 18,5 mm breed en lang, en daar nog eens 8 core's ingeperst!
Sun claimt dat de chip dertig maal sneller zal zijn dan de 1,2GHz UltraSPARC III.

Ook 30 maal meer energie verbruik? En hoe snel is 30 x? 100000users tegelijk? O+
Ook 30 maal meer energie verbruik? En hoe snel is 30 x? 100000users tegelijk?
Stel even dat de Pentium 4 zo'n 3 miljoenx zoveel berekeningen kan maken als de 8086. Denk jij dat die Pentium 4 ook werkelijk 3 miljoenx zoveel stroom trekt?

Wat betreft je 2e vraag: wat bedoel je? Of deze processor 100.000 users tegelijk kan "bedienen"? Dat ligt aan de programma's die die gebruikers hebben, lijkt me zo...
even voor jouw beeld. Een gemiddeld mainframe is qua processing power te vergelijken met een 486. Er kunnen vaak 100.000-en gebruiker tegelijkertijd op een frame actief zijn....
That name may now go to "Rock," a brand new multi-core design that promises 30x the performance of a 1.2GHz UltraSPARC III and 6x that of Millennium
ja, als die processor ook 30 ( / 8 ) meer MHz-en heeft zou dat niet echt een vooruitgang zijn he?
De UltraSparc III is nooit zo laag als 40MHz geclockt. Dit zijn snelheden van Sparc I's en MicroSparcs van rond 1990. De Sparc III is van 500 tot 1000MHz geclockt.
Helder, interresant idee van sun om zo iets te doen.
Hoorde hier niet die foto bij van een AMD Thunderbird achtige processor maar dan ter grootte van een floppy?

nee dus: http://www.tweakers.net/images/20263 Dat is een processor van IBM, die er wel op lijkt: http://www.tweakers.net/nieuws/29263
Zoveel mogelijk threads tegelijkertijd??

Megatrading :+

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True