Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 34 reacties
Bron: The Inquirer

De foto van de indrukwekkende Power5 MCM (multi chip module) heeft tot veel speculatie geleid. The Inquirer heeft nu een hoop technische details verzameld om het een en ander duidelijker te maken. De MCM is opgebouwd uit vier processors en vier cachemodules. De processors bestaan uit 276 miljoen transistors verdeeld over 389 mm². In dat oppervlak zitten twee cores en drie L2-caches van 640KB per stuk verwerkt. Tussen de cores ligt een 256 bit brede ringbus die even snel draait als de processors zelf - naar schatting op 2GHz. De vier L3-cachechips draaien op halve coresnelheid en hebben ieder een capaciteit van 36MB voor een totaal van 144MB.

Iedere processor heeft een dual channel DDR-geheugencontroller aan boord, waardoor iedere MCM met maximaal acht kanalen (512-bits) DDR gevoed kan worden. Hoewel één MCM al goed is voor acht fysieke (zestien virtuele) cores, is de hele architectuur ontworpen om probleemloos op te schalen in supercomputers en clusters. Twee van deze MCM's kunnen direct samenwerken via een bus op halve coresnelheid, en vier van deze zogenaamde 'books' kunnen weer samen gekoppeld worden voor een totaal van 64 fysieke cores. De prestaties van een losse core liggen waarschijnlijk al iets boven die van de toekomstige Itanium 2 9M, maar in de praktijk wordt het verschil waarschijnlijk nog groter vanwege de veelbelovende schaalbaarheid:

Hard to say how it would perform precisely, but my estimate, if things turn out well, is roughly 60% above the current 1.7 GHz POWER4+ in SPEC2000 benchmarks, or about 1,600 SPECint2000base, and 2,300 SPECfp2000base for a say 2GHz POWER5 - assuming that IBM really tunes the compilers to use the new features and limitation removals to the maximum. Now, these figures might be just a bit higher than the expected 1.6+ GHz Madison 9M Itanium2 at 533 or 667 MHz FSB, but this is a per-CPU figure, not counting the scalability in a large SMP.

IBM 8-way Power5 MCM-chip met 144MB cache
Moderatie-faq Wijzig weergave

Reacties (34)

Tja, IBM doet leuke dingen met hun power architectuur.
Vergeet niet dat de huidige G5 van Apple (aka PPC970) is ontstaan uit de Power4 core.
Ik heb zo'n donkerbruin vermoeden dat op basis van deze processor(s) de nieuwe G6 zal ontstaan.
Nu al blijkt dat de PPC970 gehakt maakt qua specint en specfp van veel intelprocessoren (hun top model 32 bits processor op 3,05 Ghz. wordt op dit moment door een 2 Ghz. PPC970 redelijk eruit gelopen).
Wordt straks nog spannend als IBM/Apple binnenkort met de 3 Ghz. uitvoering komen.
Wat ook leuk is om te weten is dat MacOS X al sowieso geschikt is om met meerdere processoren te werken.
Maximaal 64 processoren.
Apple schijnt wat tests gedaan te hebben en daaruit blijkt dat MacOS X met 16 processoren de beste schaalbaarheid houdt.
Dat is nu al te merken.
Ik heb zelf een dual G4 450 Mhz. en deze is met alles net zo snel of zelfs nog sneller dan een enkele 1 Ghz G4.
De reden is vrij simpel, maar geheel tegenstrijdig met de opvatting van veel mensen dat een diepere pijplijn ook meer snelheid oplevert.
Dit blijkt dus niet zo.
De G4 tot 533 heeft dus een 5 stage pijplijn en de G4 vanaf 667 Mhz. heeft een 7 stage pijplijn.
In de praktijk blijkt dus een kortere pijplijn sneller te wezen.
Dit verklaart ook het gebrek aan verschil tussen een P/// 1,3 Ghz en een P4 op 1,8 Ghz..
Die ontlopen elkaar niet of nauwelijks.
Nu al blijkt dat de PPC970 gehakt maakt qua specint en specfp van veel intelprocessoren (hun top model 32 bits processor op 3,05 Ghz. wordt op dit moment door een 2 Ghz. PPC970 redelijk eruit gelopen).
Dat klopt alleen als je voor de SPEC int score de score neemt zoals Apple die voor de P4 vaststelt. De SPECint score zoals intel hem gemeten heeft en opgegeven is een stuk hoger namelijk...

Wat die pippelines betreft, ik veronderstel het toch algemeen bekend dat ene kortere pipeline een hogere ipc (instructions per cycle) oplevert (dankzij ene kleinere gevoeligheid voor branche-misprediction) maar een lagere kloksnelheid. Omdat resulterende snelheid IPC * kloksnelheid is, kan een kortere pipeline tot zowel hogere als lagere snelheden leiden, afhankelijk van de kwaliteit van het ontwerp en de "branchyness" van de benchmark.

Hoe kom je er bij dat veel mensen die wel weten wat een diepere pipeline is tegelijk foutief veronderstellen dat deze automatisch tot meer snelheid leiden?
IBM is heel goed op weg meer die multi-core en multi-cpu architectuur van ze. De Power serie krijgt echt vleugels.

Het lijkt er op of ze een of andere manier gevonden hebben om die cores goed te laten samenwerken (of minder in de weg zitten).

Niet lang geleden was er ook al een topic dat ze aan een cpu werken die uit heel veel cores bestond en een TerraFlop zou moeten halen. (net als de Cell.)

En dan nog het werk wat ze voor de Cell van oa de PS3 doen. Daar zouden 16? cpu's in een package worden onder gebracht. Zouden we dan ook zo'n soort plak in de PS3 kunnen verwachten. :) Geruchten gaan dat die cpu-cores van de Cell ook gebaseerd zijn op de Power.

Misschien dat al die technologieen veel meer met elkaar verband houden.
als de cpu al zo groot is, wat dan met de koeling??? :o

Verder lijk me dit gewoonweg spectaculair, niet alleen qua looks, maar ook qua architectuur en snelheid.
Zo'n foto is al marketing op zich, want zeg nou zelf, zoiets wil je ook toch wel eens in de hand houden :9
De koeler zal wel breed en groot zijn maar door het grote oppervlak is er geen extreme koeling nodig zijn. Het is zelf een voordeel dat de CPU zo groot is want dan kan er een heatsink op, met een groot oppervlak, met daar boven op een grote koeler die niet snel hoeft te draaien = minder geluidsproductie.
noem jij de cpu groot???

lolz

zet maar eens een 8-way systeem op bestaande uit eender welke cpu, behalve de deze ... eens kijken welke het meeste plaats gaat innemen??? 1x een 120 mm Fan, of 8x (4x met dual-cores) een 80 mm Fan...

waarschijnlijk zullen ze voor deze 8cpu's wel 1 heatspreader erop gooien en daar dan een grote fan (min 120 mm) op laten blazen tegen een aanvaardbare snelheid... misschien dat het tijd wordt voor de 160 MM fans ?...

die kan je dan op 2000 rpm laten draaien en creëert zo genoeg (én stil) airflow
Wat maakte de stilte eigenlijk uit? Dit word gebruitk in server e.d Dan is de stillte niet echt van belang. De 120MM Delta (EHE) maakt ong. 60Dba aan geluid maar heeft ook een zeer groote luchtomzet. dus die voldoet ook prima :).

FFB1212EHE
Ik vraag me vooral af hoe je daar een koeler gaat op monteren.
Het lijkt me het meest eenvoudige om er een gigantisch(e) (brede) cooler op te zetten die de hele erhm "socket" omvat.
Achja, in de machines waar dit voor bedoeld is zal het wel niet aankomen op een paar decibells :Y)
Een Cray X1 CPU Blok is ongeveer net zo groot en afaik 16 cores erop. Dat blokje wordt op het mobo geklempt en met een speciaal klemsysteem komt er een waterdichte klem om en rond de socket. De hele processor wordt opdeze manier onder hoge druk met gedestileerd water gekoeld.
Deze ziet echt te wauws uit... Maar deze post lijkt een beetje erg veel op een post van vorige week met wat meer info... Hoop dat IBM de snelheid een beetje bij kan houden met de Intel Xeon..

[zeik modus]
klein spelfoutje:
veelbevolvende
[/zeik modus]
Ik denk dat deze proc ook niet echt als concurent voor de Xeon is bedoeld maar meer als proc voor een of andere super computer. Ik denk dat we hem daarom ook wel in een iets andere prijsklasse kunnen plaatsen :P
Ik weet zeker dat deze proc in zijn eentje sneller is dan welk willekeurige Xeon systeem je kunt bouwen dat draait zonder cluster software. De Power 4 is in zijn eentje op 1.7 Ghz natuurlijk al veel sneller in FP dan en bijna net zo snel in int als de Xeon 2.8 MP, maar schaalt veel beter zodat hij in 4+ proc machines al beduidend sneller is. Laat staan dat dit schaalbaarheidsmonster de Xeon ver achter zich laat in echte server-applicaties (met veel parallelle threads).

PS: tenzij je hem wilt benchmarken op quake 3 o.i.d. daar zou de xeon best wel eens sneller kunnen zijn.
hoe in HEMELSNAAM wouden ze dáár een socket voor maken. Hoeveel pinnetjes? Een Opteron heeft 940 pinnen nodig, dit dingetje is nog ietsje complexer, laten we zeggen: per core 1000 pinnen, dat wordt dan een socket-8000 plankje AUB. Doe me d'r ook maar 2 voedingen in PowerRaid0 bij...
5400 actieve pins heef'tie
waarvan 2313 singaal en 3057 stroom pins.
Nee nee nee..

geen powerraid man.. maar

RAEPS..

Redundant Array of Expensive Power Supplies.

denk dat dit beesie wel wat vermogen lust.
Ik vind de naam wel erg misleiden '8-way' terwijl er maar 4 processoren in zitten. Ook het plaatje lijken het er 8 te zijn :s.

Verder denk ik ook wel dat hier toekomst in zit; meerdere cpu's integreren in een eeeh ding :+.

[edit]
Dual cores -> Hmm dan snap ik het toch niet helemaal ik dacht dat dit totaal juist een kwarter-core of 8-way-core cpu was.. Dus je maakt een processor met daarop dual core cpu's?

De andere 4 cache geheugen:
De processors bestaan uit 276 miljoen transistors verdeeld over 389 mm². In dat oppervlak zitten twee cores en drie L2-caches van 640KB per stuk verwerkt
Ik lees dat als dat een van de 8 'vakjes' zowel 2 cores als een kleine 2Mb chache bevat. dan blijven er nog steeds 4 'vakjes' over IMO
het zijn niet 4 procs het zijn dual cores.. dus niet zoiets als xeon doet met hypertrading maar daadwerkelijk 2 cores op 1 die of hoe je dat dan ook schrijft dus misleidend is het niet.. + je kunt dit in de toekomst zeker meer verwachten van andere bedrijven
en als het goed is zou deze dan ook nog is een IBM variant krijgen op HT waardoor je OS 16 procs zal zien :9~
Als je het verhaaltje nog es leest, had je geweten dat elke cpu uit 2 cores bestaat, dus de 4 grote chips hebben 8 cpu's bij elkaar, ook had je dan gelezen dat de andere vier het cache geheugen is
De processors bestaan uit 276 miljoen transistors verdeeld over 389 mm². In dat oppervlak zitten twee cores en drie L2-caches van 640KB per stuk verwerkt
Ik lees dat als dat een van de 8 'vakjes' zowel 2 cores als een kleine 2Mb chache bevat. dan blijven er nog steeds 4 'vakjes' over IMO
klopt, dat is voor de lvl 3 Cache :-)
/offtopic
Dit is allemaal zeer indrukwekkend MAAR:
-hoeveel vermogen trekt het beestje?
-dus: hoe zwaar moet er gekoeld worden?
-is het mogelijk om in de nabije toekomst deze in een desktop te plaatsen ;)
-hoeveel }:O kunnen grazen op één zo'n weitje?
-wat mot -t kosten?
-gaat-ie ook schaken tegen Karpov :Y)
/offtopic

Even serieus, dit zijn getallen die staan. Als deze chip in productie wordt genomen kunnen we wel inpakken met 72-bits versleuteling en is een Gbit netwerk nog niet genoeg om alle data die hierdoor gegenereerd wordt te kunnen transporteren.
Deze wordt watergekoeld door IBM.
Luchtkoeling is echt onmogelijk ;)
Dat ding zal best veel vermogen verbruiken en dus veel warmte afgeven. Maar het totale oppervlak is ook behoorlijk groot dus warmte-afvoer hoeft niet direct een probleem te zijn.
Wel zal daarvoor een flink koelblok met bijpassend grote ventilator(s) nodig zijn. Dat zal dan wel wat extra kosten, maar ik denk niet dat er sprake is van een 'warmte-afvoer bottleneck'.
Hmmzz ....
Deze hardware is natuurlijk alleen interessant als de software net zo goed is.
Ik denk dat als je deze hardware mag gaan beheren en je zet er AIX 5.2 of wellicht in de nabije toekomst AIX 5.3 op en je verdeeld de 8 cores over de verschillende DLPAR's vanaf de HMC om ze vervolgens in een 1600 cluster te hangen. Dat je toch de indruk krijgt meer met een Z-serie dan met een P-serie te doen te hebben.

d'r is vast wel iemand die dit in normaal Nederlands wil vertalen :+
vor welke markt is deze cpu gericht? wanneer krijgen we deze in onze computers?
IBM kennende zullen wij de komende 10 jaar écht niet zo'n proc kunnen aanschaffen, IBM target vooral mainframe en supercomputers en wees nu eerlijk, welke tweaker heeft IBM speelgoed ?

Het heet niet voor niets "International Business Machines" !

IBM is absoluut een grote en ook innovatieve speler in het ICT wereldje, maar reken er maar niet op dat wij kunnen spelen met dat leuks op korte termijn, tenzij je systeembeheerder of programmeur bent bij een bedrijf/stichting/whatever die dit nodig hebben.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True