Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Je kunt ook een cookievrije versie van de website bezoeken met minder functionaliteit. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 63 reacties, 46.947 views •
Bron: The Register

IBM zal komende dinsdag zijn Power6-processor lanceren, maar de eerste benchmark is nu al uitgelekt. Het lijkt erop dat de claims over dubbele prestaties ten opzichte van de huidige generatie niet heel erg overdreven waren.

Het betreft de Oracle Applications Standard Benchmark, waarin het systeem opdracht krijgt om database te spelen voor een hele bedrijfsvoering, van bestellingen tot loonadministratie. De geteste machine heeft acht 4,7GHz dualcore Power6-processors aan boord, die ieder zijn voorzien van 2x4MB L2-cache en 32MB L3-cache. De server krijgt zijn opdrachten van twee applicatieservers die duizenden gelijktijdige gebruikers simuleren. De Power6 weet met 3000 gebruikers gemiddeld 23% sneller te reageren dan zijn voorganger met 2000 gebruikers doet. Daarnaast kan het systeem 68% meer orders per uur verwerken en 43% meer loonstroken uitspugen. Bij een vergelijkbaar aantal gebruikers (2000 vs. 2100) levert de nieuwe Power6-processor zelfs 37% snellere reactietijden, 89% meer orders en 75% meer loonstroken.

 GebruikersGemiddelde reactietijdOrders/uurLoonstroken/uur
8x Power6 4,7GHz30000,764s9475774257
27000,702s9778484270
21000,625s10683891047
8x Power5+ 2,2GHz20000,983s5639151948
18000,857s5967856818
14000,712s6189465076

Het was een eigenwijze keuze van IBM om een snelle dualcore te bouwen terwijl iedereen met quadcores bezig is. Zeker na het Intel Pentium 4-fiasco was er in het algemeen namelijk weinig vertrouwen meer in ontwerpen die het vooral van hoge kloksnelheid moeten hebben. IBM heeft dan ook een paar niet te onderschatten offers moeten maken om hoger dan 4GHz te klokken op 65nm. Zo is bijvoorbeeld het hele OoOE-mechanisme uit de core gesloopt om de complexiteit terug te brengen, wat zonder twijfel een daling van de effectieve hoeveelheid werk per kloktik betekent. Ook verbruikt de chip naar schatting rond de 170 watt, een pak meer dan concurrenten zoals Itanium (103 watt) en UltraSparc IV+ (90 watt). De verdubbeling van de kloksnelheid, grotere caches en de enorme sloot bandbreedte (75GB/s) zorgen er echter voor dat de prestaties in deze test bijzonder goed zijn, misschien zelfs wel goed genoeg om ook de prestatie/watt-kroon te pakken. Hoewel het nog even afwachten is hoe Power6 het in andere benchmarks doet, lijkt het erop dat IBM wederom een formidabele uitdaging heeft neergezet voor de concurrentie.

Update: Inmiddels is er ook een resultaat verschenen van de populairdere databasetest TPC-C, waarin IBM zijn toch al indrukwekkende voorsprong op de Intel Xeon MP met zestig procent vergroot. Helaas zijn er geen direct vergelijkbare scores van Opterons of Itaniums beschikbaar, maar het is veilig om er vanuit te gaan dat ook die behoorlijk achterblijven ten opzichte van de Power6. Met een prijs/prestatieverhouding van 3,54 dollar per transactie per minuut scoort het systeem ook beter dan de Power5+-inzending, die op 4,42 dollar uitkwam. De Xeon zit met 2,73 dollar in een hele andere prijsklasse, maar dat is dan ook te merken aan de prestaties.

TPC-C (8 processors, 16 cores)
IBM Power6 4,7GHz 1616162
IBM Power5+ 2,2GHz 1025170
IBM Power5 1,9GHz 809144
Intel Xeon MP 3,4GHz 520467

Reacties (63)

En Intel komt niet verder als 3,8 Ghz?
kunt ge niet vergelijke met intel andere architectuur...
En nVidia komt niet verder dan 600MHz, ja zo kan ik het ook...
Dat is wat anders. Die KUNNEN heus wel hoger, maar vinden het blijkbaar niet nodig.
Anders dan met Intel.
Overigens.. ze hebben het over een flop.. wat b edoelen ze daar mee? De hogere snelheden? Of is de 3,8 eigenlijk al de flop die ze bedoelen?
Als ze het voor wat betreft microprocessors hebben over FLOPS dan gaat het over "floating point operations per second".
Zoals je kunt lezen heeft IBM ook nog wel wat uit de chip moeten slopen om die kloksnelheid te kunnen bereiken. Desondanks lijkt het erop dat de hogere snelheid het gemis aan functionaliteit weer goedmaakt...

Het orginele artikel van the Register geeft overigens nog wel aan dat IBM mogelijk moeite gaat hebben om veel 4.7 GHz chips te produceren. Daarmee lijkt het in elk geval beter dan vorige week toen de geruchten gingen dat de 5 GHz bij lange na niet gehaald zou worden (nu komen ze in elk geval in de buurt; zij het misschien met moeite).
Kloksnelheid is net zo goed (misschien zelfs wel meer) een functie van ontwerp dan van het procťdť. Chips die veel logica per pipelinestap hebben klokken per definitie lager dan chips die weinig logica hebben. Ook speelt het stroomverbruik en de yields een rol. Voor een high-end serverchip kun je best lage yields en een hoog tdp accepteren, terwijl dat voor een desktopchip niet te doen is.
Afgezien daarvan draait m'n broer toch een Pentium D 950 (3.4 GHz) van ongeveer anderhalf jaar oud op 4.5 GHz met een normale Zalman Cu7700-koeler (lucht dus).

Ten eerste was dat nog niet eens het topmodel, en ten tweede zal Intel intussen z'n productie nog wat verbeterd hebben in de tussentijd.

Ik denk dus dat Intel nu in principe best een 4.7 GHz Pentium kan bouwen (zeker als ze lage yields en een hoog tdp accepteren).
Punt is alleen dat ie door een 3 GHz Core2 Duo nog steeds compleet ingemaakt wordt.

Bij IBM gelden er natuurlijk iets andere criteria... POWER-code is heel anders van opbouw, waardoor je misschien daar wel beter voor hoge kloksnelheid kunt kiezen. Het zwakste punt van de Pentium is dat hij bij branch-misses zo veel tijd nodig heeft om te herstellen. Bij rechttoe-rechtaan code, zoals video-encoding of 3d-rendering, kan ie nog steeds goed mee met een Core2, maar in veel andere applicaties wordt het niks.
De POWER-architectuur heeft misschien door de implicieite opbouw van de code minder last van slechte branchpredictie etc (zo hebben ze onder andere een linkregister en een count-register, waarvan je dus per definitie al weet dat de inhoud van dat register gaat bepalen wat een eventuele branch gaat doen... Bij een x86 weet je dat pas in een veel later stadium, en kun je het alleen een beetje voorspellen als de code ver genoeg van tevoren de uiteindelijke waarde al klaar heeft staan).
Ik denk niet dat intel nu veel betere P4's kan produceren. Een van de redenen dat men op de C2D architectuur is overgestapt, is juist de het met de P4 allemaal niet zo meer wilde.
Ik denk niet dat intel nu veel betere P4's kan produceren. Een van de redenen dat men op de C2D architectuur is overgestapt, is juist de het met de P4 allemaal niet zo meer wilde.
Niet om de reden dat ze ze niet hoger konden klokken, maar eerder om de reden dat een hoog geklokte P4 minder interessant is dan een architectuur met betere performance-per-watt.
Het is ook geen toeval dat Intel de 4 GHz niet gepasseerd is, en 'toevallig' 1 trap eronder op de 3.8 GHz is blijven hangen. Het was ook een statement van hun koerswijziging met de Core2 Duo. Technisch had een 4 GHz processor makkelijk gekund, de 65 nm-modellen hadden een behoorlijk lagere TDP dan de 90 nm-modellen, dus binnen de specs van de socket had 4 GHz makkelijk gekund.

De Pentium D van m'n broer draait dan wel op 4.5 GHz, maar nog steeds kan hij mn Core2 Duo op 2.4 GHz niet verslaan. Voor x86 is zo'n enorm hoge kloksnelheid op dit moment gewoon niet de beste manier om tot goede prestaties te komen. Dus hebben ze wat kloksnelheid opgeofferd om de IPC drastisch te verbeteren.
Desondanks zal de Core2 op 45 nm toch weer richting de 4 GHz gaan in de nabije toekomst.
Een POWER heeft gewoon sowieso al een hogere IPC dan een x86, vanwege de meer gestroomlijnde instructieset. Misschien dat dat de reden is dat IBM daar wel die enorme kloksnelheden kan verantwoorden.
We zullen het alleen niet weten, want IBM heeft geen concurrent die dezelfde instructieset gebruikt, zoals Intel dat wel heeft met AMD, en ook hun eigen mobiele afdeling. De Athlon64 en Pentium M/Core gaven aan dat die weg tot betere resultaten leidt... maar hoe komt IBM er ooit achter dat ze verkeerd zitten, als dat het geval zou zijn? Voorlopig zien de prestaties er in ieder geval goed uit.
dit is de amerikaanse manier van motoren bouwen lijkt het wel, de jappen halen 400pk uit een 2L blokkie en de amerikanen hebben 7L nodig voor 380 :+
dan hebben de jappen wel 100 nm koppel en de amerikanen 400 nm koppel. om de vergelijking af te maken :+
En om het helemaal compleet te maken, verbruiken de amerikanen 4x zo veel benzine.

Als je goed leest gaat het om de perstaties per watt en daar geeft men nog geen informatie over.

Het kan zeker zo zijn dat de prestaties per wat van ibm evengroot zijn als intel of een andere cpu. Er zijn dus meerdere wegen die naar rome voeren.
Check je facts dude. Heb onlangs nog een Corvette C6 gereden, 6.0L V8, 400pk, daar heb ik op een tank meer dan 1 op 11,5 gereden, op de snelweg met 160 km/h met uitschieters naar 250+.

Er zijn vele Europese en Aziatische motoren die half zoveel inhoud hebben en minder zuinig rijden.
Die C6 schakelt toch 4 van de 8 cilinders uit als je ze niet echt gebruikt? Dan word het toch effectief een 3L 4 cilinder. Bovendien is het een super gestroomlijnde sportwagen en geen gem. japanner.
Dat is leuke achtergrond informatie, maar niet echt van belang. Je hebt de kracht als je het nodig hebt en het verbruik valt mee (zelfde met processoren).
Dat klopt, maar dat is niet te danken aan de oh zo goede technologie die erin zit ;). Het is het gevolg van een grote slurpende machine ;)

EDIT : Zoals bbob1970 zegt
dat hebben ze dan ook weer nodig want hun autos wegen 2 keer zoveel als die van de jappen...
Maar door de 12.000 toeren van een Jap tov. de 6.000 toeren van een Muscle car mede de 600 kilo van de Jap en de 1700 kilo van de Muscle car is het toch de Jap die sneller gaat.
Komt erbij dat die gasten niet kunnen schakelen ... of erger ... een automatische koppeling hebben :o
Staat wel tegenover dat die japanner sneller op is... die amerikaan blijft lopen.. (niet dat ik amerikaanse auto's nou zo super vind.. heel niet eigenlijk...
maar er komt ook bij dat een amerikaan zo'n 5 keer meer uitstoot als een jap :Y)
Iedereen weet toch dat alleen duitsers auto's kunnen maken ;)
Alles wat de duitsers maken is perfectionistisch en technisch onevenaarbaar :)
een punt, maar het eigenaardige:
Russen zijn net zo ingesteld!
(alleen hebben ze geen geld, en zijn de meeste consumentenproducten dan ook net op maat gemaakt..)
Ik zie uberhaupt niet wat japan hier mee te maken heeft... Intel komt volgens mij ook gewoon uit Amerika. En ja AMD volgens mij ook (alhoewel ze wel een redelijk grote Fab hebben in Dresden).. Dus Japan heeft gewoon helemaal geen procesoren..

Het is dus alsof de amerikanen motoren bouwen die 7l voor 380 pk nodig hebben en de jappen die gewoon helemaal geen motor bouwen
Dus Japan heeft gewoon helemaal geen procesoren
Denk dat je iets anders bedoelt, want wat zit er er in Playstation 3? Juist, een Cell processor.
Denk dat je iets anders bedoelt, want wat zit er er in Playstation 3? Juist, een Cell processor.
De Cell ja, van IBM, en dat is dus weer Amerikaans :)
Is overigens een neefje van deze POWER-processor.
De Cell is gebaseerd op de PowerPC, wat in feite een gestripte variant van POWER is, meer gericht op PCs, embedded systemen etc.

Japanners maken ook wel processors natuurlijk, maar dat zijn meestal special-purpose processors, zoals DSPs en dergelijke. Sony, Pioneer, Panasonic, Toshiba, Hitachi etc, die maken dat soort processors.
Als ze general-purpose processors maken, doen ze dat meestal aan de hand van een bestaande open architectuur zoals bv MIPS of ARM.

Het enige Japanse bedrijf dat ik ken, dat ooit processors voor 'gewone' PCs gemaakt heeft, is NEC, met de V20/V30 (een x86-kloon).
Hitachi heeft veel processoren gemaakt, bijvoorbeeld maar niet uitsluitend voor consoles. Als je embedded systemen meetelt is Toshiba ook een hele grote. De gemiddelde Philips TV van 1985 tot 1995 had bijna altijd een Toshiba proc aan boord. In periferie zoals printers, tref je ook vaak processoren aan van Toshiba, NEC of Hitachi. Kleinere Japanse spelers zijn Sony en Fujitsu.
Flippy geeft alleen maar -in Jip & Janneke taal - aan wat de tactische keuzes van een bedrijf zijn om voor een bepaald ontwerp te kiezen :P
Vergeet alleen niet die Japanners bereiken alleen het vermogen door het toepassen van dubbele nokken assen, turbo's enz. enz. enz. (net tweakers dus :P )terwijl een Amerikaan het gewoon nog van de simpele techniek heeft

Arwin
(zelf corvette bezitter die ook gewoon 1 op 10 rijd met een 5.7 blokje)
Voor een high-end serverchip kun je best lage yields en een hoog tdp accepteren, terwijl dat voor een desktopchip niet te doen is.
Niet helemaal mee eens. Serverchips zijn duurder maar er is dan ook minder markt voor dan voor de desktopchips. De ontwikkelingskosten zijn echter torenhoog voor beidde en om deze terug te verdienen zijn hoge yields zeker belangrijk, zo kunnen de kosten immers gedrukt worden en wordt concurrentie weer gemakkelijker.

En wat staat er nu langer per dag aan? Een server of een desktop? Tuurlijk zijn er minder servers dan desktops maar het stroomverbruik van een server speelt echt wel mee.
Wel meer nog denk ik, dan bij de performancestrijd die Intel en AMD voeren nu in het high-end segment.
Niet helemaal mee eens. Serverchips zijn duurder maar er is dan ook minder markt voor dan voor de desktopchips. De ontwikkelingskosten zijn echter torenhoog voor beidde en om deze terug te verdienen zijn hoge yields zeker belangrijk, zo kunnen immers de kosten gedrukt worden en wordt concurrentie weer gemakkelijker.
Idealiter wil je natuurlijk altijd hoge yields en heb je altijd een bepaald minimum om winst te kunnen maken, maar het ging erom waarvoor het belangrijker is. Bij een high-end serverchip die 100 dollar kost om te maken en voor 3000 dollar wordt verkocht scheelt een dramatisch verschil in yields maar een paar procent in de marge, terwijl hetzelfde verschil bij een chip van 50 dollar die voor 100 wordt verkocht de grens tussen winst en verlies kan betekenen.
En wat staat er nu langer per dag aan? Een server of een desktop? Tuurlijk zijn er minder servers dan desktops maar het stroomverbruik van een server speelt echt wel mee.
Natuurlijk speelt het een beetje mee, maar hetzelfde verhaal geldt als voor de yields: voor een server van 2000 watt is 50 watt meer of minder een stuk minder relevant dan voor een desktop van 100 watt.
Idd het stroomverbruik is zwaar overtrokken. Zowel voor server gebruik als gewone computers komt het zelden aan bod om voor een andere cpu te kiezen ivm het stroomverbruik. Daarnaast stroomkosten maken nog altijd maar een klein deel uit van het totale plaatje. Al is het wel zo dat in een data-center het steeds interessanter wordt om de warmte te drukken maar daar zijn zat alternatieve oplossingen voor dan te kiezen voor een cpu die minder stookt.
Wat ik jammer vind van dit verhaal is dat de benches alleen PowerCPU's vergelijkt en dat er geen vergelijk is tussen een Itanium bv of een sparcje.
Met high-end server processoren worden waarschijnlijk geen AMD processoren bedoeld..... high-end is natuurlijk een relatief begrip. Ik denk dat in deze context, high-end meer grote Unix of mainframe systemen bedoeld worden. A la 40 processoren en meer. De verkoop hoeveelheden per systeem zijn dan honderd tallen per jaar. De yield is dan niet erg belangrijk.
En de duitsers staan met hun auto's altijd langs de weg, tegenover de rijdende jappen. :+
mini computer en hoger zoals mainframe zijn toch highend ?
micro computer en kleiner zijn midden of lager end.


doel voor highend is anders dan voor intel gebaseerde systemen. ik ben wel bereid om meer te betalen voor meer zekerheid hoor dan maakt 1000 euro meer me niet uit.
Hoe zou dat gekoeld moeten worde :D
Allereerst is het sinds e-bay, amazon en google niet meer zo dat stroomverbruik een klein aandeel heeft in de aankoopbeslissing. Google heeft op dit moment een probleem met uitbreiden van het serverpark wegens..jawel, gebrek aan stroomvoorziening, de plaatselijke stroomleveranciers zitten tegen hun max.

De komende jaren zal het stroomgebruik van servers alleen maar belangrijker worden, en ook voor desktops zal dit relevanter worden, omdat er simpelweg steeds meer pc's in huis komen te staan, en dan ook nog eens steeds meer als server, dus always-on.

Last but not least; Volgens het verhaal zou IBM met deze processor ook nog de prestatie-per-watt prijs kunnen gaan winnen, wat dus aangeeft dat de keuze voor een hogere kloksnelheid en grotere bandbreedte voor serverprocessen helemaal niet ongunstig hoeft te zijn. Als er voor het bedienen van dezelfde hoeveelheid gebruikers maar een zo'n nieuwe processor nodig is, tegenover 2 itaniums, dan is het stroomgebruik effectief 170 watt ten opzichte van 2x103=206 watt dus gunstiger.

Voor wat betreft de vergelijking met auto's.. De vraag is hier niet of je met een auto met 7 Liter ipv 2 liter 250 kan rijden, de vraag is hoeveel van die auto's je nodig hebt om een kar met 3000 gebruikers te trekken. 1 7 liter auto of 3 2 lier auto's, en dan ligt de prijs en het verbruik ineens heel anders....
de google hardware is helemaal niet zo ingewikkeld hoor, kijk maar
Ja, dat was google's "serverpark" in 1998 grappenmaker, we zijn inmiddels bijna 10 jaar verder. Ik denk dat je het aantal machines + de specs wel met 100 mag vermenigvuldigen, zoniet met 1000.
AMD heeft haar Athlons ınderdtıjd met behulp van İBM zuiniger gemaakt. İBM is wat dat betreft de heerser.
de nieuwe chip gaat nog harder. De nieuwe versie van AIX is hier voor geoptimaliseerd (dus ook de compilers)
Dit betekend met het uitkomen van het nieuwe AIX de resultaten nog beter zullen zijn.
Tja, als je een Intel Quadcore ook 170Watt geeft en hem met water of stiktof koelt, haalt ie ook veel hogere prestaties. Het was wel interesant geweest om te zien hoe een zo'n 4.7ghz IBM dual core het in businessapps doet t.o.v. de sneelse 2.93ghz Intel quad core.
Wat heeft het voor nut om een CPU die voor mainframe´s bedoelt is tegen over een desktop CPU te zetten ?

En helemaal omdat ze een totaal andere stuctuur hebben?
Om een overzichtje voor tweakers/OC'ers te fabriceren, dat zou zo'n ding toch moeten kunnen naast lonen strijken.
Hoezo is de Intel quadcore een desktop processor, er zijn toch ook quadcore Xeon's? (Clovertown).

En ja, ze hebben een andere structuur, maar toch had ik een vergelijking wel interessant gevonden. Ik had wel willen weten welke structuur-GHz combinatie de beste performance gaf.

Ik vind dat database freak een goed punt heeft hier en ik snap niet waarom hij op 0 gemod wordt en geforce5_guy op +2 inzichtvol.

Op dit item kan niet meer gereageerd worden.



Apple iPhone 6Samsung Galaxy Note 4Apple iPad Air 2FIFA 15Motorola Nexus 6Call of Duty: Advanced WarfareApple WatchWorld of Warcraft: Warlords of Draenor, PC (Windows)Microsoft Xbox One 500GBSamsung

© 1998 - 2014 Tweakers.net B.V. Tweakers is onderdeel van De Persgroep en partner van Computable, Autotrack en Carsom.nl Hosting door True