AMD Hammer performance schatting

Guru Paul DeMone heeft op het forum van Real World Tech een aantal berekeningen gedaan met betrekking tot de performance van de AMD Hammer. Ten eerste wordt gekeken naar wat voor soort kloksnelheid we kunnen verwachten. Als uitgangspunt is de snelheid van de Athlon XP 2000+ genomen, en daarbij zijn de voordelen van een langere pipeline, het 0,13 micron procédé en de SOI technologie opgeteld. In het begin zou dit 35% winst op moeten leveren, en met het volwassen worden van de techniek loopt dat op tot 45%. Uitgaande van 1667MHz als top voor de 0,18 micron K7 bereikt de eerste generatie Hammer dan tussen de 2,25 en 2,42GHz zijn top. Als de geruchten over de 1733MHz Palomino waar zijn, dan komt er 2,5GHz uit deze som.

Ook over de IPC wordt nagedacht, wat de invloed van de onboard geheugencontroller, de verbeterde frontend (branch predictor etc.), het snellere en grotere cache van de SledgeHammer en natuurlijk de x86-64 uitbreiding zal zijn op de prestaties. Hij schat dat een 2,25GHz ClawHammer 1150 en 800 punten behaalt voor respectievelijk SPECint en SPECfp tests, hierbij overigens wel uitgaande van x86-64 optimalisaties. SledgeHammer komt hoger uit, deze haalt 1200 en 1050. DeMone vermoedt dat de op de roadmaps genoemde ClawHammer 3400+ op 2GHz draait, en dat de 4000+ een 2,25GHz chip wordt:

Microarchitectural gains:
biggest difference is on-chip memory controller. If we assume best of class K7 chip sets average 100 ns access for ~50% page hit mix and moderate traffic and integrating the memory controller shaves 30 ns (probably a bit generous) off read latency, and integer app performance scalability is 60%, then speedup is approximately 1/(0.6 + 0.4*(70/100)) or 19%. Assume othe efficiencies like better buffering and round that to 20%. For larger cache/wider memory Sledgehammer, I'll say 25% bump for integer apps. FP apps are much more bandwidth sensitive than latency sensitive so I'll apportion 5%/40% for Claw/Sledge.
The improved front end I'll apportion 5%/0% for int/FP apps.
for x86-64 compiled apps I'll apportion 5/10% for int/FP apps from increased number of GPRs available and other efficiencies.

Reacties (50)

Verwijderd 9 maart 2002 16:43

"Als de geruchten over de 1733MHz Palomino waar zijn, dan komt er 2,5GHz uit deze som."

Ik heb daarstraks een mail van AMD gehad dat de AMD XP 2200+ er zeker komt en dit in het midden van April. Zeker en vast een Palomino...

bobsnl @Verwijderd • 10 maart 2002 01:07

Als de geruchten over de 1733MHz Palomino waar zijn, ......

Zo te zien lijken de geruchten idd waarheid te worden. Op deze Amerikaanse site kan je al een pre-order plaatsen:
http://www.pcclub.com/promo/p_a1906281.htm

XWB Developer @Verwijderd • 9 maart 2002 16:44

Denk ik niet. De 2100+ (1733 MHz) zou de laatste Palomino zijn.

Auteur

Wouter Tinus 9 maart 2002 16:44

De AMD PR rating is gebaseerd op de oude Thunderbird core, niet op de Pentium 4. Hammer krijgt waarschijnlijk een *iets* aangepaste versie van het systeem (M3400 versus 3400+), en deze zou volgens Paul DeMone gebaseerd kunnen zijn op SPEC resultaten.

Ludewig @Wouter Tinus • 9 maart 2002 16:53

een *iets* aangepaste versie van het systeem (M3400 versus 3400+)

Hopelijk gaat AMD hiermee snel over naar slechts één rating-systeem. Nu worden er nog oude Thunderbirdjes verkocht met MHz-aanduiding, XP's en MP's met XXXX+ aanduiding en straks krijgen we ook nog een MXXXX aanduiding?

* 786562 wfzelle

XWB Developer 9 maart 2002 16:35

Een ClawHammer 3400+ op 2GHz is dus zo goed als een Thunderbird op 3400 MHz?

Ludewig @XWB • 9 maart 2002 16:39

Voor diegenen die nog vragen hebben over de PR-rating:

Benchmarking and Model Numbering Methodology
http://athlonxp.amd.com/includes/content/whitePapers/benchmarkingModel Numbering.pdf
Understanding Processor Performance
http://athlonxp.amd.com/includes/content/whitePapers/understanding.pdf
Algemene meetopstelling:
http://athlonxp.amd.com/benchmarks/benchmarkCertification.jsp

AMD runt dus ruim 30 benchmarks en vergelijkt de uitkomsten met die van de 'oude' Thunderbird.

sonix666 @Ludewig • 9 maart 2002 16:50

Nee, de persoon is correct, AMD heeft hun model rating gebaseerd op performance ten opzichte van de Athlon Thunderbird. Dat die toevallig overeenkomt met een P4 op DIT moment is 'puur toeval'.

De P4 is ook aan veranderingen onderhevig, dus dan zou AMD zogenaamd iedere keer als de P4 door een architectuur verandering beter presteert hun volledige model rating voor iedere CPU moeten aanpassen.

Verwijderd @sonix666 • 9 maart 2002 16:58

Mwja lijkt me wel dat ze de model ratings opbouwen aan de hand van de prestaties van de oude tunderbird maar ze hebben ze zeker wel doorgevoerd om de hogere nummers van de Intel P4's te kunnen bijhouden.

Nu persoonlijk lijkt het em wel logisch dat de meeste mensen naar een P4 kijken om te vergelijken aangezien de tunderbird ook weer niet zo populair is.
Met als gevolg dat die PR rating zometeen op niet veel meer zal slaan.
Het had sowieso geen ander nut dan een groot nummertje op je prijskaartje hebben.

porn* @XWB • 9 maart 2002 16:38

Nee je moet uitgaan van 35-45% meer performance, dus een Hammer op dezelfde kloksnelheid als een XP2000 zou als een XP2700 of XP2900 moeten performen.

XWB Developer @porn* • 9 maart 2002 16:42

En een XP 2900 komt overeen met een Thunderbird 2900 MHz. Of is het met een P4?

kalizec @XWB • 10 maart 2002 00:15

Maar de PR2900 komt per definitie overeen met de performance van een Thunderbird 2900. Moet je de andere AMD-posts van vandaag maar eens lezen.

MattH @XWB • 9 maart 2002 17:52

De performance rating komt min of meer overeen met de MHz-en van de P4, tenminste, op dit moment.

SG @XWB • 10 maart 2002 15:23

Dacht dat die 35%-45% sloeg op ClawHammer vs Palomino.

Aangezien de thunderbird geen data prefetch vooral en geen SSE heeft zoals de Palomino en P4.
Zal die op hele hoge clocken de performance steeds slecht doorschalen dus om 'n Palomino te evennaren zou een fiktieve hoog geclockte thunderbird extra hogere clock op 2000Mhz moeten hebben om 'n Palomino te evenaren op 1666.
Zie QuakeIIIA en Flask scores.

Alleen is dit natuurlijk weer erg sterk code, dus applicatie afhankelijk.

Dus 'n Athlon XP 3000+ zal performan als 'n 3000Mhz TB en 'n TB op 3000Mhz zal zwaar tegenvallen tegen 'n P4 op 3000Mhz omdat de Performance Van de Thunderbird niet linear loopt tov de CLock dan 'n P4 performance Clock ratio

In dat geval klopt de XP rating alleen heeft deze wel steeds 'n geringere waarde tegen de P4 Clock waarde

Aangezien de verhouding Hammer core thunderbird core kompleet anders is zal die formule gewijzigd worden voor de hammer M Rating ???

De Hammer core zal zich ook anders gedragen tov de TB en Palomino en dus ook P4 met betrekking tot de CPU voorkeur van wat software betrefd.

Horus @XWB • 9 maart 2002 16:39

Nee, hij zou net zo goed moeten zijn als een P4 op 3400 Mhz

edit:

hmm jullie zijn wel erg snel hoor

XWB Developer @Horus • 9 maart 2002 16:40

En deze 3400+ komt ongeveer rond de tijd dat Intel de 3 GHz uitbrengt. Dan is AMD weer sneller.

Helox-in-a-box 9 maart 2002 16:41

nee net zo snel als een intel op 3,4GHz. PR-rating is gebaseerd op hoe snel intel processoren zijn

Cookie @Helox-in-a-box • 9 maart 2002 17:36

1. Officieel is de P-Rating van AMD gebaseerd op de Tb's, aldus AMD.
2. Officieus, maar marketingtechnisch is het wel degelijk gedaan om de vergelijking met de P4 door de consument aan te kunnen.
3. Welbeschouwd is de P-Rating van AMD echter onjuist. Een XP is een vaste factor sneller dan een Tb, maar AMD berekent als volgt: Clocksnelheid (MHz) x 1,5 - 500MHz = XXXX +

Doordat consequent 500Mhz wordt afgetrokken van de procentuele toename, zal de P-Rating steeds harder oplopen. Nu klopt het nog vrij aardig met de vergelijking tov P4, maar stel dat een Athlon XP ooit op 3GHz zou draaien, dan zou volgens de berekening van AMD deze een PR van 4000+ meekrijgen. Nu vergelijkt AMD een Athlon XP 2000+ (1,667GHz) met de Pentium 4 2GHz. In het geval van de Athlon XP 4000+ is de werkelijke clocksnelheid echter 80% gestegen, bij de Pentium 4GHz is deze dan 100% gestegen. De 4GHz P4 zou dan sterker uit de bus komen in een directe vergelijking met de XP 4000+, dan voorheen de 2GHz P4 t.o.v. een XP 2000+.

Nu zal het niet zover komen waarschijnlijk, en er zullen weer de nodige veranderingen in de chips en chipsets komen, dus de kaarten worden dan weer opnieuw geschud. Ik ben benieuwd of ze die P-Rating kunnen handhaven. Bij hogere clocksnelheden zal die 500MHz die afgetrokken wordt steeds minder meespelen en gaat de P-Rating steeds meer richting de vergrotingsfactor van 1,5. Het kan zijn dat AMD inschat dat ze hun cores met extra cache en SOI e.d. voldoende sneller maken dan voorheen, zodat dat sommetje nog steeds blijft kloppen t.o.v. Pentium 4. De vergelijking met een Tb is niet meer zo relevant, omdat een consument die vergelijking inmiddels ook niet meer maakt.

SG @Cookie • 9 maart 2002 23:55

Aangezien na 3400+ de Hammer met de M3400 rating inspringd die weer een andere formule gebruikt zullen de Bartons tot 3200+ hooguit relevant zijn

Aangezien 4000+ denk ik niet zal komen maar zeker wel M4000 en hoe ze daar aan komen is nog 'n raadsel maar dat horen we nog wel.

Zodra de Claw hammer gereleased wordt worden de Athlon XP midrange CPU's

Verwijderd 9 maart 2002 16:37

heeft iemand die dit "nieuws" op eender welke site heeft gezet eigelijk wel die post gelezen ?

Now remember folks that is a 15 minute, back of an envelope
calculation/estimate/WAG and 5 minutes was taken to find the
envelope. ;-)

ik vind dat hier veel te veel gewicht aan wordt gegeven, en Paul DeMone vindt dat waarschijnlijk ook

Femme UX Designer @Verwijderd • 9 maart 2002 16:39

Volgens eerdere speculaties zou de 2GHz ClawHammer als een 3400+ moeten presteren. De resultaten van de schatting van Paul DeMone komen hiermee overeen en dat is wél interessant.

jochemd @Femme • 9 maart 2002 17:43

Ik denk dat de resultaten van Paul een hoog "we weten wat de uitkomst moet zijn en gaan er naar toe rekenen" gehalte hebben. Dat is vaak het probleem met dergelijke berekeningen en hoeft ook helemaal niet bewust te gebreuren.

Ik ben niet echt onder de indruk van deze schattingen. Als een andere compiler gebruiken (Intel ipv gcc) al tot resultaat kan hebben dat de performance in bepaalde gevallen verviervoudigd (en een procentje of 10 verbetert in het algemeen) dan vind ik de paar procent die er in Paul's artikel geschat worden voor een dergelijke optimalisatie in het niet vallen.
Het wekt bij mij de indruk dat de foutenmarge van de schatting groter is dan de prestatieverbetering.

De toekomst zal het leren, maar ik ga er niet speciaal op wachten ofzo.

Auteur

Wouter Tinus 9 maart 2002 16:41

De schatting van Paul DeMone is duidelijk lager dan die van AMD zelf, maar de Hammer zou met deze cijfers nog steeds boven McKinley uitkomen, zelfs wanneer gunstig geschat wordt in het voordeel van Intel. Het wachten is echter op onafhankelijke en concrete cijfers (van beide chips), en men moet natuurlijk niet vergeten dat ze geen directe concurrenten zijn van elkaar. De ClawHammer is meer een concurrent van de Pentium 4 en Xeon DP. SledgeHammer zit in het segment van de Xeon MP.

SG @Wouter Tinus • 9 maart 2002 18:38

De SledgeHammer in het segment van de Xeon MP?

Misschien tov het kostprijs plaatje wel ja
Maar 32bit vs 64bit is een andere leage.

De Sledge zal ook als prijsbewuste instap alternatief voor de zware 64bits servers kunnen gepositioneerd worden dus ook tegen Itanium en McKinley

Het is toch echt ook 'n 64bitter net als die andere platformen

max3D @Wouter Tinus • 10 maart 2002 17:06

Je schrijft: "Hammer zou met deze cijfers nog steeds boven McKinley uitkomen"
Je kijkt dan dus puur naar de integer performance? De floating point prestaties van McKinley zijn immers van een andere klasse.
Ik zet de (geschatte!) cijfers voor de verschillende toekomstige processors even op een rijtje met hun clocksnelheid en respectievelijke SPECint_base2k en SPECfp_basefp2k scores:

McKinley 1.0 Ghz 800/1400
ClawHammer 2.25 Ghz 1150 / 800
SledgeHammer 2.25 Ghz 1200 / 1050
P4/3000 (400 FSB) 1000/900
P4/2933 (533 FSB) 1100/1050
P4/3467 (533 FSB) 1200/1150
de P4 cijfers zijn geschat op basis van de roadmap van Intel en zouden shipping processors moeten zijn op het moment dat Claw uitkomt.

Je ziet dat McKinley qua fp performance nog flink boven de rest uitsteekt en vergeet niet dat dit op een conservatieve 1.0 Ghz gebaseerd is. Het zou me niets verbazen als McKinley eind van dit jaar op 1.2 Ghz zit.

Max|IA² 9 maart 2002 16:39

Heel leuk en aardig maar proberen te voorspellen hoe de performance gaat worden is eigenlijk zinloos.
Gewoon samples testen en daaruit conclusies trekken.
Wij tweakers willen feiten en geen "sprookjes".

Femme UX Designer @Max|IA² • 9 maart 2002 16:41

Nou, ik denk dat heel veel tweakers nu al willen weten hoe ClawHammer zal presteren. Samples testen is onmogelijk en dus moeten we het houden bij schattingen.

Se7enth_son @Femme • 9 maart 2002 17:24

Ik vind het niet echt nuttig om nu te gaan voorspellen wat die Hammers voor performance zullen gaan bieden. Dat kun je pas doen als het hele platform klaar is en je gewoon de hardware in je hand hebt. Want misschien is die chipset wel erg brak, of zit er een kleine fout in het ontwerp ofzo. Er zijn zat mogelijkheden die de performance misschien negatief beinvloeden.
Een goed voorbeeld is de P4. Toen ie nog niet uit was dacht iedereen dat het the best of the best zou zijn, en dat blijkt nu ook een beetje tegen te vallen (helaas). Dus ik geloof al die verhalen pas als ik gewoon heb gezien dat ie het aankan, en niet omdat iemand een beetje interessant loopt te gokken over hoe hij denkt dat het wel eens zou kunnen worden.
Sorry, maar da's voor mij te vaag...

SG @Se7enth_son • 9 maart 2002 18:32

Vind ik ook veel speculaas dan Over Hype en dan de teleurstelling mede door de Hype.
Ik zie wel in 2003.

Focus me nu op de Thourougbred. Die bevaling is binnenkort.

Verwijderd 9 maart 2002 16:51

de voordelen van een langere pipeline

wat zijn die dan ? de kloksnelheid kan omhoog, i guess, oleej.. maar snelheid levert dat niet op.. dus wat zijn de voordelen ?

Ludewig @Verwijderd • 9 maart 2002 16:57

5% bump from 12 stage pipeline (extra stages mostly for IPC
gain and for handling extra complexity of x86-64)

IPC: instructions executed per clock
Performance = IPC x Clock speed

Verwijderd @Ludewig • 9 maart 2002 16:59

thanx

duke99 10 maart 2002 02:05

en daarbij zijn de voordelen van een langere pipeline het 0,13 micron procédé en de SOI technologie opgeteld

Als ik het goed heb(correct me if I'm wrong), heeft de PIV ook een langere pipeline(7 stappen). Dit is ook meteen het 'nadeel' van een P IV. Hij is hierdoor langzamer in applicaties die geschreven zijn voor een 5 stappen pipeline. Als de Hammer dit ook krijgt dan heeft hij toch hetzelfde nadeel? Dan kan die hele rating niet meer meegonomen worden ten op zichte van de P IV(wel t.o.z van de thunderbird).

Maar ik hoor het wel als ik het fout heb

SG @duke99 • 10 maart 2002 13:02

Dacht dat
P4 20 stappen
K8 12 stappen
K7 10 stappen
PIII <10 stappen

De P4 heeft dus een extreem lange pipe line dan die anderen en dan zullen de voor en nadelen ook extremer worden.
*)'n voordeel Clocked makkelijk hoog, Clock schaald lekker door.
*)'n Nadeel door de hoge Multyplyer en Branch misprediktion penalty is ie er gevoelig voor Branch intensieve code.

TheDuke 9 maart 2002 16:45

Nu blijkt waarom AMD die PR rating (moest instellen)/(ingesteld heeft). Zonder die PR rating zouden ze zich qua Mhz belachelijk maken bij de klant.

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (50)

Sorteer op:

Weergave: