Diepgaand artikel over de Hammer architectuur

Verwijderd was nog niet klaar voor vandaag, en kwam ook nog met dit artikel aanzetten. Het gaat om een stuk tekst van Hans de Vries over de Hammer architectuur, en hoe AMD het aantal instructies per cyclus heeft verbeterd ten opzichte van de Athlon. De pipeline is twee stappen langer geworden, nieuw zijn de operaties 'pack' en 'decode', die zorgen voor een betere verdeling van instructies over de pipelines en het mogelijk maken om een operatie tijdens de berekingen van 'baan' te laten verwisselen. AMD zelf is vrij vaag over hoe ze dit precies bereikt hebben, maar op basis van de diagrammen en zijn eigen expertise wijst De Vries vijf mogelijke punten aan die relatief eenvoudig te verbeteren waren aan de K7 core. Geen lichte stof, maar wel degelijk interessant voor diegenen die willen weten hoe AMD in korte tijd een snellere core dan de Athlon kon ontwerpen. De conclusie is als volgt:

The (optional) performance improvements listed above show that a significant performance improvement can be achieved over the Athlon K7 core. A core that was after-all conceived and implemented in record time. All these improvements are further very 'cheap' in terms of transistor count and power dissipation.

They are chosen so that they can be realized within the extended pipeline of the K8 that includes two extra pipeline stages between instruction decoding and dispatching.

Reacties (21)

cougare 27 juni 2002 14:24

Die Hammer is toch wel een core waar naar uitgekeken moet worden hoor.
Ik verwacht een overstap (misschien wel geleidelijk aan ) in de trend van vroeger de 486 naar de 586 (pentium I)

RobT @cougare • 27 juni 2002 15:01

Daarbij wil ik toch wat vraagtekens zetten, oa dat bv AMD niet dezelfde productiecapaciteiten heeft als intel...

Zou wel leuk zijn verder....

Verwijderd @RobT • 27 juni 2002 15:28

Productiecapaciteiten of niet, wat ze tot nu toe hebben laten zien/horen over de hammers kun je toch wel revolutionair noemen.

Volgens mij een minstens even grote stap als van 486-Pentium, de 386 was al 32-bits, nu gaan we eindelijk naar de 64.

[edit] Trouwens, ik ben dat gezeur over de capaciteiten van AMD beu. Ze hebben met de K7 bewezen dat ze in no time een supersnelle, vernieuwende en bovendien stabiele processor in elkaar kunnen zetten. Maar elke keer als er weer wat nieuws is over de ontwikkelingen bij AMD dan komen er weer brichtjes als: zal ze wel niet lukken want ze hebben niet genoeg ervaring/geld/capaciteit.

Beaves @Verwijderd • 27 juni 2002 17:58

Dat AMD niet genoeg ervaring heeft klopt idd niet, ze hebben veel mensen overgenomen die o.a. bij Alpha zaten en die erg goed in hun werk zijn.

Maar dat AMD niet genoeg cappaciteit heeft klopt wel degelijk, ze hebben te weinig fabrieken om het huidige marktaandeel substantieel uit te bouwen, natuurlijk zal Dresden dankzij de 0,13 micron technologie meer core's kunnen produceren, maar genoeg om straks alle markten van genoeg CPU's te voorzien? Nee.

Vergeet niet dat AMD eigenlijk in de consumenten markt veel verkoopt en dat die markt af en toe al niet genoeg geleverd krijgt doordat Dresden niet meer kan produceren. Als de Hammer strak een succes wordt, niet alleen in de consumenten markt maar ook in de server en mobile markt, dan heeft AMD idd een probleem met de cappaciteit die de fabrieken hebben.

(Even ter illustratie, Intel heeft (als ik het goed heb) 13 fabrieken, AMD sinds de opheffing van Austin als CPU fab "maar" 1).

Dat AMD te weinig geld heeft klopt ten dele, door de lage ASP van de huidige CPU's maakt AMD verlies, maar als de Hammer idd een succes wordt en de ASP gaat omhoog, zal het niet lang duren voordat AMD zwarte cijfers gaat maken.

Verwijderd @Verwijderd • 27 juni 2002 23:46

AMD zelf heeft idd niet de productie capaciteit, maar volgens mij hebben ze een deel van de productie uitbesteed aan zowel UMC als TSMC.
Hierdoor kunnen ze dus wel degelijk de verwachte groei opvangen.

Hier een link naar een eerder artikel hieover
http://www.tweakers.net/nieuws/20370?highlight=amd

Verwijderd @Verwijderd • 28 juni 2002 00:42

Wie heeft het hier dan over hoe goed AMD de vraag naar de Clawhammer zal kunnen opvangen?

Het ging erom of de overgang k7 naar k8 groter of kleiner zou zijn dan die van de 486 naar de pentium, niet hoe snel AMD de markt kan verzadigen met klauwhamers.

Verwijderd @cougare • 27 juni 2002 15:33

Van 486 naar 586 was niet de overstap van 16 naar 32 bit. dat is meer zo iets van p2 naar p3. Ik weet niet welke cpu 16 bit was maar die overstap is groter omdat de procesor veel meer kan.
Een 32bit cpu kan de aplicaties van de toekomst (als die 64bit zijn) niet eens uitvoeren.
maar qua peformance is de vergelijking tussen 486 en 586 goed.

Major 7 @Verwijderd • 27 juni 2002 16:00

Van 486 naar 586 was niet de overstap van 16 naar 32 bit.

Nee dat was de 386 (als ik me goed herrinner)

sweetdude @Major 7 • 27 juni 2002 16:29

Zover ik weet was het:

8086 in 1978 uitgebracht 29.000 transistors 1MB maximaal geheugen databus 16bit adresbus 20bit.
8088 in 1979 uitgebracht 29.000 transistors 1MB maximaal geheugen databus 8bit adresbus 20bit.
80286 in 1982 uitgebracht 134.000 transistors 16MB maximaal geheugen databus 16bit adresbus 24bit.
80386DX in 1985 uitgebracht 275.000 transistors 4GB maximaal geheugen databus 32bit adresbus 32bit.
80386SX in 1988 uitgebracht 275.000 transistors 4GB maximaal geheugen databus 16bit adresbus 32bit.
80486DX in 1989 uitgebracht 1.200.000 transistors 4GB maximaal geheugen databus 32bit adresbus 32bit.
80486SX in 1989 uitgebracht 1.200.000 transistors 4GB maximaal geheugen databus 32bit adresbus 32bit.
pentium 60/66 in 1993 uitgebracht 3.100.000 transistors 4GB maximaal geheugen databus 64bit adresbus 32bit. incl. originele pentiumbug

pentium 75/100 in 1994 uitgebracht 3.300.000 transistors 4GB maximaal geheugen databus 64bit adresbus 32bit.
pentiumPRO in 1995 uitgebracht 5.500.000 transistors 64GB maximaal geheugen databus 64bit adresbus 36bit.
pentium MMX in januari 1997 uitgebracht 4.500.000 transistors 4GB maximaal geheugen databus 64bit adresbus 32bit.
pentium II in 1997 uitgebracht 7.500.000 transistors 64GB maximaal geheugen databus 64bit adresbus 36bit.

De 80486 SX en DX zit het verschil in de DX met mathematischeprocessor en cach en de SX zonder.

Verwijderd @Major 7 • 27 juni 2002 16:23

De overstap van 16 naar 32 bits werd genomen met de 386DX (de SX was, net als de 286, nog steeds 16 bits).

Gosu @cougare • 27 juni 2002 16:30

De 386 was de eerste volledig 32 bits machine (data en adres)

we zitten dus al een tijdje aan 32 bits vast, maar ik geloof dat dit niet zo'n grote verbetering wordt als toen, vergrtoing van bitrate is niet direct gelijk aan performance verbetering

(jaren op gewerkt the good-old 386

)

(edit: tja ok kijk maar boven deze post

)

Verwijderd 27 juni 2002 15:03

En hier nog een keer de tabel met kloksnelheden:
home.planet.nl/~zeldafreaks/

Brainwaste @Verwijderd • 27 juni 2002 15:12

Dankje wel, daar hebben we nog eens wat aan.
Goeie overzichtelijke tabel, maakt het een en ander wel een stuk duidelijker denk ik

Verwijderd @Verwijderd • 27 juni 2002 20:16

Mooi lijstje.
Ik snap het alleen niet.

M1500 333 MHz

en daarna is elke 66Mhz 100Mhz waard, net als de overige processoren. Dat kan toch niet?

leuk_he 27 juni 2002 16:29

Ik vind de nadelen toch een beetje kort door de bocht. er wordt de suggestie gewekt: meer stages betekend meer ipc. Maar de P4 heeft 20 stages maar doet toch minder ipc (Heel veel minder als je bedenkt date de P4 intern 2x zo hoge kloksnelheid heeft)

Nadelen van een grotere pipeline: Bij een branch prediction fout duurt het langer voordat de pijp weer vol is.

Er wordt in de tabel (zie ander bericht) ook de suggestie gewerkt dat de MHZ lager zullen zijn. Zo simpel en goedkoop zijn deze uitbreidingen dus ook niet, het gaat in de hammer dus ten koste van MHZ'en.

Femme UX Designer @leuk_he • 27 juni 2002 17:53

Zoals je hierboven en in het artikel hebt kunnen lezen zijn de extra stages juist bedoeld om de IPC te verhogen, omdat instructies in de pipelines niet meer gefixt worden op één pipeline (maw ze mogen switchen van pipeline als dat beter uitkomt). De vergelijking met de enorme pipeline van de P4 is niet op zijn plaats.

Er wordt in de tabel (zie ander bericht) ook de suggestie gewerkt dat de MHZ lager zullen zijn. Zo simpel en goedkoop zijn deze uitbreidingen dus ook niet, het gaat in de hammer dus ten koste van MHZ'en.

In die tabel heb je kunnen lezen dat de ClawHammer een kloksnelheid van 2GHz krijgt (model rating 3400+). Ik heb nog geen Athlon processor gezien met een klok van 2GHz. De ClawHammer zal dankzij SOI e.d. juist beter kunnen schalen naar hogere kloksnelheden.

SG @leuk_he • 27 juni 2002 18:50

Intel heeft voor 20 stappen gekozen om zeer snelle stages te maken die dus zeer goed op snelheid zijn gebalanceerd.

Bijvoorbeeld bij de PIII zat er ene zeer zware tussen die de clock shaling erg tegen hield. 0,18 PIII tot 1Ghz K7 0,18 tot 1700Mhz

AMD heeft 2 stages toegevoegd om de efficientie van de pipelines te vergroten dus voor IPc te vergroten oa door het switchen van pipeline etc.

Dus men kan Stages toevoegen met verschillende redenen want het gaat erom wat je met die stages wilt bereiken hogere clockschaling of hoge IPC of beide of 'n compromie.

Verwijderd 27 juni 2002 14:22

Het was rustig op de weg, waardoor ik eerder op het werk was. Die tijd heb ik goed besteed.

Verwijderd 28 juni 2002 00:50

en het mogelijk maken om een operatie tijdens de berekingen van 'baan' te laten verwisselen

dat moet berekeningen zijn??

Verwijderd 27 juni 2002 18:23

Rond de tweede helft volgend jaar komt de 9 micron clawhammer uit. Deze zullen beginnen rond 4400+ zijn

Dus ik wacht nog wel effe, en dan keer ik mijn hele portemonee leeg aan een gloed nieuwe en snelle pc.
Ook wel met een nieuwe Geforce of zoiets die tegen die tijd is uitgekomen.

Verwijderd @Verwijderd • 27 juni 2002 21:08

W8en kun je altijd, er is namelijk ALTIJD wel een nieuwe technologie op komst, als je een nieuwe pc wilt/nodig hebt, moet je hem gewoon kopen (als je het geld hebt tenminste...).

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (21)

Sorteer op:

Weergave: