Paul DeMone over Intel Willamette

Paul DeMone van RealWorld Technologies heeft part I van zijn Intel Willamette artikel online gemikt. Dit eerste deel gaat voornamelijk over de geschiedenis van Willy en zijn welbekende voorganger; de P6 core die gebruikt wordt in de Pentium Pro, Pentium II en Pentium III en Celeron. Verder wordt de architectuur van de Willamette core globaal besproken:

Willamette is a very deeply pipelined processor. It uses 20 pipe stages to execute integer instructions including the 4 pipe stages associated with fetching uops from the trace cache. If you included the pipeline stages associated with fetching x86 code from the L2 cache, decoding it into uops, and loading uops and program mapping/flow information into the trace cache the total number of pipelines stages probably approaches 30 or more.
The branch misprediction penalty appears to be at least 19 clock cycles when the correct path is present in the trace cache. If the trace cache misses, then the branch mispredict penalty is considerably higher. This compares to a minimum branch mispredict penalty of 11 cycles for the P6 core. The P6 uses the two-level Yeh and Patt adaptive branch prediction scheme. Despite the fact that the P6 predicted branches correctly around 90% of the time it still lost about 30% of its potential performance due to branch mispredicts. Although the Willamette will no doubt use more modern branch prediction techniques like gshare and dynamic prediction strategy selection, its huge mispredict penalty will make its performance very sensitive to the efficacy of its branch prediction algorithm(s) on the particular code being run.

Lees meer

Reacties (19)

Auteur

Femme UX Designer 5 maart 2000 17:15

Nou, wat-ie ein'k zegt is dat het nog sterk afwachten is hoe Willy gaat presteren. Willy is puur gebouwd voor hoge kloksnelheid, maar is clock voor clock mogelijk niets eens sneller dan de Coppermine:

</div><div class=b4>"There is no doubt that Willamette will achieve much higher clock rates than a P6 core in the same process. The open question is whether or not it can deliver higher performance than P6 commensurate with, or exceeding, its higher clock rate. Or maybe Willamette is an expensive demonstration that microarchitectural innovation in implementations of the ancient x86 ISA have long gone past the point of diminishing returns."</div><div class=b1>
De FPU is bijv. erg zwak t.o.v. de Athlon. Intel wil dat developers hiervoor in de plaats gebruik gaan maken van SSE-2 (en dat is meteen een groot gevaar voor AMD).

JumpStart 5 maart 2000 17:33

Kunnen we in het vervolg alle AMD/Intel vooroordelen achterwege laten, behalve als het er wérkelijk toe doet ??

* JumpStart JumpStart
Lul_man, lees voortaan even goed voordat je concurenten van Intel loopt te dissen:

</div><div class=b4> What is clear is that Intel desperately needs Willamette. AMD's impressive K7 Athlon processor design is clearly more advanced than the aging P6 core. The K7 offers both higher architectural performance per clock cycle and can be clocked at significantly higher frequencies than the P6-based design manufactured in a similar process. AMD is currently poised to release a new generation of 0.18 um based K7 processors at several different price/performance points to simultaneously attack Intel at the high, middle, and low end of the x86 market. This unparalleled competitive pressure comes at a dangerous time given Intel's well known troubles ramping up the clock rate, yields, and production volumes of its P6-based 0.18 um Coppermine Pentium III, and difficulty in coming up with a widely acceptable successor to the venerable 440BX chipset. </div><div class=b1>

Niks niet 'AMD denkt bij te zijn', maar 'Intel KAN niet anders.': "Intel desperately needs Willamette". Je denkt toch niet dat ze kunnen door ontwikkelen zonder met iets nieuws te komen?

En over de Willamette: Leuk, een 'dubble pumped ALU', maar die is dus niet (Femme schreef het ook al) voor floating point berekeningen maar voor integers. En gamers zijn afhankelijk van FP...

JumpStart 5 maart 2000 17:55

ai ai, puleeease lul_man !! 24/7/365 uptime heeft geen donder te maken met processors, maar met moederboard configuraties en chipsets... Oh ja, en Operating System.

Jij als die-hard intel fan zou je dus dood moeten schamen wanneer het over uptime en servers gaat, zie het 'foutje' met de i840 chipset... De release ervan is wéér uitgesteld vanwege stabiliteits problemen.

De itanium is weer een ander verhaal. Veel deskundigen denken dat die processor heel hard gaat falen omdat het de legacy 32 bit software niet aankan zonder een hele dikke 'performance penalty'. De concurent echter (Sledgehammer dus) kan dat wel.

Zullen we vanaf nu kijken naar op waarheid gebaseerde feiten? Het doet er geen flikker toe hoe oud een processor core/architectuur is. De best presterende processor wint. Al pakken ze de i486 architectuur uit de kast om er 20, op 0,15 micron proces, op eenzelfde stukkie silicium te plakken, het te laten draaien op 2 Ghz kloksnelheid en dan het hele zaakje in een FC-PGA huisje te stoppen.

Auteur

Femme UX Designer 5 maart 2000 18:00

Dit artikel van Paul DeMone is ook wel interessant. Vergelijking tussen de geflopte i860 10 jaar geleden en IA-64 nu:

www.realworldtech.com/page.cfm?ArticleID=RWT012500000000

</div><div class=b4>In many ways Intel's upcoming launch of its IA-64 line of 64 bit RISC-like processors into the technical workstation and technical and commercial server markets is eerily reminiscent of the disastrous launch of the i860 eleven years ago. The same Intel hype and full court press by their powerful marketing department seen today was in evidence and the trade press then and now unfortunately mostly mirrored Intel's party line word for word. Most observers thought that the new processor would rapidly take share away from competing RISC processor families as easily as the x86 defeated the Motorola 680x0 line in the earlier battle for supremacy in the CISC processor market.

But an astonishing thing happened. The technical computing market basically ignored the i860 and it quickly vanished off the radar screen. Intel has apparently corrected many of its original mistakes for the launch of the IA-64 family. However, the IA-64 design is inherently far more vulnerable to deficiencies in its compilers than the i860 ever was. So its technological success is far from assured. However, considering the size of the investment and public corporate commitment Intel has placed in IA-64, and the reassurance of x86 compatibility, it is unlikely to be a commercial failure.</div><div class=b1>

P5ycho 5 maart 2000 18:33

Zo te zien neemt intel een grote gok, een snellere integer-executie mits er goed gepredict wordt natuurlijk, een behoorlijk lange pipeline, en geen snelle FPU, in plaats SSE-2... als dat niet aanslaat heeft AMD het goed voor mekaar, als het wel aanslaat dan kan AMD het wel vergeten, want dan zullen ze de willamette waarschijnlijk nooit kunnen bijbenen... het hangt gewoon af van de branch prediction en de support zo te zien...

eens kijken wat Intel ervan bakt, ik ben benieuwd...
Ik wil de Cyrix III trouwens ook wel eens zien, misschien een onverwachte draai in het intel vs AMD gebeuren...

en even over het Intel rulez/AMD rulez geblaat:
kom alsjeblieft met goeie argumenten, neem een voorbeeld aan de posts van Femme, die zijn tenminste goed onderbouwd...

TD-er

5 maart 2000 22:38

Zoals 't d'r nu naar uitziet komen alle fabrikanten met een processor op de markt die weer allerlei eigen instructies en eigenaardigheden heeft.
Intel met hun SSE(-2), AMD met 3D-now en VIA/Cyrix zullen zo ook wel hun eigen ideetjes hebben.
De programmeurs moeten hun software dus wel optimaliseren voor meerdere processoren.
Dus er zullen weer nieuwe(re) compilers moeten komen.
Volgens mij is d'r meer winst te behalen, door de compilers te optimaliseren, dan uiterst gecompliceerde branch-prediction in hardware (althans micro-code) te ontwikkelen. Want dat resulteerd weer in zulke idioot diepe pipelines.
(een PC is geen vector-machine)
Dat komt omdat de operaties in kleine stapjes moeten worden uitgevoerd, anders kunnen ze niet op deze hoge frequenties draaien en de consument wil meer MHz-en. (misschien is er voor een Turing-machine @ 3 GHz wel markt

)

Dus bij deze ga ik volledig voor de transmeta processor-techniek aangezien deze op een zeer laag niveau de instructies weet te paralleliseren.
Zodat de hardware ontzettend eenvoudig (lees: snel) kan blijven en de optimalisatie in de compilers /vertalers zit.
Volgens mij is daar de meeste winst te halen.

Maar ja we zullen wel zien welke technieken de komende jaren op de markt gaan komen, aangezien de schakelingen steeds simpeler moeten worden met deze frequenties.

Wel opvallend trouwens dat de reacties hier gemiddeld wel wat lang zijn......

Verwijderd 5 maart 2000 17:08

Toch altijd weer geweldig dat als AMD denkt bij te zijn, onze Intel vriendjes weer even duidelijk laten zien dat ze nog volledig grip op de techniek hebben. Die P7 core zal weer net zoveel reet schoppen als de P6 intro.
Het hele geneuzel met die gigahertz cpu's lijkt weer een herhaling van die k5 krab.

Verwijderd 5 maart 2000 17:18

het enige dat INTEL doet is hun vapourware hypen... momenteel komt d'r niet echt iets nieuws van INTEL

Verwijderd 5 maart 2000 17:21

Volgens mij waren deze voorspellingen ook gedaan met de intro van MMX, maar moet je nu nog eens een mmx-capable appli draaien op een niet mmx-cpu, niet vooruit te branden.....

Verwijderd 5 maart 2000 17:43

"AMD's impressive K7 Athlon processor design is clearly more advanced than the aging P6 core"....je ziet het, die P6 core is antiek, het zou me erg tegenvallen als een nieuw ontwerp van AMD, de K7 daar niet goed tegen zou presteren.....en ik geloof dat Intel nog niet zolang geleden met de Itanium is gekomen.....maar voordat dit allemaal uit de hand gaat lopen, de gamer/mhz vreter markt is niet de enige markt, en persoonlijk denk ik dat het absoluut niet gaat om 248 of 252 frames per seconden bij kwak, probeer eerst maar eens met een systeem te draaien dat gewoon 24x7x365 uptime heeft, en dat zie ik een andere x86 fabrikant nog niet doen.

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (19)

Sorteer op:

Weergave: