Paul DeMone van Real World Technologies heeft een artikel gepost over de performance van de Pentium 4. Wie het levensverhaal van de Pentium 4 heeft gevolgd, zal zich kunnen herinneren dat Paul DeMone en Hans de Vries dit voorjaar als één van de eersten de Pentium 4 architectuur 'reverse-engineerden'. Dit werd gedaan aan de hand van de beperkte gegevens die bekend werden gemaakt op het Intel Developer Forum. Terwijl Hans de Vries reeds in mei voorspelde dat de AMD Mustang sneller zou zijn dan de Willamette, bleven de verwachting van Paul DeMone tot het eind toe erg positief. Ook de tegenvallende benchmarkresultaten van P4 engineering samples konden hem niet op andere gedachten brengen. Inmiddels is duidelijk dat de performance van de Pentium 4 met de huidige generatie ongeoptimaliseerde software op veel terreinen achter blijft bij de Athlon en (soms) Pentium III.
In het P4 performance artikel maakt Paul gebruik van de officiële Pentium 4 SPECint2000 en SPECfp2000 resultaten om de prestaties en schaalbaarheid van de P4 en PIII te vergelijken. Het probleem met deze vergelijking is het (onrealistisch) 'brede' geheugen gebruik van de SPECfp2000 benchmark, waardoor de snelheid van de FSB en geheugenbus een grotere invloed op de resultaten heeft dan de eigenlijke snelheid van de FPU units. Volgens SPECfp2000 heeft de 1,5GHz Pentium 4 een 77,8% hogere FPU performance dan een 1GHz PIII op een i820 plank. De FPU benchmarks van Ace's Hardware en Ome Tom geven echter een totaal ander plaatje, in sommige gevallen is de P4 zelfs trager dan een 50% lager geklokte PIII. Zolang applicaties zoals 3D Studio Max, Povray en Truespace. een veel negatiever beeld scheppen van de P4 prestaties is het sterk twijfelachtig of SPECfp2000 wel representatief is voor real world floating point performance.
De geëxtrapoleerde SPECint2k scaling grafiekjes van Paul DeMone geven bewijs van de betere schaalbaarheid van de Pentium 4. Op lage kloksnelheden is de IPC (Instructions per Clock) van de P4 weliswaar lager dan de PIII, maar het verschil wordt kleiner naarmate de kloksnelheid stijgt. Het break-even punt ligt op ongeveer 1,8GHz. Kortom: de PIII heeft dankzij z'n kortere pipeline een hogere IPC, maar wordt dwars gezeten door een trage bus. 1,8GHz is bovendien nogal onrealistisch omdat Intel waarschijnlijk meer nodig heeft dan hun nieuwe 0,13micron koper-interconnect procédé om uberhaupt deze snelheid te bereiken. Ondanks een trucendoos vol geavanceerde technologiën zoals de trace cache en dubbel gepompte ALU's heeft de Pentium 4 een lagere IPC, maar bereikt hij wel veel hogere kloksnelheden dankzij de lange pipeline. De schaalbaarheid is beter dankzij de dikke busbandbreedte:
In het P4 performance artikel maakt Paul gebruik van de officiële Pentium 4 SPECint2000 en SPECfp2000 resultaten om de prestaties en schaalbaarheid van de P4 en PIII te vergelijken. Het probleem met deze vergelijking is het (onrealistisch) 'brede' geheugen gebruik van de SPECfp2000 benchmark, waardoor de snelheid van de FSB en geheugenbus een grotere invloed op de resultaten heeft dan de eigenlijke snelheid van de FPU units. Volgens SPECfp2000 heeft de 1,5GHz Pentium 4 een 77,8% hogere FPU performance dan een 1GHz PIII op een i820 plank. De FPU benchmarks van Ace's Hardware en Ome Tom geven echter een totaal ander plaatje, in sommige gevallen is de P4 zelfs trager dan een 50% lager geklokte PIII. Zolang applicaties zoals 3D Studio Max, Povray en Truespace. een veel negatiever beeld scheppen van de P4 prestaties is het sterk twijfelachtig of SPECfp2000 wel representatief is voor real world floating point performance.
De geëxtrapoleerde SPECint2k scaling grafiekjes van Paul DeMone geven bewijs van de betere schaalbaarheid van de Pentium 4. Op lage kloksnelheden is de IPC (Instructions per Clock) van de P4 weliswaar lager dan de PIII, maar het verschil wordt kleiner naarmate de kloksnelheid stijgt. Het break-even punt ligt op ongeveer 1,8GHz. Kortom: de PIII heeft dankzij z'n kortere pipeline een hogere IPC, maar wordt dwars gezeten door een trage bus. 1,8GHz is bovendien nogal onrealistisch omdat Intel waarschijnlijk meer nodig heeft dan hun nieuwe 0,13micron koper-interconnect procédé om uberhaupt deze snelheid te bereiken. Ondanks een trucendoos vol geavanceerde technologiën zoals de trace cache en dubbel gepompte ALU's heeft de Pentium 4 een lagere IPC, maar bereikt hij wel veel hogere kloksnelheden dankzij de lange pipeline. De schaalbaarheid is beter dankzij de dikke busbandbreedte:
As the P4 begins the long frequency scaling process ahead of it, more and more P4 optimized applications will become available and its appeal will quickly broaden. With an expected shrink to a 0.13 um process in the second half of next year, the P4 will likely be an extremely competitive product that will soon leave the PIII in the dust and relegate it to spending its twilight years in portable PC compatible applications. Although the nature of the AMD x86 processors that the P4 will compete against in the coming years is uncertain, it is apparent that AMD will be hard pressed to retain the unprecedented level of competitiveness versus Intel they have enjoyed since the introduction of the K7 family. The only certainty in the upcoming round of competition is that PC buyers will be among the winners.
![]() |
Historisch gezien zijn de prestaties van een nieuwe generatie Intel architectuur overigens altijd tegenvallend geweest. De eerste 5V Pentiums deden het slecht op 486 code omdat deze code geen rekening hield met de twee ALU's van de P5. De Pentium Pro was geoptimaliseerd voor 32-bit code en presteerde daardoor tegenvallend onder Windows 3.1x en Win95. AMD volgde bij de ontwikkeling van de K7 de strategie om de architectuur te optimaliseren voor P6 code, waardoor de Athlon van meet af aan hard kon fietsen.