Wie de eerdere reviews heeft gelezen, weet hoe belangrijk het is om de P4 met veel apps en games te benchen. De op z'n zachst gezegd 'aparte' architectuur van de Pentium 4 maakt dat de resultaten per benchmark enorm kunnen verschillen. Dankzij twee Rambus channels bereikt de Pentium 4 een geheugenbandbreedte die we nog niet eerder bij een desktop processor hebben mogen zien. De P4 trekt in sommige gevallen 1,5GB/s, terwijl een Tbird met PC2100 DDR SDRAM niet boven 750MB/s komt.
Zoals je weet heeft Intel gekozen voor een ontwerp met een erg lange pipeline. Door het werk dat de procesosr moet verrichten in meer stappen te verdelen, wordt het eenvoudiger om hogere kloksnelheden te bereiken. Een lange pipeline is geen probleem zolang de banch predictor zijn werk goed kan doen. Dit is het geval bij de eenvoudig voorspelbare code-branches (aftakkingen) van floating point en multimedia toepassingen. Bij de moeilijk te voorspellen integer code van veel office apps presteert de P4 hierdoor echter zeer slecht. Bij elke misstap moet de berekening immers terugkeren naar het begin van de pipeline, waardoor een (bij de P4 groot) aantal kloktikken verloren gaan. Intel focust volgens eigen bewoordingen vooral op de 'user experience'. Daarom vindt Intel het niet zo'n probleem dat Word en Powerpoint op een 1,5GHz P4 even hard lopen als op een 1GHz PIII, zolang de applicaties waarbij de performance écht van belang is maar sneller gaan. Intel heeft hier op zich een punt, ware het niet dat de P4 ook in veel game benchmarks slechter presteert dan lager geklokte Athlons:
"Integer and basic office productivity applications, such as word and spreadsheet processing, tend to have many branches in the code that are difficult to predict, thus reducing overall IPC potential. As a result, performance increases on these applications are more resistant to improvements in micro-architectural means, such as deeper pipelines. Also, significantly raising the performance level on these types of applications does not necessarily increase the users experience, as these types of applications only need to keep pace with the human level of read and write response time.""Floating point and multimedia applications tend to have branches that are very predictable, and thus naturally have a higher average IPC potential. As a result, these types of applications generally scale very well with frequency and are inclined to benefit greatly from deeper pipelines."
Benchmarks
De brede collectie benchmarks van Ace's Hardware geeft een aantal interessante resultaten. De Linpack memory benchmark geeft blijk van de superieure bandbreedte van de twee PC800 Rambus channels. In het L1 en L2 cache gebied presteren de 1,2GHz en 1,1GHz Athlon echter veel beter dan de P4. Dankzij exclusive L2 cache profiteert de Athlon bovendien tot een matrix grootte van 384KB van de hoge L1 en L2 cache bandbreedte. De geheugenperformance van de P4 daalt al sterk voorbij het 256KB gebied.
Eind vorige maand werd bij de release van de 760 chipset al duidelijk dat vooral Quake III Arena erg onbescheiden is wat betreft het gebruik van geheugen bandbreedte. De P4 presteert hier in vergelijking met de overige benchmarks erg goed en laat bovendien een goede schaalbaarheid zien. De P4 1,6GHz presteert 15,2% beter dan de P4 1,3GHz terwijl de kloksnelheid 23,1% hoger is, oftewel 65,8% van de kloksnelheidsstijging wordt omgezet in een prestatiestijging. De Athlon 1100 en 900 met KT133 chipset geven op deze benchmark een rendement van 48,9%. Dit belooft veel voor de toekomst (hoewel het rendement in de Q3A benchmarks van Anand veel lager is, 22,4% voor de P4 vs 48,5% voor de Athlon).
In sommige game benchmarks fietst de 1,5GHz P4 even hard als de Athlon, maar vaak is de 1,2GHz Athlon met DDR SDRAM beduidend sneller (Expandable, Drakan, Vampire: Masquerade). Dit maakt 't een lastige klus om de prestaties van de P4 en Athlon helder met elkaar te vergelijken. In MDK2 is het rendement trouwens respectievelijk 59,8% (P4 1,5GHz vs 1,4GHz) en 66,45% (1GHz vs 1,2GHz Athlon DDR) - gebaseerd op de benchmarks van Anand. Je kunt dus niet per definitie stellen dat de schaalbaarheid van de P4 beter is.
Zoals verwacht scoort de Athlon beter in FPU Mark, maar ondanks de dubbel pompende integer engine moet de P4 ook in CPU Mark zijn meerdere erkennen in het Athlon geweld van AMD. Deze twee synthetische benchmarks worden overigens vaak als achterhaald beschouwd, daarom is het beter om te kijken naar applicatie benchmarks zoals Truespace en Povray. Ook hier is de Athlon veruit superieur en laat de P4 zich soms zelfs voorbij tuffen door de zwaar getunede P6 core van de 1GHz PIII. Omdat de support voor SSE2 in de toekomst naar verwachting sterk zal toenemen, is het de vraag of je op lange termijn veel waarde moet hechten aan deze benchmarks.
Een lagere kloksnelheid en het ontbreken van SSE support kan de Athlon er niet van weerhouden om in de Photoshop 6.0 test de leiding te nemen. Dit beeld herhaalt zich in de meeste workstation benchmarks.
Conclusie
Intel heeft met de Pentium 4 zonder twijfel een radicalere weg ingeslagen dan AMD destijds met de K7. Feitelijk kun je de Athlon beschouwen als een erg dikke P6 met véél FPU en integer units, véél cache en een snelle FSB. Helaas vertaalt de revolutionaire architectuur van de P4 zich momenteel niet in betere prestaties. De superieuriteit van de P4 blijft beperkt tot toepassingen waarin geheugen bandbreedte een voorname rol speelt, zoals Quake III en MPEG-2 encoding. In de overige omstandigheden moet de P4 veelal zijn meerdere erkennen in de lager geklokte Athlon met DDR geheugen. De prestaties van de P4 zullen er ongetwijfeld op vooruit gaan als compilers geoptimaliseerd worden voor de SSE2 en de P4 architectuur, maar door de ongebalanceerde prestaties en hoge prijs is de Athlon momenteel de betere oplossing: [/break] Over time, as more applications are optimized, either specifically for the micro-architecture via assembler-level optimizations or are recompiled using optimized SSE2 compilers and libraries, the Pentium 4 will show better performance. Corel Draw 10, Dragon Naturally Speaking, Rage Incoming Forces, MGI Video Wave III and The Print Shop are some of the upcoming software packages that will include SSE-2 optimizations.
[...] Nevertheless, the survival series is not over. The Athlon 1200 with DDR is a more balanced and less pricey solution than the Pentium 4 with Rambus. The Athlon 1200 DDR came in first or second place in every benchmark while the Pentium 4 was very capricious with some ups but more downs. Most people hate upgrading their favorite software all the time and the Athlon runs legacy applications faster. IOHO, the FPU of the Pentium 4 should have been made more powerful.
![]() ![]() |