Tijgerrr wees ons erop dat er bij Ace’s Hardware een bijzonder interessant artikel verschenen is over de FPU performance van de Pentium 4 met verschillende compilers. De Pentium 4 wordt door Ace’s Hardware getest met Microsoft’s Visual C++ 5.0, 6.0 en 7.0. De eerste twee versies zijn geoptimaliseerd voor de Pentium 3 waar Visual C++ 7.0 ook geoptimaliseerde executables kan afleveren voor de Pentium 4.
Veel blijkt dit echter niet uit te maken. De Pentium 4 geoptimaliseerde executable blijkt slechts 10 procent sneller te zijn dan de niet geoptimaliseerde versie. De Intel C++ compiler die simpelweg als plug-in te gebruiken is in Visual C++ blijkt gelukkig beter te presteren. Zodra de compiler het groene licht krijgt om sommige instructies automatisch om te laten zetten naar SSE-2 bewerkingen schiet de performance omhoog. In sommige benchmarks gaat de performance zelfs met meer dan een factor 2,2 omhoog! Een knap staaltje werk dus van de Intel mannen:
Intel has cut a corner too much while designing the Pentium 4 x87 FPU. However, Intel has a brilliant compiler team, which has developed the first IA-32 compiler that can optimize programs with SSE-2 instructions by simply recompiling the code. This makes the Pentium 4 much more attractive for many markets. Provided that a few bugs are resolved, the Pentium 4 will become an attractive option for the scientific world, where recompilation of code is very common and done on a regular basis. The Pentium 4 will most likely also become a powerful workhorse for the workstation world, as the Maya benchmark shows.
Thanks to this new compiler and higher clockspeeds, the fastest Pentium 4 should be able to decrease or even close the performance gap with the fastest Athlon in Pentium 4 optimized workstation applications. The Pentium 4 might even increase its performance advantage over the Athlon in some streaming applications (video encoding).
![]() |