Bij Ace's Hardware is een artikel verschenen dat de snelheid van de FPU van de Pentium 4 bekijkt. In tegenstelling tot normale tests wordt bekeken hoe de performance is bij gebruik van verschillende compilers voor de benchmarktool. Er wordt gebruik gemaakt van GCC 3.2, ICC 7.1, VS.NET en VS.NET2003, elk met verschillende optimalisaties ingeschakeld. Zoals uit eerdere tests al is gebleken, is ICC - de compiler van Intel - het snelst in bijna alle gevallen, vaak met een grote voorsprong. GCC, de open-source compiler, levert de minst snelle code op voor de Pentium 4. Volgens GCC-developer Andi Klein is dit de schuld van Intel, omdat het bedrijf te weinig informatie zou vrijgeven:
When you take a look at the gcc 3.3 source code you will notice that gcc 3.3 is able to schedule for K6,PPro/P2/P3,K6,Pentium-Classic,K7,K8 - but not Pentium4.
All -mcpu=pentium4 does is to tweak some instruction costs for particular pentium 4 problems (e.g. lea with factors being rather slow, so it is avoided). Not having a scheduler will especially hurt for floating point code which usually really needs well scheduled code.
One likely reason for this is that Intel does not release enough information to write a good scheduler description. The information in the optimization manual is not enough, it just gives some vague information on what unit or cluster of units an instruction maps to, but nothing detailed enough to actually write a scheduler.