Een Intel processorontwerper heeft aan EE Times verteld wat er is gebeurd met het eigenlijke ontwerp van de Pentium 4 processor. De chiparchitecten hadden 1MB off-die L3 cache en 16KB trace cache in gedachte, verder zouden er twee volledig functionele floating point units, een langzame ALU en twee snelle ALU's zijn.
Intel vond echter dat de kosten en het stroomverbruik veel te groot waren, daarom moesten er voor de release drastische aanpassingen gedaan worden. De langzame ALU werd gedumpt, de tweede FPU omgebouwd tot dataverplaatser, het trace cache moest gehalveerd worden door een compressietechniek en het L3 cache moest verdwijnen. Om dat te compenseren is het L2 cache verdubbeld van 128 naar 256KB en is het L1 cache half zo klein geworden met vermindere latency:
Things are bound to get tougher for microarchitectures, which at Intel usually come out every five years. The most obvious ways to boost performance — longer pipelines, deeper buffering, more speculation — have been done. That will mean more-complex, hard-to-test designs.
"The low hanging fruit is all gone," Boggs said. "Now we have to build scaffolds around the tree. We'll stand on our head and do strange things for a little more performance."
Volgens Intel kostten al deze aanpassingen slechts 5% aan performance en weegt dat verlies lang niet op tegen de extra productiekosten, maar het zou toch leuk geweest zijn om te zien hoe de Pentium 4 het zou doen als hij geworden zou zijn zoals de makers hem in gedachten hadden.