a) alle fabrikanten, ook intel, hebben enorme problemen gehad met nieuwe proces technologieen. Ze doen geen van allen een boekje hierover open, maar het is duidelijk dat het lastig wordt om processors te laten doorclocken op dezelfde manier als dat dit in het verleden gebeurde.
Dit geldt natuurlijk voor zowel Prescott, als voor Banias. Beide zullen andere manieren dan opschalen moeten hebben om preformance te kunnen winnen
b) HT/SMT op de P4 was een grote mislukking. De effectieve prestatiewinst is er gewoon niet bij de gemiddelde multithreaded/multiprocessing software. Slechts wat theoretische applicaties laten prestatiewinst zien en 1 of 2 database benchmarks.
We praten dan in die paar gevallen dat het wel loont om 10% ongeveer effectief prestatie winst.
Dit waar dual core heel dicht bij de 2.0 prestatiewinst zal laten zien. Dus 100%. Factor 10 effectiever dan P4.
Hyperthreading kost ook maar 5% extra ruimte, dus intel haalt met 5% extra ruimte, 10% extra winst, dit is effectiever dan dat dualcore winst boekt. Daarnaast sluiten beide technieken elkaar niet uit.
d) de P4 is een 32 bits processor met weinig registers (wel veel renaming voor de SMT/HT) en superkleine L1 cache. Dat klokt natuurlijk veel makkelijker hoog als een grotere L1 cache.
x86-64 vereist echter meer registers en 64 bits instructies zijn groter als 32 bits, Kortom een ander soort design is nodig voor de toekomst om beter te schalen.
De instructies, en de adressen in x86-64 zijn echter niet 64 bits. Daarnaast maakt het dit voor het klokken van de processor niet zo veel uit. Het lage aantal registers is gewoon een
eigenschap van x86, die bij x86-64 (ook in intels versie dus) wordt aangepast.
g) de P4 is een processor met een aantal enorme zwaktes. Intel heeft die goed weten te cloaken door veel geld in compiler en support teams te stoppen.
Wat is er mis met een goede compiler?
Natuurlijk heeft intel een eigen processorlijn die voor veel geld verkocht wordt die wel goed zijn in floating point: itaniums.
Echter vergelijk het volgende: opteron 2.4Ghz = 4.8 gflops (theoretisch). Itanium 1.3Ghz = 5.2 gflops (theoretisch). Het theoretisch maximum op de opteron is veel simpeler te halen op de opteron als op de Itanium, daar de itanium vreselijk weinig L1 cache heeft (net als P4) en een vreemdsoortige bundel processor is. Dus de itanium haalt deze floating point pieken eigenlijk alleen als hij als DSP processor ingezet wordt.
De Itanium heeft echter wel een L2 cache op halve snelheid van de Opterons L1 cache, maar met 2x zo brede bus. Daarnaast een L3 cache die bijna net zo snel is als de L2 cache van de Opteron.
De volledig geflopte Prescott is het beste bewijs hiervoor. Zelfs een 3.6Ghz Nocona wordt bij nauwkeurig testen volledig aan gort geslagen door een 2.2 opteron die je al in de winkel kunt halen, terwijl 2.4Ghz er ook al is als je goed zoekt.
Intel kan prima meekomen, in sommige applicaties winnen ze zelfs, terwijl ze in andere iets achter lopen. Niets om je zorgen over te maken
Nu zal intel het nog voor elkaar moeten krijgen om die ook even hoog te clocken als AMD met evenveel caches.
Het klokken is dus niet belangrijk. Een langzaam geklokte processor is niet persee langzamer. Intel zal van de lijn die ze doorzetten inderdaad de preformance moeten verhogen, hoe ze dit doen, mogen ze zelf weten.
Het is ronduit zwak dat de pentium-m pas eind 2005 omgeschreven is naar x86-64.
ER is voor 99.9% van de notebook toepassingen geen enkele winst te behalen aan 64bit oplossingen. wel kosten ze extra silicium, en dus extra stroom. Vandaar dat intel er voor kiest dit nog niet te doen.
Hyperthreading kost ook maar 5% extra ruimte, dus intel haalt met 5% extra ruimte, 10% extra winst, dit is effectiever dan dat dualcore winst boekt. Daarnaast sluiten beide technieken elkaar niet uit.
5% zou ik zelfs nog erg veel vinden, denk dat het meer in de richting van 1% zit. Het is dus inderdaad nogal onzinnig om het een "grote mislukking" te noemen. Voor geringe kosten krijg je én regelmatig een snelheidswinst, én een manier om de hele industrie klaar te maken voor echte dual-core processors.
Het lage aantal registers is gewoon een eigenschap van x86, die bij x86-64 (ook in intels versie dus) wordt aangepast.
Inderdaad, Intel ondersteunt net zo goed zestien GPR's als AMD. Intern zijn er dat 128 (of 256 zelfs in 32-bit mode). Die paar extra registers die voor de buitenwereld zichtbaar moeten zijn draaien de performance dus niet de nek om, dat zal eerder gezocht moeten worden in de ALU's en AGU.
Wat is er mis met een goede compiler?
Dat niet iedereen hem gebruikt, en de processor dus zwaktes kan vertonen in generiek gecompileerde code. Dat is tegenwoordig echter niet zo'n argument meer, aangezien P4-optimized code vaak ook een winst geeft op de A64, en de P4-architectuur alweer bijna vier jaar in gebruik is en alle software die enigzins van betekenis is ondertussen wel een keer opnieuw door de compiler getrokken is.
ER is voor 99.9% van de notebook toepassingen geen enkele winst te behalen aan 64bit oplossingen. wel kosten ze extra silicium, en dus extra stroom. Vandaar dat intel er voor kiest dit nog niet te doen.
Alleen met de extra registers valt al ongeveer 10% prestatiewinst te halen (tegenover 5% die-space), dus dat is waarschijnlijk het punt niet. Het punt is dat Dothan nooit bedoeld is om 64-bits te worden. Het ontwerpen van een processor duurt zo'n vijf jaar, en het besluit om er een 64-bitter van te maken moet al vrij vroeg in dat proces genomen worden, want er is geen enkele manier waarop dat er in één of twee jaar tijd nog even bijgefrot kan worden.
[offtopic] Wie dat soort strategische dingen interessant vind kan ik ook
dit artikel aanraden over het annuleren van Tejas. Volgens één van de weinige betrouwbare mensen die voor The Inquirer schrijft is die chip puur omwille van de marketingafdeling gecancelled. Hij was namelijk niet op tijd af om uiteindelijk als 65nm-versie de eerste 65nm-fabrieken te vullen, waardoor men eerst 90nm Prescott, dan 90nm Tejas, dan 65nm Prescott en dan weer 65nm Tejas zou moeten gaan verkopen. Als dat waar is dan is men nu helemaal niet bezig om Dothan naar de desktop te krijgen, maar is men nog vrolijk allerlei Netburstjes aan het bouwen voor de komende twee jaar. Volgende week zal er meer informatie vrijkomen over Intels 65nm-procédé, ben erg benieuwd of dat een einde kan maken aan de Prescott-ellende

.