Ik heb het over de theoretische situatie waarin de productie van Northwood en Tbred-B cores een gelijke optimalisering heeft bereikt. In dat geval zou AMD wel op prestaties kunnen concurerreren met de 3GHz P4 en zou niemand het hebben over een onschaalbare K7 core
Leuke theorie, maar feit is dat Intel makkelijk over de 3 GHz kan gaan, terwijl AMD nog maar net over de 2 GHz gaat in massaproduktie.
Het verschil is weliswaar veel kleiner geworden sinds de Northwood core, maar 25 procent vind ik toch wel erg groot. In verleden lagen de verschillen tussen de originele Athlon en de PIII Katmai en daarvoor de verschillen tussen de P5 en K6 veel dichter bij elkaar.
Athlon en PIII behoren dan ook tot dezelfde generatie, en zijn volgens dezelfde filosofie ontworpen. En dat is nu juist de kern van mijn betoog. P4 is anders, een algemeen vergelijk met de Athlon is moeilijk, beide CPUs hebben zeer uiteenlopende sterke en zwakke punten.
Dat de P4 een slechte IPC heeft op de huidige software ligt dus wel aan de CPU. De enige IPC die ik relevant vind is de IPC op software die ik in het dagelijks leven gebruik. Ik kan wenig met de wetenschap dat de P4 wel goed presteert op de geoptimaliseerde software, als die geoptimaliseerde software niet/nauwelijks beschikbaar is.
De P4 is in feite niet ontworpen om de huidige software optimaal te laten draaien. Zo is de x87 een ondergeschoven kindje. Als we over een tijdje geen x87 meer gebruiken, hoor je daar niemand meer over.
Verder vind ik het onzin... Als je een P4 koopt, is ie toch wel vele malen sneller dan je vorige systeem over het algemeen. Dat een Athlon hier en daar een paar procentjes sneller is, is aardig, maar daar zul je weinig van merken. En die geoptimaliseerde software gaat komen, dat ga je wel merken met de P4, en niet met de Athlon. Dus ik ben het hier totaal niet met je eens.
De prijs per Mhz levert een waardeloos getal op omdat kloksnelheids alleen geen uitsluitsel geeft over performance. De prijs per performance-eenheid is bij AMD altijd nog lager.
Dan begrijp je me verkeerd. Als ik bij AMD 2.5 GHz nodig heb voor een bepaald prestatieniveau, en bij Intel 3.0 GHz, maakt dat voor mij niets uit als ik evenveel voor 2.5 GHz van AMD betaal als 3.0 GHz van Intel.
Verder zijn de marges tussen de Athlon- en P4-prijzen heel erg klein. Bij een P4 krijg je echter meer waar voor je geld... Betere chipsets te koop (Intel is nog steeds de onbetwiste leider), beter (stabieler) voedingssysteem, beter koelingssysteem (geen beugeltjes aan je socket hangen of andere enge zooi), SSE2, branch predication, 512 kb L2 cache... je ziet waar ik naartoe wil?
Dat betwijfel ik nogal aangezien AMD nog steeds niet de 2400+ en 2600+ in de gevraagde aantallen kan leveren.
Dat ligt dus aan het verouderde ontwerp van de Athlon, zoals ik al meermalen heb geprobeerd uit te leggen. P4 is veel makkelijker met hoge yields te fabriceren. Of liever gezegd, de P4 hoef je niet zo op z'n tenen te laten lopen om de huidige kloksnelheden te behalen. Zo is ie ontworpen, en dat is de voorsprong die Intel heeft.
De IPC-daling van de langere pipeline wordt ruimschoots gecompenseerd door alle andere verbeteringen die AMD in de Hammer cores aanbrengt. Verder gaat het maar om een kleine verlenging. De P4 is veel extremer, waardoor de nadelige effecten van de lange pipeline ook groter zijn.
Leg mij dan maar eens uit welke verbeteringen dat zijn.
Verder heeft Intel tracecache in de P4 zitten, en branch predication, om de problemen van de lange pipeline te omzeilen (door tracecache heb je alleen de laatste paar stages nodig, decoden hoeft maar 1 keer). Voorzover ik weet heeft Hammer geen van beide, dus zie ik niet in hoe het verlies opgevangen gaat worden.
(Veel) lagere geheugenlatencies
Dat heeft alleen effect als het cache-systeem zelf niet toereikend is, en je ultiem slecht geschreven software draait, die het geheugen in totaal random patronen aanspreekt. In de praktijk zul je weinig tot niets hiervan merken, gok ik. Het cache-systeem van de P4 kom de extra latency van Rambus ook aardig verbloemen.
hoge schaalbaarheid in multi-processor omgevingen
Wat heeft dit met de IPC van de CPU te maken?
De ClawHammer heeft geen extreem hoge kloksnelheden nodig om een goede performance te halen.
Da's leuk en aardig, maar Intel is van plan tot de 10 GHz te gaan komen met de P4...
Als de Hammer blijft steken op iets van 4 a 5, gaan ze het echt niet redden.
Daarna komt een die-shrink naar 0,09 micron en kan de kloksnelheid weer een tijdje omhoog.
Dat kan nog vies tegenvallen. Ik vond de sprong van Thunderbird core naar Palomino core niet bepaald wereldschokkend, bijvoorbeeld. Winst van... 300 MHz ofzo? De TBred-A daarna was al helemaal een flop. Nu wil TBred-B dan eindelijk een beetje van de grond komen (nou ja, als we de engineering samples moeten geloven... In de winkels zie je er nog weinig van)
Ik moet het allemaal eerst nog zien. Als de core niet goed ontworpen is, en geen rekening is gehouden met dit soort groeiprocessen (en kan AMD er rekening mee houden? Ze hebben geen ervaring, en zijn afhankelijk van anderen, je ziet wat een problemen nVidia heeft met NV30, en ik schat de kennis en expertise van nVidia hoger in dan die van AMD ... Intel is ondertussen al vrolijk bezig aan 0.09 micron technologie, en zal waarschijnlijk volgend jaar overstappen op een goedlopende 0.09 micron produktielijn, waardoor de P4 wederom goedkoper en sneller wordt).