Dus jij denkt dat een gehalveerde geheugenlatency, een verdubbelde cachebandbreedte, de pipeline verlenging en SOI technologie (waardoor hogere kloksnelheden mogelijk worden), de extra registers in 64-bit modus, de verbeterde branch prediction en alle andere kleine verbeteringen aan de front-end de prestaties zullen verminderen ten opzichte van de Athlon XP.
Geheugenlatency heeft weinig tot geen invloed op de meeste goedgeschreven programma's. Het cache-subsystem moet de latency van het geheugen 'dempen' als het ware, zoals de P4 met Rambus aardig goed deed. Zolang er binnen de cache gewerkt wordt, zal de IPC dus niet beinvloed worden.
Pipeline verlenging zal alleen maar de latency negatief beinvloeden (en dus indirect ook de IPC), zoals ik al honderden keren heb uitgelegd, en ik heb ook al honderden keren gezegd dat de P4 hier meer voorzieningen heeft om de latency te beperken dan de Hammer. Wanneer haal je die stront eens uit je ogen, en doe je je oogkleppen eens af?
SOI heeft ook geen invloed op de IPC zelf, alleen op de schaalbaarheid.
Extra registers zullen totaal geen invloed hebben op x86 programma's. Wat er met geoptimaliseerde Hammer-programma's gaat gebeuren, moeten we nog afwachten. Bij een moderne ooo-architectuur wil je de register-pressure laag houden (veel L1-cache gebruiken, om dependency chains kort te houden, en te voorkomen dat de dispatch-buffer vol raakt met dependent instructies, en de dispatcher stallt). Meer registers toevoegen staat hier eigenlijk loodrecht op. Misschien dat Intel het om die reden nooit overwogen heeft.
P4 had al verbeterde branch-prediction, en bovendien tracecache en predication. Voor zover ik weet, beschikt de Hammer niet over de laatste twee, dus loopt hij nog steeds achter.
Blijft over de cache-bandbreedte. Nou, 1 puntje dan. Ik ben onder de indruk hoor. Mag ik wel opmerken dat de P4 al meer cache-bandbreedte dan de Athlon had?
Bovendien heb ik nooit beweerd dat de Hammer minder IPC dan de Athlon zou hebben. Ik zei alleen dat ik meer aanleiding heb om aan te nemen dat de IPC omlaag zal gaan, dan dat deze omhoog zal gaan.
Wat dus inhoudt dat er wel een netto stijging kan zijn, maar dat deze misschien niet al te groot is.
Dit om de verhalen van "Hammer wordt veel sneller dan de Athlon" te nuanceren.
Verder gaat het niet om IPC alleen. De schaalbaarheid van het ontwerp is iets waar ik me meer zorgen om maak. Als je alleen op IPC let, dan zijn de Pentium MMX, de G4 of de 68060 zeer mooie
processors. Maar deze ontwerpen kunnen niet schalen naar kloksnelheden die competitief zijn. Dus wat heb je er dan aan?
De SPEC CPU schattingen van AMD, waaruit blijkt dat de Opteron een duidelijk hogere IPC heeft dan de Athlon XP, kunnen je zeker ook niet op andere gedachten brengen?
Niet echt nee, hij mag dan wel een hogere IPC hebben dan de Athlon XP, maar we weten nog steeds niet hoe schaalbaar deze is. Verder zien we dat de XP2800+ al behoorlijk terrein moet prijsgeven aan de P4 2.8 GHz (hoezo Performance Rating, AMD?).
Deze P4 komt al redelijk dicht in de buurt van de Hammer... Laten we even natte-vingerwerk gaan doen:
P4 2.8 geeft ons 1010 punten in SpecINT.
Dat is 1010/2.8 = 360 punten per GHz
Hammer wordt geschat op 1202 punten.
Theoretisch zou je dan met 1202/360 = 3.3 GHz de Hammer evenaren.
P4 2.8 geeft ons 887punten in SpecFP.
Dat is 887/2.8 = 316 punten per GHz
Hammer wordt geschat op 1170 punten.
Theoretisch zou je dan met 1170/316 = 3.7 GHz de Hammer evenaren.
Aangezien de 3.6 GHz engineering samples al volop in omloop zijn, schat ik in dat Intel niet lang nodig heeft om in ieder geval de 3.3 GHz te bereiken.
Verder zet ik mijn vraagtekens bij de SpecFP, gebruikt deze SSE2 of x87? In het geval van x87 betekent dit dat de P4 nog niet het achterste van z'n tong heeft laten zien.
Verder zijn dit slechts schattingen van de performance van de Hammer. Zijn deze uberhaupt realistisch? Er bestaat een kans dat ze nogal 'optimistisch' zijn.
En als ik het goed heb begrepen is dit de SledgeHammer, het server-model, high-performance, 1 MB cache... (was dit ook niet een uitvoering met 2 cores op 1 die?)
De ClawHammer, het desktop model, zal aanzienlijk minder presteren, neem ik aan, door minder cache (lagere klok? 1 core?). En om de ClawHammer gaat het, DEZE CPU moet de P4 bestrijden, en de rol van de Athlon overnemen, niet de SledgeHammer.
De SledgeHammer zou het op moeten nemen tegen de Itanium II, door welke hij hier grondig vernederd wordt.
De 3,06GHz P4 moet nog geïntroduceerd worden.
Ja, ik bedoelde natuurlijk dat de introductie vervroegd is, duh.
Het kan zijn dan Intel tussentijds toch de roadmap wat versnelt door bijvoorbeeld een 3,4GHz P4 toe te voegen
Deze 3.4 GHz zal volgens mijn natte-vingerwerk competitief zijn met de SledgeHammer. Hoogstwaarschijnlijk is ie ook een stuk goedkoper, mede omdat AMD eerst het productieproces nog rendabel moet krijgen, en de R&D-kosten eruit krijgen.
Verder zal deze P4 waarschijnlijk de ClawHammer eenvoudigweg verslaan qua performance.
Zo, nu jij weer. Of nee, hou je mond eigenlijk maar, ik heb hier geen zin meer in. Sommige mensen WILLEN gewoon de waarheid niet onder ogen zien. Leef maar lekker door in je droomwereldje hoor.
Voor de rest claim ik NDA.