L2 is veel sneller geclockt als L3.
Dit geldt binnen één processor natuurlijk, alleen kan het tussen processoren onderling verschillen
Bij Madison is het onduidelijk hoeveel cycles alles kost. Presentatie van Intel Strategic Marketing Manager voor NWO/NCF toonde iets heel anders als wat er in de intel handbooks staat.
Ik veronderstel dat randomaccesses dus veel trager gaan op de level caches als wat hieronder staat.
L2 cache : 5-7 cycles
L3 cache : 14-17 cycles
Niet zo lang geleden stond op tweakers over de Itanium2: "
Het L1 cache is namelijk zonder enige latency te lezen, en het L2 en L3 cache kunnen in respectievelijk vijf en twaalf stappen bereikt word en, twee keer zo snel als Itanium." Dit zijn heel andere getallen dan jij geeft.
Over de Opteron is de snelheid van
de L2 cache niet bekend, L1 is wel, namelijk 3 cycles Als naar de K7 kijkt, (die er toch veel op lijkt) dan kan je verwachten dat voor de k8 de cache dus ook in +- 7-8 cycles aan te spreken is.
Overigens "vergeet" je te noemen dat de Itanium veel meer registers heeft dan de Opteron... Daardoor is deze iets minder afhankelijk van een snelle L1 cache en buffers.
Bij zo'n bundle processor als de Itanium2 is dat bitter weinig hoor:
a) de instructiesize is *erg groot*
b) 1 bundle is 3 instructies
c) de processor moet ueberhaupt meer instructies verwerken als enig andere processor omdat het geen OoO processor is maar IPF.
d) Itanium2 heeft niet zoveel instructies als andere processors. Bijvoorbeeld geen deel instructie. Maar ook bijvoorbeeld geen rotate.
punt c en d zijn min of meer het zelfde, nietwaar?
Zonder een standpunt in te nemen of IPF beter is als OoO, duidelijk is dat superdure IPF processor met kleine L1 + kleine L2 + megagrote L3 het totaal aflegt tegen 1 grote L1 + grote L2 met OoO van de opteron.
Dus ik zou als antwoord willen geven: een L2 is veel belangrijker als een superkleine L2 met megagrote L3.
Het is belangrijk dat de Cache levels evenwichtig verdeeld zijn tussen grootte en snelheid. De penalty voor het ontbreken van een stuk data in een laag cache level moet niet te groot zijn, maar je kunt ook niet alles in de L1 cache zetten.... Echter zijn er veel meer dingen die de snelheid van een processor bepalen, daarom denk ik dat jouw conclusie wat te kort door de bocht gaat.
Als je dus een opteron drukt met een L3 cache erbij van 24MB, wat de prijs natuurlijk net zo duur maakt dan als wat een itanium kost, dan weten we dus zeker dat die opteron nog veel sneller is op de integer testsets.
Maar je kunt niet zomaar zeggen dat een processor met een totaal ander ontwerp meer, of minder extra voordeel haalt bij een "belachelijk grote" L3 cache. In dit geval wordt deze cache overigens gedeeld door meerdere cores, dus dat maakt de grote minder belachelijk. Hij zal er waarschijnlijk wel langzamer door worden.
Het is mij een raadsel waarom een architectuur als de itanium2 zo'n enorm kleine L1 en superkleine L2 cache strategie gebruikt, als je weet dat het *juist* voor deze cpu het zwakste punt is daar deze zoveel instructies per cycle kan verwerken.
Misschien worden de yields enorm slechter als je de L1 en de L2 caches wat groter maakt en deze enorm grote processor probeert te clocken op de frequenties waar het op loopt.
Ik denk dat je conclusie gewoon niet goed is. De L2 cache is misschien minder belangrijk dan jij denkt. Intel is prima in staat grote L2 caches te maken, die ook op hoge snelheid prima functioneren (zie de EE-CPU's) maar bij de Itanium kiezen ze een anderer weg.
Overigens intel moet de processor niet zo belangrijk vinden als andere, want ondertussen heeft intel 0.09 prima onder controle terwijl deze processor nog 0.13 is.
De highend wordt dus niet als superbelangrijk geacht.Ze drukken gewoon een grotere chip voor veel geld in een bijna al verouderde processtechnologie.
Het ontwerp van de highend processoren is denk ik veel ingewikkelder dan die van een "gewone" processor. Daarnaast moet de betrouwbaarheid nog eens echt helemaal 100% zijn. Door de nieuwste technieken voor productie dus toe te passen op "low end" weet Intel zeker dat high end betrouwbaar blijft.