We beginnen ons benchmarkfestijn met een aantal low-level benchmarks die inzicht verschaffen in de performance van de geheugen- en cache-systemen van de geteste processors en chipsets. Grote afwijkingen in de geheugenperformance kunnen een verklaring geven voor verschillen in de applicatiebenchmarks op de volgende pagina's. De geheugenbenchmarks op deze pagina werden uitgevoerd door het DOS programma
Cachemem. Cachemem produceert niet alleen bandbreedte cijfers maar ook interessante latency metingen.
 |
|
 | Cachemem cache latency (klokcycli) |  |
 |
|
 | Blocksize > |  | 8KB |  | 16KB |  | 32KB |  | 64KB |  | 128KB |  | 256KB |  | 512KB |  |
 |
|
 | Athlon XP |  | 4 |  | 4 |  | 4 |  | 4 |  | 20 |  | 20 |  | |  |
 |
|
 | Pentium 4 |  | 1 |  | 2 |  | 19 |  | 29 |  | 24 |  | 24 |  | 42 |  |
 |

Hoewel de L1 cache van de Pentium 4 een lagere latency heeft dan de L1 cache van de Athlon XP, levert de cache van de Athlon betere prestaties in het grote gebied tussen 16KB en 64KB. Dit is te danken aan de grotere omvang van de L1 data cache: 64KB bij de Athlon XP versus 16KB bij de Pentium 4. De latency in termen van klokcycli is in de bovenstaande grafiek omgerekend naar de latency in tijd. De Pentium 4 moet weliswaar verder fietsen om bij z'n L2 cache te komen, maar arriveert dankzij een snellere tred toch eerder op bestemming.
 |
 | Cachemem L1 cache read bandbreedte (MB/s) |  |
 |
 | Pentium 4 2,26GHz @ 2,8GHz |   20911,9 |  |
 |
 | Pentium 4 2,26GHz |   17053,2 |  |
 |
 | Athlon XP 2200+ @ 1,89GHz |   16517,9 |  |
 |
 | Athlon XP 2200+ |   15678,4 |  |
 |
 | Athlon XP 2000+ |   14516,6 |  |
 |
 |
 | Cachemem L1 cache write bandbreedte (MB/s) |  |
 |
 | Athlon XP 2200+ @ 1,89GHz |   13664,3 |  |
 |
 | Athlon XP 2200+ |   12969,7 |  |
 |
 | Athlon XP 2000+ |   12008,7 |  |
 |
 | Pentium 4 2,26GHz @ 2,8GHz |   9343,6 |  |
 |
 | Pentium 4 2,26GHz |   7623,9 |  |
 |
 |
 | Cachemem L1 cache read bandbreedte per MHz (MB/s) |  |
 |
 | Athlon XP |   8,7 |  |
 |
 | Pentium 4 |   7,5 |  |
 |
De Pentium 4 2,26GHz heeft in absolute termen meer L1 leesbandbreedte dan de Athlon XP 2200+. De Athlon XP heeft desondanks een uitstekende L1 cache architectuur. Gerelativeerd naar de kloksnelheid presteert de Athlon XP namelijk beter dan de P4. Opvallend is het grote verschil tussen de L1 cache lees- en schrijfperformance van de Pentium 4. De Athlon XP's presteren op dit gebied aanmerkelijk beter, ondanks een veel lagere kloksnelheid.
 |
 | Cachemem L2 cache read bandbreedte (MB/s) |  |
 |
 | Pentium 4 2,26GHz @ 2,8GHz |   11352,3 |  |
 |
 | Pentium 4 2,26GHz |   9260,5 |  |
 |
 | Athlon XP 2200+ @ 1,89GHz |   5569,4 |  |
 |
 | Athlon XP 2200+ |   5286,4 |  |
 |
 | Athlon XP 2000+ |   4894,7 |  |
 |
 |
 | Cachemem L2 cache write bandbreedte (MB/s) |  |
 |
 | Pentium 4 2,26GHz @ 2,8GHz |   9415,3 |  |
 |
 | Pentium 4 2,26GHz |   7683,9 |  |
 |
 | Athlon XP 2200+ @ 1,89GHz |   5789,4 |  |
 |
 | Athlon XP 2200+ |   5495,2 |  |
 |
 | Athlon XP 2000+ |   5088,0 |  |
 |
 |
 | Cachemem L2 cache read bandbreedte per MHz (MB/s) |  |
 |
 | Pentium 4 |   4,0 |  |
 |
 | Athlon XP |   2,9 |  |
 |
De L2 cache bandbreedte van de Pentium 4 is veruit superieur aan de Athlon XP. Dit is niet opzienbarend, omdat de L2 cache bus van de Pentium 4 maar liefst vier keer zo breed is als de bus van de Athlon XP. De ontwerpers van de Athlon processor hebben gekozen voor een groot L1 cache, zodat er minder L2 cache benaderingen nodig zijn en er minder bandbreedte op de cache bus wordt verstookt. Omdat de latency van de L2 cache verder nauwelijks verschilt van de Pentium 4 zal de Athlon XP in de praktijk weinig nadeel ondervinden van de lagere L2 cache bandbreedte.
 |
 | Cachemem DRAM read bandbreedte (MB/s) |  |
 |
 | Pentium 4 2,26GHz @ 2,8GHz |   1746,0 |  |
 |
 | Pentium 4 2,26GHz |   1435,6 |  |
 |
 | Athlon XP 2200+ (DDR266) |   1408,9 |  |
 |
 | Athlon XP 2200+ @ 1,89GHz |   1364,0 |  |
 |
 | Athlon XP 2200+ |   1294,6 |  |
 |
 | Athlon XP 2000+ |   1276,7 |  |
 |
 |
 | Cachemem DRAM write bandbreedte (MB/s) |  |
 |
 | Athlon XP 2200+ @ 1,89GHz |   659,6 |  |
 |
 | Athlon XP 2200+ |   625,9 |  |
 |
 | Athlon XP 2000+ |   624,1 |  |
 |
 | Athlon XP 2200+ (DDR266) |   577,2 |  |
 |
 | Pentium 4 2,26GHz @ 2,8GHz |   489,3 |  |
 |
 | Pentium 4 2,26GHz |   457,6 |  |
 |
Net als bij de L1 cache benchmarks zien we hier grote verschillen tussen de lees- en schrijfbandbreedte van de Pentium 4. De snelle FSB van de Pentium 4 en de goede prestaties van de Intel 845E chipset brengen de P4's aan kop in de leesbandbreedte benchmark. Een verklaring voor de goede prestaties van de Athlon XP met DDR266 (PC2100) geheugen kan ik niet geven.
 |
 | Cachemem DRAM latency (klokcycli) |  |
 |
 | Athlon XP 2000+ |   226 |  |
 |
 | Athlon XP 2200+ |   244 |  |
 |
 | Athlon XP 2200+ @ 1,89GHz |   244 |  |
 |
 | Athlon XP 2200+ (DDR266) |   256 |  |
 |
 | Pentium 4 2,26GHz |   333 |  |
 |
 | Pentium 4 2,26GHz @ 2,8GHz |   357 |  |
 |
 |
 | Cachemem DRAM latency (nanoseconden) |  |
 |
 | Pentium 4 2,26GHz @ 2,8GHz |   127,3 |  |
 |
 | Athlon XP 2200+ @ 1,89GHz |   129,1 |  |
 |
 | Athlon XP 2200+ |   135,6 |  |
 |
 | Athlon XP 2000+ |   135,6 |  |
 |
 | Athlon XP 2200+ (DDR266) |   142,2 |  |
 |
 | Pentium 4 2,26GHz |   147,0 |  |
 |
De hoge latencies van de Pentium 4 in combinatie met Rambus geheugen zijn al vaker in onze nieuwsberichten ter sprake gekomen. De Cachemem DRAM latency benchmarks bewijzen dat de Pentium 4 2,26GHz ook met DDR SDRAM getroffen wordt door hoge geheugen latencies: de Pentium 4 2,26GHz moet als laatste aansluiten in het lijstje. Het beeld keert in het voordeel van de Pentium 4 zodra de FSB een flinke oppepper krijgt. Op 660MHz FSB en een geheugenbus van 330MHz presteert de Pentium 4 beter dan alle Athlon XP processors. De VIA KT333 chipset doet het met PC2700 geheugen en een asynchrone bus net wat betere dan met PC2100 op een synchrone geheugenbus.