FiringSquad over de toekomst van het intern geheugen

Bij Thresh's FiringSquad is een artikel te vinden over de toekomst van het interne geheugen. Hieronder een plak info over het cache geheugen, het hele artikel vind je hier.

The cache sits between the processor and the main memory, feeding the processor whatever information it has on hand. Obviously, the cache cannot hold all of the information that the main memory holds, so it only keeps what information the processor has most recently used and discards the rest. There are several levels of cache, denoted by the names L1, L2, L3… etc., in descending order of speed. A L1 cache is on the same silicon die as the processor, and generally runs at the same speed. This makes it extremely fast, but electrical propagation laws limit its physical size. Some modern processors devote 80% of their transistors to the L1 cache. A typical L1 cache size is 16KB, as with the PIII.
L2 cache used to be on the motherboard, but starting with the Pentium Pro, Intel has moved the L2 cache on a separate die inside the same physical package as the processor. The L2 cache generally runs at a fraction of the processor speed, with a 128bit or 64bit interface to the processor die. By placing the L2 cache physically close to the processor, the leads in between are much shorter and the cache speed can be much higher. The older Katmai PIIIs have 512KB of discrete cache running at œ processor speed, the new PIII Coppermines carry 256KB of cache right on the core which allows it to run at full processor speed. Some high end systems, especially ones equipped with Digital Alpha chips, come with L3 caches on the motherboard that range from 1 to 16MB. They are rare in today's new PCs, however.

Reacties (13)

Verwijderd 20 januari 2000 19:59

Over het cache geheugen maak ik me niet zoveel zorgen. Aangezien ik bezig ben met een eigen rdbms, maak ik me meer zorgen over disk-i/o. Dat is in vergelijking met processor and geheugen flink achtergebleven. Zelfs al zou een schijf 1ms nodig hebben om een block te transferen, dan nog zou een beetje intern geheugen dat blok binnen no time weggezet hebben.

Maar aangezien de meeste mensen hier games spelen, denk ik dat ook daar niet zo veel winst uit te halen is met NOG sneller geheugen. Vooral bij T&L gaat het eerder om processorkracht dan om geheugen-acces.

Burat 20 januari 2000 20:13

Nee..! Dat denk ik ook.. Men zit wel steeds geheugensnelheden op te schroeven enzo, en nieuwe dingen uit te proberen - die regelmatig floppen (RAMBUS), maar ik denk niet echt dat de bottleneck de geheugensnelheid/cachesnelheid is.

Alle winst die je ermee haalt is slechts marginaal.

Tijdens games is het idd de processorsnelheid die begrenzend is, of op hoge resolutie de fill rate. Dus gamers hebben er niet zoveel aan. Voor zware servers is waarschijnlijk de hoeveelheid geheugen belangrijker dan de snelheid van het geheugen...

Misschien is het een idee om al die engineers van al die chipbakkers te laten zoeken naar een methode waarmee veel geheugen goedkoper kan worden gebakken...

JumpStart 20 januari 2000 20:24

Als part time onderzoeker op de TU Delft (ik ben ook nog gewoon student) voer ik simulaties uit aan metaal vervorming. Deze simulaties (FEM, eindige elementen methode) draaien op een HP9000 server, om precies te zijn: een J200-2 met 640 MB RAM en 2 processors, 4 MB aan L2 per stuk. (cache zit op de processor module). (... als ik het goed heb tenminste)

Zou ik deze rekenintensieve taken op de PC moeten laten berekenen dan zal een sneller geheugen zeer zeker de moeite waard zijn. Momenteel zijn de berekeningen die ik doe nog 2D, dat is ongeveer 15 MB actieve data maar in 3D gaat de actieve data makkelijk de 200 MB voorbij...

Op de site van Anadtech staat een goed artikel over professionele toepassingen zoals ProEngineer. Daar zie je dat de PIII 800 door de betere cache soms sneller is dan de cryotech Athlon 1000 Mhz.

Dus, het hangt maar net van de toepassing af waarvoor je je computer gebruikt...

(nee, sorry, ik heb de rekenkracht nodig, ik ga het niet ter beschikking stellen aan de PowerCows }:0 )

wildhagen

20 januari 2000 20:26

Dit is toch eigenlijk helemaal niks nieuws ?

Ik, voor mij persoonlijk, merk geen verschil tussen een systeem met 256 kB cache of eentje met 512 kB (met het hetzelfde aantal MHz-en, uiteraard)...

Wat is nu overigens precies de functie van L3-cache ? Dat vat ik nl niet helemaal... L1/L2 kan ik me nog wel voorstellen...

JumpStart 20 januari 2000 20:37

Wildhagen:

Pas als je een toepassing gebruikt die meer dan 256 Kb in je cache propt, dan merk je het verschil. Wanneer gebeurt dit ?? werk maar eens met een gigantische spreadsheet. Wanneer de hele spreadsheet nog in het cache past gaat alles duidelijk sneller dan wanneer er een gedeelte uit het gewone geheugen gevist moet worden.

Over L1/L2/L3: L3 is eingenlijk gewoon een 2e soort geheugen op je moederbord. Maar wel geheugen dat sneller toegankelijk is en meer kan doorvoeren dan het 'massageheugen'

Als je een Solid State hard disk zou hebben ... zou dan je gewone geheugen L4 cache worden ???

Milo 20 januari 2000 20:43

Level 3 cache is gewoon nog een laagje tussen het *trage* geheugen en het snellere level 2 cache. Bijvoorbeeld bij de k6-III, die heeft 64(128?) KB L1 cache, 256 KB L2 cache en het cache op het moederbord word dan L3 cache (tussen .5 en 2 MB)

ff reageren op de rest... Cache geheugen maakt wel degelijk uit, dat zien we aan de huidige athlons. doordat hun cache ze niet bijhoud blijven ze net iets achter bij de pIII's.
(wat overigens ook al bij de k6-2's was, werd min of meer opgelost door k6-III). Een athlon met on-die cache zou dus heel snel kunnen zijn (nog 20% sneller?) Geheugensnelheid is toch ook belangrijk, dat zie je als je een celeron 500 test tegen een pIII 500. (moet je natuurlijk een benchmark zonder SSE optimalisatie hebben). Die athlon moet dus eigenlijk ook 133 Mhz DDR sdram hebben.

Zelfs bij goed gebruik van T&L zullen er nog veel textures gebruikt worden, dus veel bandbreedte nodig, dus hebben dingen als DDR en QDR wel degelijk zin.

Tsja, de harde schijf is mijn inziens ook wat achter gebleven. Hoewel die nieuwe maxtor 41GB plus toch behoorlijk snel is. Zoiets zouden ze toch gewoon electroniesch moeten kunnen maken, in plaats van mechanish. dan kan het stukken sneller.

Spees 20 januari 2000 23:07

Voor beeldverwerking is snel geheugen ook heel belangrijk. Ik werk aan een projekt waarbij ik uien die voorbij een camera vliegen moet kunnen goedkeuren of afkeuren a.d.h.v. wel/geen bruine plekken. Daarna moet door een mechanische klep aan te sturen de ui wel/niet afgevoerd worden. Dat mechanische stuk is vrij traag en er zijn maar enkele tientalle msec over voor de software om tot een beslissing over te gaan. Ik heb dus een image van 640x480, 24-bit kleur. (900KB) Dat past dus niet zomaar in een P2/P3 cache. Om het beeld te bewerken moet ik echt heel wat taken uitvoeren, waarbij tussentijdse images onstaan, plus ik heb wat lookup tables nodig. Ik heb uitgerekend dat de snelste cpu net snel genoeg is... als ik er van uit ga dat ie het geheugen binnen 1 klokcyclus kan benaderen. Dat lukt dus nooit en te nimmer... Dual cpu is ook heel erg leuk voor dit soort dingen, maar als de geheugenbus 133Mhz is, dan krijgt elke cpu gemm. maar 66Mhz toegang. Dus ook redelijk crap. Geheugensnelheid is dus nog steeds een bottleneck bij diverse proffessionele toepassingen. Niet meer bij 3D games en office programma's.

Dopamine 21 januari 2000 01:44

Dit zijn geheugenspinsel die doorwerken op het idee van hoe het nu is. Is onzin, werkt nooit. De toekomst wijzigt radicaler dan je ooit kunt voorspellen. Dus:

Harde schijven naar flash-geheugen (rond de paar honderd Mhz),RAM en cache geintegreerd in optisch of biologisch geheugen met meerder dimensies. (Dus geen 0/1 maar meerdere mogelijkheden, driehoeksgewijs berekend, denk aan de transistor).

Maar zelfs bij deze (redelijk eenvoudig op het net op te zoeken) voorspelling ga ik alweer voorbij aan ontwikkelingen als nieuwe computers uit de quantumnechanica. (Deeltjes die twee toestanden tegelijk kunnen aannemen, bv 0 en 1, waar je er helaas maar een per keer van kan meten)
Ergo: voorspellen is conservatief gedrag... Het wordt altijd on'voorspelbaar' anders.

basb 20 januari 2000 20:19

Eh, L1 cache van een pII's en PIII's is toch 32 kb en geen 16kb.

Verwijderd 20 januari 2000 21:26

koop dan 2(of meer) identieke schijven (7200rpm) en pleur die op een ATA66 RAID controller.

ben je ook van dat probleem af.

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (13)

Sorteer op:

Weergave: