Intel-patent deelt details L4-cache die mogelijk wordt gebruikt in Meteor Lake

Een patent van Intel deelt details over de werking van Intels L4-cache, Adamantine. Onlangs suggereerde een Linux-patch dat Intel dergelijke cache gaat gebruiken in zijn komende Meteor Lake-cpu's voor consumenten.

Het patent stelt dat Intels 'volgende generatie soc-architectuur' mogelijk beschikt over 'grote on-package caches', merkte techwebsite VideoCardz als eerste op. Deze moeten dienen als L4-cache. De cache heet 'Adamantine' of 'ADM' en moet volgens Intel 'nieuwe toepassingen mogelijk maken'.

De toegangstijd tot deze L4-cache moet bijvoorbeeld veel korter zijn dan de toegangstijd voor dram. Volgens het patent kan Adamantine daardoor onder meer gebruikt worden om communicatie tussen de cpu en beveiligingscontroller verbeteren. Ook moeten opstarttijden verlaagd worden door gebruik van L4-cache. De L4-cache zou namelijk gegevens bewaren bij het resetten van de pc.

Er gaan al langer berichten rond dat Intel L4-cache gaat introduceren, specifiek in zijn komende Meteor Lake-processors. Eerder deze maand verschenen vermeldingen daarvan in een Linux-patch, merkte Phoronix op. De patch in kwestie verwees naar 'ADM/L4' in Meteor Lake, maar deelde verder geen details. ADM blijkt nu dus voor Adamantine te staan.

Het nieuw opgemerkte patent noemt de term Meteor Lake niet concreet, maar bevat wel verwijzingen naar deze cpu-generatie. Afbeeldingen uit het patent tonen een cpu met twee Redwood Cove-cores en acht efficiëntere Crestmont-kernen op één 'tile', de term die Intel hanteert voor chiplets. Specifiek die cores worden gebruikt in Meteor Lake. Het diagram toont daarnaast een losse gpu-tile met 64 execution units en een soc-tile. Het is al langer bekend dat Meteor Lake een ontwerp met dergelijke tiles krijgt.

Het is nog niet bekend hoeveel L4-cache Intels komende processors krijgen. Mogelijk verschilt dat per model. Leaker Moore's Law is Dead stelde in een recente video dat het bedrijf momenteel interne tests doet met caches van 128 tot 512MB. Op termijn zou dat kunnen oplopen meer dan een gigabyte. Moore's Law is Dead deelt vaker informatie over onuitgebrachte producten, hoewel de juistheid daarvan wisselvallig is.

Patent Intel Meteor Lake L4-cacheIntel Meteor Lake

Intels L4-cache-patent (links) en de eerder bevestigde opbouw van Meteor Lake, met een cpu-chiplet, gpu-chiplet en soc-chiplet

Door Daan van Monsjou

Nieuwsredacteur

24-04-2023 • 09:11

36

Lees meer

Reacties (36)

36
36
17
2
0
15
Wijzig sortering
Intel heeft al eens hier en daar een CPU uitgebracht met L4 cache maar deze was aanwezig als een aparte eDRAM chip en diende vooral om de iGPU sneller te maken. Een aantal Haswell en Broadwell modellen met Iris Pro iGPU hadden bijvoorbeeld 128MiB L4 cache. Bij mijn weten was het toen geen groot succes maar hier klinkt het alsof de L4 cache sneller gaat zijn en ook beter inzetbaar voor allerlei berekeningen in plaats van vooral ten dienste van de iGPU.

Ergens in mijn herinnering zit ook nog het idee dat bepaalde AMD moederborden een beetje RAM onboard hadden ten dienste van de chipset GPU maar ik kan het mij niet herinneren. Dat geheugen was dan natuurlijk niet deel van de CPU package.

[Reactie gewijzigd door Admiral Freebee op 28 juli 2024 11:32]

De Core I7-5775C was een desktop CPU met Broadwell architectuur en eDRAM. Als je de ingebouwde GPU uitzette kon de CPU de hele 128MB gebruiken als victim cache voor de L3 cache. Technisch was die chip een groot succes en zelfs sneller dan de Skylake chips die erna kwamen. Qua marketing kregen ze het inderdaad niet verkocht en het is bij welgeteld één desktop CPU met eDRAM gebleven.
Dit is een interessant stukje hardwaregeschiedenis dat ik helemaal gemist lijk te hebben. Bij de Core i7-5775C was de 128MiB eDRAM cache inderdaad opgesplitst in een stuk voor de iGPU en een stuk voor de CPU maar je kon ook de volle cache inzetten als L4 cache voor de CPU als je de iGPU uitschakelde en dat gaf mooie prestatiewinsten.

Het lijkt er wel op dat deze Broadwell CPU voor de desktop erg laat geïntroduceerd werd want de volgende generatie was al verkrijgbaar en die kregen dan meer aandacht.
Twee -- De i5-5675c was er ook nog. Dat oude beestje kan inmiddels niet echt meer mee wegens gebrek aan HT (het is dus een pure quadcore) maar ik heb er heel veel jaar plezier van gehad, en nu nog houdt het de GTX 1070 perfect in balans. De vraag was er destijds niet, waardoor ik hem voor een habbekrats op de kop kon tikken. Intel bracht desktop Broadwell bijkans met veel tegenzin uit, leek het wel.
Zo lang het inzetbaar is voor de CPU zal het wel voor performance toename zorgen. Ik ben benieuwd of ze net zo'n grote cache kunnen leveren als AMD voor een normle prijs. AMD heeft juist voor 3D cache gekozen omdat die techniek hen in staat stelt kosteneffectief zoveel cache bij te plaatsen.
Ik weet nog van een heel oud moederbord dat dat IGP vast aan de southbridge had met daarbij 64 of 128mb geheugen, was volgens mij van de ATI Rage serie zo uit mn hoofd.
Dat was geloof ik nog Pentium 2 tijdperk, maar heb dat board al een tijdje niet meer gezien/vastgehad :)
De i7 5775c is met een gpu ernaast op Z97 Asus of MSI moederbord een gaming beest die bijna niemand serieus neemt maar sinds de AMD L3 party gaan deze chips voor dik 200 euro weg op ebay. In benchmarks duikt de oude chip steeds vaker op. De 128mb L4 en oc tot 4.4 ghz max zitten de prestaties rond de 6 core 8700k 5 ghz vooral het bijna stuttervrij gamen maakt de chip tot een topper.
3 maanden geleden overgegaan naar AMD 7900x en het enige verschil is de 20-30% fps gain (rtx 3070) de 7900x loopt op 4K uit ze neus te vreten 10% load de oude i7 deed ongeveer 70% load.
Zonder een gpu ernaast is de i7 5775c weinig aan de 128mb L4 is dan voor de igpu de Nvidia rtx kaarten maken de chip echt vele malen beter. Een 3080 zal waarschijnlijk 90% load geven daarom maar een systeem upgrade gedaan na 6-7 jaar 24/7 ook als server gebruikt te hebben.
bepaalde AMD moederborden een beetje RAM onboard hadden ten dienste van de chipset GPU
Ws heb je het over "sideport" geheugen, hier wat cijfers/info:
https://www.tomshardware....hics-sideport,2088-6.html

[Reactie gewijzigd door N8w8 op 28 juli 2024 11:32]

Dat was de naam inderdaad. Ik heb er naar gezocht maar vond de juiste termen niet meer :)
De paar moederborden die toevallig een plakje DDR onboard hadden zitten was ter onderbouwing of ondervanging van het relatief trage DDR2/DDR3 en IGP/Onboard Graphics.

In sommige gevallen was het ook te paren met een andere videokaart zodat je een crossfire tech had op bord / AGP of PCI-E kaart. Maar de performance was belabberd t.o.v een externe en goede GPU.

Dat hele onboard IGP tot op de dag van vandaag werkt pas echt lekker wanneer er een goed plak (snel) geheugen mee wordt geleverd. Maar dan wordt de processor gewoon te duur.

Zullen ongetwijfeld wel instap CPU's krijgen met daarop een IGP die krachtig genoeg is net zoals een console.
Is het mogelijk beschikbaar blijven van data in de cache na resetten niet een potentieel veiligheidsrisico?

Je wil toch dat een reset/(her)start een schone situatie biedt?

🤔
En na een herinstallatie verwacht je ook dat malware is verdwenen. Zit het straks persistent in de cpu ❓
Heb er idd ook vragen bij of er niet toch een vorm van volatiliteit hoort te zijn en of er anders ook toggles zijn om het L4 wel te wipen als dat nodig lijkt.

Stel je toch voor dat er een soort rootkit in zou belanden...
Stel je toch voor dat er een soort rootkit in zou belanden...
Cache werkt niet helemaal zoals ram, en kan hierdoor eigenlijk bij een correcte architectuur niet geïnfecteerd raken.
Ze hebben het over sneller opstarten. Dat doet vermoeden dat er state in de cache blijft.

Dat die state normaal het gevolg is van processorinteracties, doet er niks aan af dat iemand best kan proberen er creatief mee om te gaan.
Staat letterlijk in het artikel:
Ook moeten opstarttijden verlaagd worden door gebruik van L4-cache. De L4-cache zou namelijk gegevens bewaren bij het resetten van de pc.
Er is weinig over bekend en misschien is er wel iets op bedacht, maar hoe het er nu staat klinkt het wel kwetsbaar.
Aan de andere kant hebben we Spectre, Meltdown, en zo nog wat van die dingen die bij een "correcte architectuur" niet voor problemen hadden moeten zorgen. Nu zal Intel ook vast wel nadenken over wat de impact is op security voor geheugen dat resets overleeft als wij het in onze leunstoel kunnen bedenken, maar toch, het gaat niet vanzelf goed komen omdat het cache is.

[Reactie gewijzigd door MneoreJ op 28 juli 2024 11:32]

Rechtstreeks uit het artikel:
De L4-cache zou namelijk gegevens bewaren bij het resetten van de pc.
Goh, ik kan ook lezen. Cache word alleen op een totaal andere manier benaderd dan ander types geheugen (zoals storage). Een programma kan niet zelf artificieel L1/2/3/4 cache data veranderen en is daarom ook in theorie niet te infecteren zonder dat een andere laag, zoals storage al geïnfecteerd moet zijn (hoe komt die data anders in de cache?)

[Reactie gewijzigd door smiba op 28 juli 2024 11:32]

Dat cache zal toch ook zeker op een manier moeten beoordelen welk deel van de data persistent zou moeten zijn, en anders is de heuristiek die dat moet beoordelen/regelen vast ook wel een loer te draaien als men dat maar wilt.

Bijv sommige stukken geheugen zo (in-)frequent aanroepen dat daardoor de kans zo goed als gegarandeerd is dat het in een bepaald deel zit, iets wat in de praktijk ook al voorkomt, cache hints en het evicten van ranges zijn, door alle moderne processoren, ondersteunde technieken.

Neem bijv rowhammer, probleem was dat je niet altijd/direct een specifiek geheugenbereik kan claimen, maar als je maar vaak genoeg bepaalde hoeveelheden reserveert en wegschopt, kan dat alsnog bereikt worden.
Het is een logische volgende stap men wilde met Optane een soort gelijk iets bewerkstelligen. Het is duidelijk dat Intel ziet dat de grootste beperking van de huidige chips is hoe snel ze de nodige data kunnen ophalen uit het geheugen of erger nog de SSD.

Nu is dit probleem een veel fundamenteler probleem dat stamt uit het ontwerp van alle computers sinds Mr. von Neumann de architectuur heeft beschreven maar Intel snapt ook dat er weinig kans is dat dit drastisch wordt veranderd. Hoewel bedrijven als NVidia en ongetwijfeld ook Intel en AMD hier wel over na denken zeker met hun AI processors is het onwaarschijnlijk dat we in de nabije toekomst generieke CPU's gaan zien die de von Neumann architectuur laten varen. Voor gespecialiseerde AI chips zou dat me niet zo veel verbazen binnen een jaar of 5, ik denk dat er dan wel startups zullen verschijnen die heel iets nieuws weten te brengen en snel opgekocht worden door de grote jongens.

Dus de enige overgebleven route is steeds meer lagen cache plaatsen tussen de extreem trage SSD, he geheugen en de CPU core. Nu zijn het er vier op de chip maar als je de cache op de SSD ook mee rekent en het werkgeheugen ook zo ziet zijn er dus al 6 lagen van steeds sneller geheugen tussen de CPU core en de data op de SSD. Ik zou dan toch denken misschien is Optane niet zo'n heel slecht idee, als je de SSD heel erg veel sneller kan maken dan kun je waarschijnlijk met meer L3 cache veel verder komen dan met nog een laag cache en een nog complexere chip dien ten gevolgen.
Juist wel, de L4 cache zit in de cpu package. Bij AMD x3d zelfs bovenop de cpu die. De heel korte afstand zorgt ervoor dat de toegangstijd kan verkorten.
Optane zit gewoon fysiek te ver van de cpu.
Een oplossing zou zijn om ram ook stacked te gaan integreren bovenop de cpu. De cpu kloksnelheid/vcore zou dan wel fors moeten verlagen om koel genoeg te blijven. Ook is het concept nog niet vrij van kinderziektes, zie defecten bij 7xxx x3d chips en moederborden.
Afstand is op een andere manier een probleem. Data moet toch van opslag komen. Maar dat gaat nu eerst naar RAM, dan de L caches door alvorens het bij de CPU verwerkt wordt en weer via het RAM uiteindelijk terug op de opslag gezet wordt.

Optane was meer een poging om de afhankelijkheid van RAM in computing te doen weghalen. Er gaat daar een boel performance en snelheid verloren. De fysieke afstand is minder een probleem en we kunnen straks dus mogelijk NVME (of whatever de opvolger wordt) op de plek van RAM monteren.
Apple silicon en intel tiles zitten vlak naast mekaar.
En niet gestapeld houd in groter oppervlak voor warmteflow door de heatspreader.
Gestapeld houd in connecties verspreid over de chiplet zodanig dat de extra cache L3 tier blijft. Waar naast mekaar toch interconnect wat langer is en daarmee lagere tier cache L4 maar toch flinke low latancy tov verre Werkgeheugen.
Waarbij apple silicon de ram on soc is met hogere parallel bandbreedte.
Optaine heeft verschillende modes en dus use cases 1 ervan is non volitile memory. Denk aan bankzaken servers waar transacties niet verloren mogen gaan. Andere is heel veel meer lagere tier werkgeheugen ipv max 2TB mem kan je langzamere 16TB Optane hebben. Ook heel veel goedkoper werkgeheugen dan reguliere memory , maar bleef duur.
Dat ziet er uit als een 'SLC' oplossing, een System-Level Cache. In feite een grote cache/buffer die net voor je memory controller zit. Het voordeel is dat zo'n cache voorbij het punt van coherency ligt en deze cache dus geen coherency state hoeft te tracken, en daardoor veel simpeler is, en ook eventueel gesplitst kan worden in aparte blokken cache per memory channel. Je ziet dit soort oplossingen vaker in chips met geintegreerde GPU, waarbij de GPU niet de gewone coherente cache hierarchie zoals L1 t/m L3 deelt met de CPU, maar wel voordeel behaalt uit een dergelijke system level cache. Volgens mij doet het fruitbedrijf dit ook.
Ook moeten opstarttijden verlaagd worden door gebruik van L4-cache. De L4-cache zou namelijk gegevens bewaren bij het resetten van de pc.
Ik heb mij er niet in verdiept, maar als ik het zo uit mijn duim zou moeten zuigen dan verwacht ik dat hier dan e.e.a. van de UEFI bios in komt om heel wat initialisatie t/m de boot loader te cachen?

Want tenzij ze een cache hebben ten grootte van de PC RAM zal je echt niet een soort van hibernatie kunnen implementeren.
Dat zou behoorlijk zonde zijn van de beperkte L4 cache, die ruimte wil je niet verspillen aan een UEFI bios. Nee, ik denk dat het idee is dat het OS zelf in L4 cache blijft, en dat de bios moeite moet doen om de L4 cache niet aan te raken en het OS vanuit cache te herstarten.
concurrentie voor AMD 3D cache mooi zo ben benieuwd

vooral de feature dat die opstarttijden moet verkorten klikt goed dat doet 3D chache net
al vraag ik me wel af is dat geen gimmick afgezien van AM5 moederhborden start tegenwoordig bijna elk high-end systeem in no time op

maar voor low end spul misschien leuk
Wat is dat met AM5 moederborden?

Nu heb ik er in de praktijk niet zo'n last van, ik start m'n computer doorgaans maar 1x per dag op, maar het is wel opmerkelijk dat m'n nieuwe AM5-gebaseerde computer echt iets van 30 seconden nodig heeft voordat er überhaupt een teken van leven uit komt.
naar ik begrijp RAM training alleen doet ie dat elke keer in plaats van 1 keer

neem dit met een bak zout want ik ben een leek op dit gebied maar dit begreep ik van een post op reddit rond AM5 release
Ik heb dit alleen als mijn profiel niet werkt. Dan faalt hij eerst en dan gaat hij een goed (Langzaam) Ram profiel pakken. Dat duurt even, geen idee wat er in bios plaats vindt dan. maar daarna boot hij weer normaal snel.
Heb je fastboot uitstaan in de bios?
Mijn Windows 10 gaat altijd in de slaapstand totdat ik weer gedwongen wordt de updates te installeren. De opstarttijden van de computer zijn niet relevant: Hooguit 5 secondes. En dan heb ik nog niet eens een SSD in gebruik. Bij een andere PC met SSD duurt de koude start hooguit 10 secondes. Ik denk dan ook niet dat het opstarten van het OS een doorslaggevend verkoopargument zal zijn. Eerder zal het bij gamen een prestatiewinst geven, net zoals de 3D RAM van AMD.
Een OS als XP zou in principe volledig in de cache van zo'n 7800X3D passen. Een RAMdisk is er niets bij op deze snelheden.
MTL zal een stuk lagere klok hebben dan raptorlake of raptorlake refresh.
Dus samen met MTL hogere IPC en L4 moet klok achterstand nog gekompenseerd worden tov 13900KS de reden dat iNtel richt op mobile only. Het zal toch 1st eigen raptorlake voorbij moeten gaan . Wat wel voordeel is net als met 3dvcache dat zuiniger is dus verwacht efficentere game performance. Klopt MTL raptor lake dan is desktop versie ook mogelijk. Maar mogelijk in samples en beleid voor mobile only valt dat mogelijk tegen.

Op dit item kan niet meer gereageerd worden.