Ook de architectuur van de zuinige core, Gracemont, wordt voor het eerst toegepast in Alder Lake. De nieuwste telg in de familie van zuinige cores was tot nu toe Tremont, geproduceerd op Intels reguliere 10nm-proces. Gracemont maakt vanzelfsprekend gebruik van Intel 7 - Alder Lake is immers een monolithische chip - maar bevat ook grote wijzigingen op architectuurniveau.
Frontend en backend
De frontend van Gracemont steekt significant anders in elkaar dan die van Golden Cove. Gracemont heeft geen micro-opcache en heeft daarmee twee in plaats van drie paden om micro-ops aan de micro-opqueue toe te voegen: via de branchpredictor, die gelijkaardige principes volgt als die van de coves, en via de decoders. De decoder is 6-wide verdeeld over twee 3-wide clusters, die elk aan een andere instructietak kunnen werken. Vandaar de relatief grote instructiecache van 64kB: daar putten beide decoderclusters uit. De out-of-orderbuffer kan 256 entries tellen, tegenover 208 bij Tremont.
Aangekomen in de backend zijn er in totaal zeventien executionpoorten beschikbaar, meer dan het dubbele van wat Tremont had. Vijf daarvan zijn voor floatingpointberekeningen, twaalf voor integers en geheugentoegang. Elke core telt vier integer-alu's (was drie), vier agu's (was twee), twee jumps (was een) en twee storedata's (was een). Voor floatingpointwerk zijn er nog eens twee storedata's en drie alu's beschikbaar, al is de nieuwe, derde alu wat functionaliteit betreft erg simpel gehouden.
De vier agu's zijn onderverdeeld in twee loads en twee stores, die schakelen met 32kB datacache en 4MB L2-cache. Er kunnen maximaal 64 cachemisses uitstaan.
Dat juist de backend zo is verbreed, betekent dat de Gracemont-core erg geschikt is voor parallel rekenwerk. Identieke instructies kunnen immers door verschillende poorten tegelijk worden verwerkt. In de praktijk moeten deze cores hierdoor bijzonder geschikt zijn voor multithreaded workloads, zoals rendering.
Overigens heeft Intel deze gelegenheid ook aangegrepen om diverse beveiligingsfeatures toe te voegen, zoals controlflow-enforcement en VT-rp, evenals nieuwe instructietypen voor vectors: wide vector, fma, VNNI.
Prestaties
Volgens Intel leveren alle optimalisaties gezamenlijk een prestatieniveau op dat vergelijkbaar is met dat van de 'grote' Skylake-core, zoals die werd gebruikt tot en met de tiende generatie Core-processors voor desktops, bij een gelijke kloksnelheid. Om dat prestatieniveau te behalen, heeft de Gracemont-core bovendien 40 procent minder stroom nodig dan Skylake. In puur multithreaded workloads zou het verschil in stroomgebruik zelfs oplopen tot 80 procent.
Een directe vergelijking met voorganger Tremont maakt Intel niet, dus de prestatiewinst ten opzichte daarvan is niet duidelijk.