Door Tomas Hochstenbach

Redacteur

Intels radicale antwoord op Ryzen 9000

Intel Core Ultra 5 245K, 7 265K en 9 285K Review

24-10-2024 • 17:00

317

Singlepage-opmaak

Tiles van TSMC met nieuwe P- en E-cores

Arrow Lake is voor het eerst in bijna drie jaar tijd weer een compleet nieuw product voor de desktop. In november 2021 kwam Alder Lake (12th Gen Core) uit, waarvan het ontwerp vrijwel onaangepast werd hergebruikt voor Raptor Lake (13th en 14th Gen Core). De grootste technische wijziging in Arrow Lake is dat het niet langer één grote, monolithische chip is, maar een complex van onderling communicerende dies. Deze tiles, AMD zou ze chiplets noemen, communiceren met elkaar via een basetile.

Intel Core Ultra 200 Arrow Lake tiles

Waar AMD in desktop-cpu's tot nu toe twee soorten chiplets gebruikt, een computechiplet met de cpu-cores en een i/o-chiplet met de rest van de logica, bestaat Arrow Lake uit vier actieve tiles, waarbij de inactieve fillertile en de basetile niet worden meegeteld. Geen van die actieve tiles zijn afkomstig uit Intels eigen fabrieken. De computechiplet met de cpu-cores wordt geproduceerd op TSMC's nieuwste N3B-proces, de gpu-tile op TSMC N5P, en de soc- en i/o-tiles op TSMC N6. Oorspronkelijk zou de computetile op Intels 20A-node worden gebakken, maar die is vorige maand officieel geannuleerd. De basetile wordt overigens wel geproduceerd op Intels inhouse 1227.1-procedé, en ook de Foveros' 3d-packaging vindt bij Intel plaats.

Het topmodel van de nieuwe serie krijgt zoals gezegd de naam Core Ultra 9 285K. Dit snelste model krijgt, net als zijn voorganger, de Core i9 14900K, een combinatie van acht P-cores en zestien E-cores. Beide soorten cores zijn echter gebaseerd op een vernieuwde architectuur.

De nieuwe P-cores heten Lion Cove, de nieuwe E-cores heten Skymont. Beide cores kwamen ook voor in de Lunar Lake-processors voor dunne, lichte laptops. Afgezien van de hoeveelheid cache per P-core, zijn de in Arrow Lake toegepaste cores identiek aan die in Lunar Lake.

Lion Cove: P-core zonder Hyper-Threading

De verbeteringen in Lion Cove hebben we dus al eens uitgebreid besproken in onze Lunar Lake-preview. Veel onderdelen van de core zijn breder geworden, zowel in de frontend als bij de rekeneenheden. Daarnaast zijn diverse caches vergroot. Wezenlijker is het herontwerp van wat Intel de database noemt, als het ware de bouwblokken waaruit de P-core is opgebouwd. Er waren eerder namelijk nog nooit P-cores op een niet-Intel-procedé gemaakt, waardoor het ontwerp nog allerlei specifieke mogelijkheden van Intel-nodes gebruikte. De herontworpen Lion Cove-core is volgens Intel 'voor 99 procent productieprocesonafhankelijk'.

Intel Core Ultra 200 Arrow Lake P-core

Daarnaast is ondersteuning voor Hyper-Threading weggehaald uit Lion Cove. Volgens de fabrikant is de functie daarvan, op een relatief efficiënte manier meer multithreaded prestaties bieden, inmiddels overgenomen door de in groten getale aanwezige E-cores. Efficiënt slaat daarbij zowel op energiezuinigheid als het innemen van weinig fysieke ruimte op de chip. Bij Lunar Lake onderbouwde Intel het weglaten van Hyper-Threading ook nog met een berekening van de prestaties per watt, maar die is in Intels slides over Arrow Lake niet meer te bekennen. Voor desktops is dat minder belangrijk dan voor apparaten met een accu. Vermoedelijk moet je het verdwijnen van HT op de desktop vooral zien als een stukje nevenschade van de voor laptops genomen ontwerpbeslissing.

Intel claimt dat Lion Cove op dezelfde kloksnelheid 9 procent sneller is dan Raptor Cove, de core uit de dertiende en veertiende generaties. Bij de release van Lunar Lake vergeleek Intel Lion Cove met Redwood Cove, de P-core in de mobiele Meteor Lake-cpu's die de desktop nooit heeft bereikt, en kwam tot een hoger percentage van 14 procent. Opvallend, want daarmee geeft Intel dus toe dat Redwood Cove destijds een achteruitgang was ten opzichte van Raptor Cove, zoals al bleek uit onze benchmarks.

Intel Core Ultra 200 Arrow Lake P-core ipc

Skymont: Monsterlijk snelle E-core

Van de twee soorten cores is de stap bij de E-core echter veruit het indrukwekkendst. Wederom zullen we niet de volledige introductie van Skymont in onze Lunar Lake-preview herhalen, maar tot de hoogtepunten behoren een anderhalf keer zo grote decoder, een anderhalf keer zo lange micro-op-queue en forse uitbreidingen van het aantal integer- en vectorrekeneenheden.

Intel Core Ultra 200 Arrow Lake E-core

Bij integerberekeningen is een Skymont-core in Arrow Lake daardoor 32 procent sneller dan een Gracemont-core zoals die in de 14th Gen Core zat. Bij floatingpointberekeningen is het verschil nog aanzienlijk groter; gemiddeld zou de prestatiewinst daarbij 72 procent bedragen. Eerder zei Intel dat daarmee het ipc-niveau van Raptor Cove, de P-core uit de vorige generatie, wordt geëvenaard. Nu kon die natuurlijk aanzienlijk hoger klokken en blijft het piekprestatieniveau van Raptor Cove daarmee hoger, maar toch is de stap die Intel in één generatie claimt te zetten met zijn E-core indrukwekkend.

Intel Core Ultra 200 Arrow Lake E-core ipc

Waar de E-cores bij Lunar Lake uit het computegedeelte van de chip werden gehaald en in een 'low-powerisland' werden geplaatst, zitten ze bij Arrow Lake wel gewoon op de computetile. Het idee bij Lunar Lake was vooral dat de complete computetile uitgeschakeld kon worden zolang er geen zware rekentaken werden uitgevoerd, maar op de desktop is het belangrijkste doel daarvan, accutijd besparen, niet van toepassing. De E-cores hebben daardoor direct toegang tot dezelfde ringbus als waar de P-cores mee in verbinding staan.

Caches, Thread Director en powerstates

Naast de vernieuwde P- en E-cores is ook de gedeelde L3-cache aangesloten op die ringbus. Die is bij Arrow Lake 36MB groot, net zo groot als bij Raptor Lake. Ook de hoeveelheid L2-cache van de E-cores, 4MB per cluster van vier stuks, is niet gewijzigd. Dat is wel het geval bij de P-cores, die ieder 3MB L2 tot hun beschikking hebben; dat is 1MB meer dan bij Raptor Lake en 0,5MB meer dan dezelfde P-cores in Lunar Lake hebben.

In onderstaand diagram valt bovendien op dat de clusters met E-cores nu tussen de P-cores in zijn geplaatst. Voorheen zaten alle P-cores bij elkaar, gevolgd door alle E-cores. Volgens Intel levert deze spreiding een betere warmtedissipatie op, zeker in scenario's waarin niet zowel de P- als de E-cores volledig worden belast. Daarnaast wordt de latency tussen de verschillende typen cores hierdoor korter.

Intel Core Ultra 200 Arrow Lake cache

Verder heeft Intel enkele verbeteringen doorgevoerd aan de Thread Director, het deel van de cpu dat het OS zogenaamde hints stuurt over op welke cores een programma het beste kan draaien. Van de E-cores was tot nu toe slechts beperkte feedback beschikbaar; die hebben nu hardwarematige voorspelling aan boord. Ook de telemetrie van processen op de P-cores is uitgebreid en ten slotte heeft Intel het complete voorspellingsmodel bijgewerkt, wat tot betere scheduling moet leiden.

Opvallend is dat Intel de aanpak om taken te starten op de E-cores heeft gekopieerd van Lunar Lake. Threads worden pas naar de P-cores verplaatst als blijkt dat ze meer prestaties nodig hebben. Bij oudere desktop-cpu's was dit nog andersom: altijd starten op de P-cores, verplaatsen naar de E-cores als die prestaties niet nodig blijken. Volgens Intel zou deze aanpak helpen bij het totale energiegebruik over de periode dat het systeem actief is, omdat pc's vaak aanstaan zonder dat er maximale prestaties worden gevraagd. Games en andere taken waarvoor hoge prestaties vereist zijn, geven de scheduler hints zodat ze vrijwel direct worden verplaatst naar de P-cores, aldus Intel.

Intel Core Ultra 200 Arrow Lake Thread Director

Lees meer