De tick-tock-cadans die Intel jaren wist vol te houden en waarbij een nieuwe processorarchitectuur, of tock, werd gevolgd door een verkleining van het productieproces, of tick, blijkt sinds enige generaties niet meer haalbaar. In plaats daarvan zagen we al bij 22nm-Haswell-processors een tweede of refresh-generatie, terwijl aan een die-shrink naar 14nm gewerkt werd. Die kwam met Broadwell-processors, Intels eerste 14nm-generatie, in september 2014. De tock van 14nm, Skylake, kwam elf maanden later en bracht verbeteringen in de microarchitectuur van de processors.
Met de opvolger van Skylake komt er geen nieuwe architectuur, maar een refresh van de 14nm-generatie. Kaby Lake heeft een vrijwel ongewijzigde microarchitectuur en wordt nog steeds op 14nm geproduceerd. Toch is Kaby Lake net iets meer dan puur een refresh van Skylake en daarom krijgt het ook een eigen codenaam in plaats van simpelweg 'Skylake Refresh'. We kunnen Kaby Lake echter wel grotendeels als refresh van Skylake zien en zo behandelen we het dan ook. We zetten de verbeteringen en aanpassingen ten opzichte van Skylake op een rijtje en laten de nieuwe functies de revue passeren.
Introductie: stapsgewijs
De eerste producten van de Kaby Lake-generatie zijn, net als bij de Broadwell-introductie, enkel geschikt voor mobiel gebruik. De desktopmarkt krimpt nog altijd en de grootste winsten op het gebied van energiegebruik en integratie zijn op de mobiele markt te halen. De Kaby Lake-processors worden ontwikkeld voor zeer dunne laptops, 2-in-1-apparaten en kleine, compacte pc's, zoals nucs en compute sticks. De eerste reeks Kaby Lake-processors bestaat dan ook uit zes laptopprocessors: drie uit de U-serie en drie uit de Y-serie. Daarmee bedient Intel laptops met processors met tdp's van 4,5 tot 15W, en alle processors zijn dualcores met hyperthreading-ondersteuning en uiteraard een ingebouwde gpu. De eerste producten met deze zevende generatie Core-processors moeten in september al verkrijgbaar zijn; die worden ongetwijfeld op de IFA in Berlijn aangekondigd.
De zes processors hebben de volgende specificaties, over de gpu's zijn nog geen details vrijgegeven:
Y-series | Core m3-7Y30 | Core i5-7Y54 | Core i7-7Y75 |
---|---|---|---|
Cores/threads | 2/4 | 2/4 | 2/4 |
Kloksnelheid | 1GHz | 1,2GHz | 1,3GHz |
Turbosnelheid | 2,6GHz | 3,2GHz | 3,6GHz |
Geheugen | 2x ddr3l 1600MHz 2x lpddr3 1866MHz |
2x ddr3l 1600MHz 2x lpddr3 1866MHz |
2x ddr3l 1600MHz 2x lpddr3 1866MHz |
Prijs | 281 dollar | 281 dollar | 393 dollar |
U-series | Core i3-7100U | Core i5-7200U | Core i7-7500U |
---|---|---|---|
Cores/threads | 2/4 | 2/4 | 2/4 |
Kloksnelheid | 2,4GHz | 2,5GHz | 2,7GHz |
Turbosnelheid | 2,4GHz | 3,1GHz | 3,5GHz |
Geheugen | 2x ddr3l 1600MHz 2x lpddr3 1866MHz 2x ddr4 2133MHz |
2x ddr3l 1600MHz 2x lpddr3 1866MHz 2x ddr4 2133MHz |
2x ddr3l 1600MHz 2x lpddr3 1866MHz 2x ddr4 2133MHz |
Prijs | 281 dollar | 281 dollar | 393 dollar |
In januari, ongetwijfeld met de CES in Las Vegas als achtergrond, volgt de volgende reeks processors van de Kaby Lake-generatie. Intel zal dan niet alleen desktopprocessors aankondigen, maar ook de high-end sku's voor laptops, zoals de HQ-serie quadcores en de H-serie. Ook overklokbare K-processors en modellen voor zakelijke toepassingen, zoals Xeons voor servers en workstations, volgen dan.
Verbeteringen: 4k
Een van de grootste en, wat de opbouw van de processors betreft, een van de weinige verbeteringen, is de vernieuwde media engine. De gpu is op zichzelf vrijwel onveranderd en gebaseerd op de Gen9-architectuur, die bij Skylake werd geïntroduceerd. Dus de execution units, verdeeld in slices en subslices, verzorgen de grafische rekentaken. Het zijn generieke verwerkingseenheden en voor specifieke taken is het efficiënter om aparte blokken te bouwen die alleen die taak kunnen uitvoeren. Dergelijke dsp's zijn zuiniger en hebben als bijkomend voordeel dat het grootste deel van de gpu uitgeschakeld kan blijven. In zijn processors heeft Intel dergelijke dsp-blokken om bijvoorbeeld video te decoderen. Bij het kijken naar een film kan zo hardwarematig video worden gedecodeerd met een decode engine. De rest van de gpu of cpu hoeft dit dan niet in software te decoderen, wat meer rekenwerk en dus energie zou kosten.
De decode engine in Kaby Lake is vernieuwd en ondersteunt nu nieuwe codecs voor de weergave van video. De processors konden uiteraard al 4k weergeven, maar nu is er ondersteuning voor 4k-videomateriaal dat gecodeerd is met de hevc-10bit- of vp9-codecs. Eerstgenoemde hevc-codec is ook bekend als h265 en wordt voor onder meer blu-rays en Netflix-streams gebruikt. Onder andere YouTube gebruikt de vp9-codec voor zijn 4k-streams.
Naast de decode engine voor 4k-hevc- en vp9-video zijn ook de processing engine en display engine voor video geschikt gemaakt voor efficiëntere verwerking van videostreams. Het resultaat van de aanpassingen is de mogelijkheid om met een veel lager energiegebruik 4k-video te bekijken. In demonstraties liet Intel een zesde generatie Core-laptop zien, die ongeveer 50 procent cpu-belasting toonde tijdens het afspelen van 4k-video, terwijl een zevende generatie Core-laptop slechts vijf tot tien procent cpu-load toonde. Dat moet leiden tot laptops die ruim negen uur 4k-hevc-content kunnen streamen. Vp9-content van YouTube zou 1,75 maal zo lang afgespeeld kunnen worden. Een testsysteem zou zonder de hardwarematige vp9-ondersteuning vier uur video kunnen afspelen, terwijl een Kaby Lake-systeem zeven uur zou halen. Daarbij werd een laptop met een Core i7-6500U vergeleken met een laptop met Core i7-7500U, beide met een 4k-scherm en een 66Wh-accu.
Behalve voor decodering is de Kaby Lake-gpu ook geschikt voor het coderen van video. Door middel van Intels Quick Sync-functionaliteit kan 4k getranscodeerd worden. Daarbij kun je kiezen uit twee instellingen: een snelle FF-mode die van de fixed function of dsp gebruikmaakt, en een instelling die betere kwaliteit biedt en van de gpu gebruikmaakt. Die laatste is vanzelfsprekend energie-intensiever.
Het verbeterde mediablock bestaat uit drie fixed function media engines: de multi-format codec of mfx, de video quality engine of vqe en de scaler en format converter of sfc. In de mfx zijn onder meer de coderings- en decoderingsfunctionaliteit voor hevc 8- en 10bit, en vp9 toegevoegd, en is de ondersteuning voor wireless display verbeterd. Ook zijn hier de verbeterde fixed function mode voor quicksync en de beter presterende oavc-decode-functie ondergebracht. In de vqe is ondersteuning voor hdr toegevoegd. De media engine ten slotte, moet in staat zijn om maximaal acht 4k30p-avc- of -hevc-streams gelijktijdig weer te geven en voor hogere kwaliteit 4k60p worden streams tot 120Mbit/s ondersteund. Een 4kp30-steam kan op een Y-serieprocessor getranscodeerd worden met tweemaal de realtime-snelheid, mits van avc naar avc geconverteerd wordt, bij het transcoderen van avc naar hevc gebeurt het in realtime. Op de U-serie processors gebeurt dat op respectievelijk driemaal en tweemaal de realtime-afspeelsnelheid.
Het 14nm+-procedé
Het is niet ongebruikelijk dat er gedurende de levensduur van een technologienode, in dit geval de 14nm-node, steeds betere chips met steeds hogere opbrengsten gebakken worden. Dat is ook het geval bij de inmiddels derde generatie 14nm-processors. Intel kon immers al oefenen met Broadwell en Skylake. Het procedé is volgens de fabrikant inmiddels zo ver doorontwikkeld dat Intel spreekt van een 14nm+-procedé, of 14Plus. Heel concreet over de verbeteringen en aanpassingen die dat met zich meebrengt, is het bedrijf echter niet; het blijft vaagheid troef.
Een van de verbeteringen die Intel voor 14nm+ claimt, is een verbeterd vinontwerp, wat de prestaties zou verhogen. Vanaf 22nm-processors maakt Intel gebruik van finfets, ofwel transistors met een of meer hoge kammen voor de gates. Hoe groter de oppervlakte van die gate, des te betere prestaties van de transistors mogelijk zijn. De vinnen in Kaby Lake-transistors zijn hoger en hebben dus een groter oppervlak. Ook de spanning of strain in het silicium van het channel, dat voor een betere mobiliteit van de elektronen zorgt en dus beter geleidt, is vergroot. Ten slotte is het ontwerp van de processors hand in hand gegaan met verbeteringen in het productieproces. Dat kan volgens Intel leiden tot een verhoging van de prestaties met twaalf procent.
Daar wringt de schoen een beetje, want Intel laat cijfers zien waarin een i7-7500U inderdaad twaalf procent beter presteert in Sysmark 2014 dan een i7-6500U. Die laatste draait echter op maximaal 3,1GHz, terwijl de Kaby Lake-processor maximaal 3,5GHz aantikt. Dat snelheidsverschil zou de prestatiewinst al volledig kunnen verklaren. Bij kort-intensieve workloads, Intel noemt ze 'bursty', zou het verschil tussen de Skylake- en Kaby Lake-processors oplopen tot negentien procent, een verschil dat niet door de hogere clocks te verklaren is. Of toch wel? De Speedstep-technologie is namelijk ook weer aangepast en verbeterd. Speedstep neemt het schakelen tussen verschillende powerstates uit handen van het besturingssysteem en handelt dat in hardware af. Dat kan het veel sneller dan bijvoorbeeld door Windows, dus kan een Speedstep-processor veel sneller naar hogere powerstates schakelen en ook sneller terugschakelen.
Los van hogere kloksnelheden en sneller opschakelende turbo's zijn er weinig architecturele veranderingen in Kaby Lake. Met het meer gerijpte procedé zijn hogere kloksnelheden met dezelfde tdp's mogelijk, maar het idle-verbruik zou vrijwel onveranderd zijn. Tegen de toch al lage lekstromen kan weinig meer gedaan worden. Het idle-verbruik zou 40 tot 50mW bedragen, voor zowel de Skylake als de Kaby Lake-generatie. De grootste verandering lijkt vooralsnog de ondersteuning voor 4k-content met hevc- en vp9-codecs te zijn. Zodra we laptops met de nieuwe generatie in handen krijgen, kunnen we dat testen. Dat moet ons tevreden stellen tot we in januari met de desktopprocessors kunnen spelen.