Mensen die producten met Core m kopen, zullen natuurlijk niet de hoogste prestaties nodig hebben. Ze zijn bedoeld voor producten zonder fan die dun en licht zijn. Wie Core m koopt, zal eerder kleinere workloads draaien. In zulke gevallen heb je erg veel baat bij een hoge turbosnelheid, iets wat Apple met hun 1.5GHz A8X niet begrijpt, om daarna snel terug idle te gaan (race to halt). Wie de meeste prestaties voor korte worksloads wilt, zal dus de snelste SKU moeten aanschaffen. Dit is eigenlijk gewoon een soc zoals andere socs van bv. Qualcomm (met enige verschil dat het eigenlijk 2 chips zijn omdat de PCH niet geïntegreerd is). Wanneer je iets niet (intensief) gebruikt, wordt het gewoon uitgeschakeld (power gating), en er zijn nog verscheidene andere trukjes om het gebruik te verminderen. Al bij al is het verbuik van Skylake tijdens idle en video circa de helft verminderd, waardoor meer van het TDP-budget door de cores kan worden gebruikt. (Voor ruwe performance op zich is daarnaast ook nog de performance per watt belangrijk, beïnvloed door architectuur en procedé, maar de vergelijking is hier tussen SKU's van dezelfde productlijn, dus hier niet belangrijk.)
Zo heeft Skylake DCC (Duty Cycle Control) gebracht voor de cores (in Broadwell al bij de graphics). Bij DCC wordt bij lage kloksnelheden gebruikgemaakt van het feit dat verbruik linear met kloksnelheid en kwadratisch met voltage schaalt. Bij lage kloksnelheden is het laagste voltage echter al bereikt, dus kloksnelheden die nog lager zijn, zouden slechts linear minder verbruiken. Daarnaast heb je echter ook nog een deel van het gebruik dat een lekstroom is.
Die lekstroom kan je elimineren door de CPU een tijdje uit te schakelen, en dan een hogere kloksnelheid te gebruiken bij datzelfde laagste voltage. Dus stel dat de hoogste kloksnelheid bij het laagste voltage 500MHz is, en je wilt een effectieve kloksnelheid van 250MHz hebben, dan zet je de kloksnelheid op 500MHz voor een halve seconde, en zet je de CPU uit voor de andere halve seconde.
En verder in Skylake:
Same process as Broadwell requires microarchitecture and design
innovation to further reduce active and average power
• Reductions in every part of interconnects, inside IPs, I/O, PLLs etc.
• Drastic power reduction vs. previous generation SoC power in video
playback, multimedia, and win-idle
• Low power support of high resolution panels (example: 25x14 -> 32x18:
1.6x pixels but only 1.2x power)
• More active power budget remains for real compute on IA/GT in power
limited form factors (especially in fanless designs)
(Voor dat laatste zal voor gaming bijvoorbeeld DirectX 12 ook
kunnen helpen, aangezien die de CPU-load drastisch vermindert, waardoor de GPU meer kan verbruiken.)
Het belangrijkste, voor
sustained performance, is echter het ontwerp van de producten zelf en hoe er met de hitte wordt omgegaan (hardware + software). Dit kan ervoor zorgen dat de op papier traagste SKU toch nog de snelste kan zijn bij langere workloads. Bij fanless producten is koeling erg belangrijk, in combinatie met form factor. Omdat de producten fanlass zijn, kan er erg veel variatie zijn.
AnandTech heeft hier een onderzoek naar gedaan:
Analyzing Intel Core M Performance: How 5Y10 can beat 5Y71 & the OEMs' Dilemma; de traagste SKU met 2.0GHz burst kwam dus als snelste uit de bus.
So with all of this data, what more do we know about Core M? Clearly, Intel’s goal with Core M is to provide excellent performance on short workloads. It has higher boost frequencies than the Core i5-5200U that was included in this test, and it has 4 MB of L3 cache as well compared to 3 MB of cache on the i5. On certain workloads, performance can even surpass the i5-5200U. Race to sleep is not a new idea, but that is what Core M is designed to do, and it does it well. Run on very little power, and then when tasked with work, get it done as quickly as possible and get back to the low power mode
The same can be said of Core M. In order to get something as powerful as the Core architecture inside of a fanless tablet, there is going to be compromise. In a Core M device, that is going to be sustained performance. What you give up in sustained performance though allows a thinner and lighter device, in form factors that would never have been possible with Core even one year ago. But it also means that the Core M SKU designation is only a sign of general performance, rather than absolute positioning. For that, we have to compare and contrast each unit in a review.
Dit recente artikel van AnandTech geeft ook een mooi inzicht in de software:
Understanding Intel's Dynamic Power and Thermal Framework 8.1: Smarter ThrottlingHowever in the case of DPTF 8.1, this system has changed. Instead of a fixed correlation, the system is now adaptive depending upon a number of factors. One of the key examples cited is device orientation, as how a device is placed has a significant impact on its ability to cool itself. For example, when a tablet is placed flat on a table with the display up, the back of the tablet is unable to rely on convection and ambient air flow to cool the back cover. With previous iterations of DPTF, this worst-case style setup was what was used to determine how to correlate temperature sensors with skin temperatures.
The problem with that approach was that when the device was placed in a situation where cooling was better, such as held vertically in the air or held in a dock with a circulation fan, DPTF wouldn’t change the temperature sensor correlations to skin temperature. This meant that in long run TDP-gated situations that the device was throttled to a greater extent than truly necessary.
It turns out this one change has enormous effects on performance in these thermally limited situations. With a vertical orientation, heat dissipation and thereby power headroom increases by 66%. With an active cooling dock, power headroom increases by 97%.
Tot slot, wie de presentaties van IDF wilt bekijken:
Skylake architecture (pdf) /
webcast.
Skylake power mangement (pdf) /
webcast. De artikels van AnandTech vorig jaar over
Core m / Broadwell-Y geven ook wel een mooi inzicht.
TL;DR:
Kleine workloads: hoge burst (zie specs)
Lange workloads: goede koeling (zie reviews voor benchmarks)
Edit: Even een verduidelijking over mijn opmerking over Apple. Was een beetje een nonchalante opmerking. Natuurlijk weet Apple wel dat je met een hoge kloksnelheid mooie dingen als race to halt kunt doen, maar ik vermoed dat de A8-CPU daar gewoon niet voor gemaakt is, waardoor het verbruik te sterk zou toenemen. Als je een CPU ontwerpt moet je altijd compromissen maken. Je hebt maar zo veel budget en tijd, en sommige dingen krijgen dan een grotere prioriteit. Voor Apple was de keuze om een grote core te ontwerpen, die bij lage kloksnelheid al erg snel is. Aangezien smaprthones en tablets het doel is, is een hoge kloksnelheid dan niet noodzakelijk (want zonder 2-3GHz te halen kan de beoogde performance al gehaald worden), dat zou alleen extra tijd en waarschijnlijk ook
die area kosten (zonder optimalisaties geraakt Core ook
niet verder dan 1.8GHz). Intels Core daarentegen is van oudsher een architectuur voor desktops, waardoor Intel die hoge kloksnelheid goed kan benutten voor zeer goede burst-prestaties.
[Reactie gewijzigd door witeken op 23 juli 2024 09:34]