Door Willem de Moor

Redacteur

De Skylake-architectuur

De techniek achter Intels nieuwe cpu's

02-09-2015 • 03:00

74

Multipage-opmaak

Inleiding: stapsgewijze introductie

Intel heeft begin augustus, tijdens de Keulse Gamescom, zijn eerste processors met de Skylake-architectuur uitgebracht. Anders dan we gewend zijn, gaf het Amerikaanse bedrijf bij de release nog geen details over de architectuur vrij. Bovendien introduceerde Intel slechts twee processors tijdens de gamebeurs: de Core i7-6700K en de Core i5-6600K, beide vooral gericht op overklokkers en gamers. De mainstream-processors, zoals de gewone Core-processors voor de desktop, én alle mobiele processors worden pas in september geïntroduceerd. Tussen de twee introducties in vond het jaarlijkse Intel Developer Forum plaats: dat was de plek waar Intel de details over de architectuur van Skylake uit de doeken deed.

De stapsgewijze introductie van Skylake-producten is vrij gebruikelijk voor Intel, maar we zijn niet gewend de achtergrondinformatie over de architectuur zo laat te krijgen. Zo werd bij de vorige generatie, Broadwell, eerst de Core M-serie geïntroduceerd, waarna mobiele en enkele desktopvarianten volgden. Volgens Intel is de achtergrondinformatie over Skylake echter eigenlijk nog te vroeg vrijgegeven, omdat de mobiele processors nog niet zijn uitgebracht. De ontwerpkeuzes voor de architectuur zouden pas tot hun recht komen als de prestaties van de mobiele producten bekend zijn; Skylake is namelijk bovenal een zuinige architectuur voor mobiele processors.

Skylake start to finish

Toen de ontwikkeling van de Skylake-architectuur enkele jaren geleden van start ging, kreeg het ontwikkelteam de opdracht om processors te ontwikkelen die sterk zouden lijken op eerdere generaties. Dat wil zeggen, een tdp-variatie van ongeveer een factor drie, een factor twee variatie in fysieke afmetingen en een i/o-configuratie voor klassieke pc's. Omdat de nadruk in de laatste jaren steeds meer op mobiel kwam te liggen, veranderden die eisen echter sterk. Zo zou het tdp-bereik een factor twintig worden en de afmetingen een factor vier variatie krijgen. De i/o-configuratie zou geschikt worden voor pc's, tablets en socs, met de nadruk op een laag idle-verbruik en het zuinig afspelen van media. Hoe Intels overwegend Israëlische en Indiase designteam deze eisen in de Skylake-architectuur heeft verwerkt, bekijken we in dit achtergrondstuk.

Het platform

Onze reis door de krochten van de Skylake-architectuur begint met een algemeen overzicht van het platform. Skylake zal behalve in de in augustus geïntroduceerde Core i7-6700K en Core i5-6600K voor de desktop, eveneens worden toegepast in mainstream-desktopprocessors, mobiele processors voor laptops en socs voor tablets. Er komen reguliere desktop-Core i3-, i5- en i7-processors, maar ook Pentiums en Celerons. Voor mobiele apparaten komen er H-, U- en Y-series. De Core M-serie wordt uitgebreid met drie varianten: de M3, M5 en M7.

Skylake-lineup

Behalve in consumentenproducten wordt Skylake in processors voor de zakelijke markt gebruikt. Niet alleen krijgen de Xeon-series voor servers en workstations de nieuwe architectuur aan boord, er is daarnaast een mobiele Xeon-processor, voor in een laptopworkstation, gepland in twee varianten. Laptops krijgen een tweede primeur: een overklokbare laptopprocessor. Die zogeheten K-processor krijgt net als de K-serie voor de desktop een vrij instelbare multiplier en een aanpasbare baseclock.

De H- en S-series Skylake-processors worden met de Series 100-chipset gecombineerd, maar de Y- en U-series hebben een geïntegreerde platform-i/o aan boord. De tdp's variëren van 4,5W voor de Y-serie, via 15 en 28W voor de U-serie en 45W voor de H-serie, tot 35, 65 en 91W voor de S-serie. Daarmee varieert de tdp van 4,5W tot ruim twintigmaal zoveel, 91W, voor de desktop-overklokprocessors. Overigens krijgen de Skylake-processors weer nieuwe badges en worden Core M-socs makkelijker te onderscheiden door de M3-, M5- en M7-naamgeving.

Er zijn twee keuzes voor het geheugen: ddr4 of ddr3l. Daarbij valt op dat ddr3-geheugen niet langer ondersteund wordt. Alleen het zuinigere ddr3l, dat op 1,35V werkt, werkt nog samen met de Skylake-processors. De ondersteunde snelheden voor ddr3l zijn tot 1600MHz, terwijl mobiele processors ook lpddr3 ondersteunen, met snelheden tot 1866MHz. Ddr4 wordt op snelheden tot 2133MHz ondersteund, maar met overklokken zijn hogere geheugensnelheden mogelijk.

Skylake-packages

Ten slotte zijn verschillende chipconfiguraties mogelijk. De 4,5W-socs zijn uitgevoerd als enkele verpakking met het i/o-deel en de processor op één chip, met twee dies dus. Daarbij zijn twee cpu-cores en een gpu met 24 eu's beschikbaar. Van die grafische cores geven we op de volgende pagina's meer details. Vooralsnog volstaat dat de gpu met twee, drie of vier 'cores' wordt uitgevoerd. De U-serie is ook uit socs opgebouwd, met een i/o-die in dezelfde package als de processor-die. De processor kan dan weer bestaan uit twee cpu-cores en twee of drie grafische cores, waarbij de laatste uitvoering bovendien over edram beschikt.

De H-serie is opgebouwd uit vier cpu-cores, die gecombineerd worden met twee of drie grafische cores, waarbij die laatste weer over edram beschikt. Het i/o-deel is een aparte chip en bestaat uit een Series 100-chipset, ook bekend als platform controller hub of pch. De desktopprocessor, de S-serie, heeft ook een losse pch met Series 100-chipset en is in configuraties met twee cpu-cores en twee grafische cores, of vier cpu-cores met eveneens twee grafische cores beschikbaar. De kleinste chips, de Core M-socs, meten 20 bij 16,5mm, terwijl de grootste configuratie de desktopvariant is, met 37,5 bij 37,5mm plus een chipset van 23 bij 23mm. De kleinste oppervlakte is dus 330mm², de grootste 1406mm² voor de processor en 1935mm² met de chipset erbij.

Productoverzicht

We beginnen met de desktopprocessors. Die zijn verkrijgbaar in de eerder uitgebrachte K-serie voor overklokkers, als reguliere 65W-varianten in Core i3-, i5- en i7-uitvoeringen en als zuinige 35W-versies. Daarnaast zijn er 65- en 35W-Pentiums.

Skylake-productoverzicht: desktop K-serie
Skylake-productoverzicht: desktop 65W-serieSkylake-productoverzicht: desktop 35W-serieSkylake-productoverzicht: desktop 65W Pentium-serieSkylake-productoverzicht: desktop 35W Pentium-serie

Laptopprocessors

Voor mobiele toepassingen zijn er 45- en 15W-processors en twee Xeons van 45W. Op de 28W-varianten moeten we nog even wachten.

Skylake-productoverzicht: mobile Xeon-serie
Skylake-productoverzicht: mobile 45W-serieSkylake-productoverzicht: mobile 15W-serieSkylake-productoverzicht: mobile 15W Pentium-serieSkylake-productoverzicht: mobile 28W-serie

Ten slotte is er een handjevol Core M-socs aangekondigd. Daarvan komt overigens ook een Pentium-variant, maar die wordt nog niet geïntroduceerd.

Skylake-productoverzicht: Core M-serie

De architectuur: een overzicht

Een Skylake-processor lijkt in veel opzichten op processors van eerdere generaties, maar op diverse punten zijn verbeteringen aangebracht. Om een overzicht van de werking van de processors te krijgen, kijken we eerst naar de opbouw. We doen dat aan de hand van een niet-bestaande processor, om alle mogelijke bouwstenen de revue te laten passeren.

Skylake-blokdiagram

Dat begint bij de cpu-cores. Daarvan zijn er twee of vier beschikbaar, waarbij iedere core zijn eigen L1- en L2-caches heeft. L3-cache is uiteraard ook beschikbaar, maar dat grotere geheugen zit wat meer buiten de cores. Behalve over de cpu-cores beschikken de processors over grafische cores. Bij Intel heten die eigenlijk slices in plaats van cores en het cijfer achter GT geeft aan hoe veel er beschikbaar zijn: GT2, GT3 en GT4. De meest uitgebreide grafische variant, de GT4, heeft dus vier slices of grafische 'cores'. De GT3 en GT4 kunnen bovendien gecombineerd worden met een stukje edram, embedded dynamic ram. Feitelijk fungeert dat als L4-cache, omdat het niet alleen voor de grafische, maar ook voor de cpu-cores toegankelijk is.

Skylake gpu-opbouw

De System Agent is het deel van de processor waar alle verbindingen met buiten worden gerealiseerd. In de System Agent vinden we onder meer de aansturing van de displays, de geïntegreerde geheugencontroller of imc, de pci-expresscontroller voor videokaarten en de dmi, of de verbinding met de chipset. Die interface met de pch of de geïntegreerde i/o-chipset is in Skylake tweemaal zo wijd geworden. Voorheen heette de System Agent de North Bridge en later de Uncore. Sinds de Sandy Bridge-generatie heeft Intel de System Agent, en de volgende, belangrijke component die alles met elkaar verbindt: de ring.

Skylake-overzichtAlle belangrijke componenten zijn aangesloten op de ringbus. De cpu-cores, de gpu-slices, het L3- of last level cache, de System Agent en indien aanwezig het edram. Het edram is volledig coherent, dus gelijkwaardig toegankelijk voor cpu- en gpu-cores; de x86-cores kunnen data die door de gpu is opgeslagen lezen en vice versa. Bovendien is het edram toegankelijk voor i/o-logica en de display-engine. Daarmee beschikt een Skylake-processor met edram over een groot stuk extra cache, dat door alle bouwstenen in de processor of soc optimaal kan worden benut.

Skylake brengt op vrijwel alle vlakken verbeteringen met zich mee. Op de volgende pagina's kijken we naar veranderingen in de cpu-cores, de gpu en het energiebeheer. De besproken chips gelden primair voor consumentenproducten. Hoewel de bouwstenen van Skylake in principe voor alle productgroepen bruikbaar zijn, zullen de serverprocessors toch flink afwijken van de consumentenversies. Een van de verschillen is een logic block voor 512bit-avx-instructies, maar veel meer heeft Intel nog niet over de Skylake-Xeons losgelaten. Evenmin is bekend wanneer die Xeons moeten verschijnen.

De cpu-cores

Historisch gezien zijn de cpu-cores natuurlijk het belangrijkste onderdeel van een processor, maar inmiddels is die gedachte achterhaald. De gpu, diverse gespecialiseerde signaalprocessors en caches, i/o-controllers en energiebeheer spelen een steeds grotere rol. Desalniettemin heeft Intel de prestaties van de x86-cores ook voor de Skylake-architectuur aangepakt; een nieuwe processorgeneratie zonder snelheidswinst kan natuurlijk niet.

Die winst is echter sterk afhankelijk van factoren als het tdp-budget en het segment waarvoor de processor gemaakt is. Een desktopprocessor met een flinke koeler kan bijvoorbeeld langer op hoge kloksnelheid werken dan een Core M-processor die passief gekoeld wordt. De Skylake-architectuur heeft echter behoorlijke verbeteringen ondergaan, die niet revolutionair zijn, maar wel steeds een stapje vooruit ten opzichte van de voorgaande generaties.

Grofweg moet een processor enkele stappen doorlopen om een instructie te verwerken. De instructie moet eerst worden opgehaald: de fetch cycle. Vervolgens wordt die instructie gedecodeerd, zodat de cpu weet welke bewerkingen moeten worden uitgevoerd. Dan wordt de instructie uitgevoerd door de alu of fp-unit en de uitvoer wordt weer naar het geheugen geschreven. In elk van die stappen kan winst worden behaald door slimmere processors te bouwen. De makkelijkste is een lange instruction pipeline, zodat er altijd instructies klaarstaan voor de execution units. Zo worden alle onderdelen van de processor beziggehouden en hoeven ze niet te wachten tot een instructie helemaal klaar is.

Skylake-coreverbeteringen

In de front-end is de branch predictor verbeterd. Die voorspelt welke instructies moeten worden uitgevoerd, nog voordat ze zijn opgehaald. Een goede voorspelling levert winst op; de instructie is dan al uitgevoerd. Een verkeerde voorspelling levert juist vertraging op, omdat dan berekeningen uitgevoerd worden die niet nodig zijn en de correcte berekeningen alsnog uitgevoerd moeten worden. Een andere manier om de decode engine bezig te houden, is het prefetchen van data uit het geheugen en het bufferen van die data in caches. Om de data van de eu's van en naar het geheugen te schrijven, zijn load/store units nodig. De beschikbare bandbreedte is toegenomen met de genoemde verbeteringen in de prefetcher, diepere store, fill en write-back buffers en nieuwe instructies voor cachemanagement. Ook het afhandelen van page misses is verbeterd en de bandbreedte die beschikbaar is voor L2 cache misses is groter gemaakt. Beide functies zijn verbeterd in Skylake, net als de out-of-order buffers; waarmee het aantal instructies dat zonder wachten op voorgaande resultaten kan worden uitgevoerd verder wordt vergroot. Dat alles moet de ipc, of instructions per cycle, vergroten.

Skylake-coreverbeteringen

De execution units, waar het echte werk van het verwerken van instructies wordt uitgevoerd, zijn verbeterd. Niet alleen hebben ze lagere latencies gekregen, er zijn ook fysiek meer execution units toegevoegd. Welke eu's dat zijn en wat ze doen, vertelde Intel nog niet. Daarop zouden we moeten wachten tot de introductie van de serverproducten. Wel is duidelijk dat de verwerking van encryptie, in het bijzonder aes-gcm en aes-cbc met respectievelijk 17 en 33 procent is versneld. Ten slotte is de hyperthreading verbeterd, doordat meer instructies per kloktik retired kunnen worden.

Overzicht Skylake-verbeteringen

Van een aantal verbeteringen heeft Intel geen harde cijfers gegeven, maar in bovenstaand overzicht vergelijkt het bedrijf de verbeteringen in Skylake ten opzichte van twee eerdere generaties architecturen. Broadwell ontbreekt vanzelfsprekend op dit soort slides, omdat dat net als Ivy Bridge geen nieuwe architectuur is, maar een die shrink van een architectuur. Duidelijk is in ieder geval dat Intel steeds meer instructies per clock uit zijn processors weet te persen, hoewel de stapjes over het algemeen maar klein zijn.

De gpu-architectuur: Gen9

De gpu van Skylake is inmiddels al weer de negende generatie grafische processors. Vergeleken met Intels HD Graphics zouden de prestaties ruwweg twintigmaal zo hoog zijn. De Iron Lake-gpu haalde met 10 execution units ongeveer 43Gflops, terwijl de grootste gpu, de GT4 met 72 eu's, uit Skylake tot zo'n 1152Gflops zou komen. Overigens beschikt de gpu in de Core i7-6700K beschikt over 24 execution units, maar het maximumaantal betreft 72 eu's, gecombineerd met edram.Skylake-gpu

De gpu van Skylake is opgebouwd volgens een stramien dat we al langer kennen van Haswell: een gemeenschappelijk deel, dat de unslice wordt genoemd, levert threads aan de execution units. Die eu's zijn weer ondergebracht in sublices, waarvan er drie in een slice zitten. Een gpu bestaat dus uit een unslice en een of meer slices. Elke slice is opgebouwd uit een slice common, die op zijn beurt communiceert met drie subslices. Een subslice bevat in principe acht execution units, waarmee het aantal eu's per slice op 24 komt. De GT2 heeft een enkele slice, de GT3 heeft twee slices en de GT4 heeft drie slices, voor respectievelijk dus 24, 48 en 72 execution units. Overigens zijn de subslices aan te passen; kleine processors zouden met subslices met zes eu's kunnen worden gebouwd.

De meest opvallende aanpassingen zijn ondersteuning voor de nieuwste api's als DirectX 12, OpenCL 2.0 en OpenGL 4.4. Daarnaast heeft Skylake voor het eerst 72 eu's gekregen met de GT4-gpu. Onderdelen van de unslice zijn in grotere gpu's extra vertegenwoordigd. Zo heeft de GT3-gpu een extra fixed function-blok. Er is echter ook een flink aantal verbeteringen in de diverse onderdelen van de negende generatie gpu. We beginnen aan de unslice-kant.

Skylake unsliceDe unslice heeft bovenal een gescheiden klok- en energiedomein gekregen. Dat betekent dat de kloksnelheid onafhankelijk van de slices geregeld kan worden en delen van de unslice uitgeschakeld kunnen worden om energie te besparen. Zo kan de activiteit van de unslice worden afgestemd op de behoefte van de slices. Als er twee of drie slices actief zijn, kan de unslice hoger geklokt worden om de slices van input te voorzien. De unslice heeft bovendien snellere vertex, geometry, domain en hull shaders gekregen. Verder worden complexe triangle lists waar mogelijk geconverteerd naar triangle strips en de tesselator engine doet hetzelfde.

De unslice voedt dus de slice en de eerste stop voor de data is de slice common, die onder meer voor rasterization en pixel blending zorgt. Daarin zitten een rasterizer, een pixel operations engine, een L3-cache voor de execution units en render- en depth-caches. De pixel fill rate van de slice common is, afhankelijk van de werklast, 1,33- tot tweemaal zo snel geworden en de msaa-engine is eveneens verbeterd en ondersteunt nu ook 16x msaa. Verder zijn de caches met een onbekende factor vergroot en zijn compressiesnelheden toegenomen. Het resultaat van alle verbeteringen in de slice common is het vergroten van de datadoorvoersnelheid, zodat de subslices gevoed kunnen worden.

In de subslices vinden we allereerst een thread dispatcher met een instructiecache. Die stuurt workloads naar de execution units, die weer in verbinding staan met een sampler met L1- en L2-caches en de data port-verbinding naar geheugen met 64 byte lees- en schrijfbandbreedte. De execution units, in de meeste gevallen acht per subslice, bestaan uit een instruction fetch-blok dat instructies doorstuurt. Een eu beschikt over 128 simd-registers van 32 byte voor een totaal van 28kB general purpose register. De simd-registers sturen maximaal vier instructies naar twee floating point units, die ieder vier operations tegelijk kunnen uitvoeren. Ten slotte stuurt een send of branch unit operaties of instructies weer door.Skylake subslice

De execution units ondersteunen voortaan zowel 16- als 32bit floating point operations, zodat er geen vertaalslag van 16 naar 32bit nodig is. Bovendien zijn de eu's scalar aan te sturen, wat programmeren moet vergemakkelijken. De eu's zelf zijn natuurlijk wel voorzien van simd-alu's. Ook de sampler is sneller geworden en ondersteunt onder meer yuv-formats. Ten slotte heeft iedere eu, net als in Haswell, meer bandbreedte doordat er niet tien, maar acht eu's per subslice van data moeten worden voorzien.

Energiebeheer: van 4,5 tot 91W?

De Skylake-architectuur is met verschillende ontwerpdoelen gemaakt, maar twee steken er bovenuit: modulariteit en zuinigheid. De modulariteit zien we terug in de flexibiliteit van de core-configuratie, het aantal eu's en slices in de grafische processor en de variatie in socs, processors met losse chipsets en het al dan niet toevoegen van edram. De zuinigheid wordt geregeld in de cpu-cores, in de gpu en op soc-niveau, via interfaces naar caches en geheugens, en is afhankelijk van workloads.

Skylake-energiebeheer

Een puntje waarover we in de eerdere Skylake-review, die van de Core i7-6700K, spraken is de fivr, of liever gezegd het ontbreken daarvan. De fivr, of fully integrated voltage regulator, werd in Haswell geïntroduceerd om energie te besparen. Voor de 14nm-processors, en vooral de 4,5W- of Core M-producten, konden de engineers de fivr niet zuinig genoeg krijgen. Daarom is deze uit de Skylake-architectuur weggelaten. Voor de desktopproducten is dat goed nieuws; het maakt overklokken makkelijker, doordat alle voltage planes via het moederbord instelbaar zijn.

We gaan verder met de cpu-cores. De execution units in de cores kunnen worden uitgeschakeld als ze niet gebruikt worden en de avx2-hardware is voortaan power gated; ook die kan dus uitgeschakeld worden. De hele core is geoptimaliseerd om bij lage werklasten een laag energiegebruik te hebben. Zo is ook het gebruik van de core tijdens de C1-powerstate gereduceerd en worden cores vaker aan- en uitgeschakeld om lekstromen te reduceren. Ze kunnen beter kort en snel werken dan langer op een lagere spanning en kloksnelheid.

Skylake powerdomains

In de gpu kunnen slices of zelfs subslices, eu's en samplers worden uitgeschakeld dankzij extra powergating-domeinen. Ook de unslice heeft een eigen power/clock-domain gekregen, zodat die onafhankelijk van de rest van de gpu kan worden geklokt of uitgeschakeld. De mediakant van de gpu kan hevx decoderen in een eigen dsp, zodat voor videoplayback zeer weinig vermogen wordt gebruikt - minder dan 1W volgens Intel - waarbij de slices uitgeschakeld kunnen zijn.

Over het algemeen geldt dat beter cachebeheer energiewinst kan opleveren. Dat gebeurt enerzijds door relevante informatie in de caches te hebben en anderzijds door de data in de caches efficiënter uit te lezen. Dat is mogelijk door grotere caches en meer bandbreedte naar de caches, al dan niet dankzij compressie. Elke bit data die uit een cache opgehaald kan worden, hoeft dan niet uit het werkgeheugen te worden gehaald. Dat bespaart op het activeren van de geheugencontroller en bespaart stroomgebruik voor het dram. Zo is ook het edram, feitelijk één grote, coherende (dat wil zeggen voor de hele soc volledig toegankelijke) cachelaag, energiebesparend voor de soc. Dat het edram nog op 22nm geproduceerd wordt, waar de rest van de soc op 14nm is gemaakt, maakt daarvoor niet veel uit.

Skylake-energiebeheer op soc-niveau

Op socniveau, of processorniveau zo je wil, is er nog een aantal power domains bijgekomen. Zo hebben de system agent en de edram-i/o afzonderlijke speedstep-ondersteuning gekregen en fungeert de hele soc veel meer als geheel, waarbij de tdp dynamischer gealloceerd kan worden naar het domein dat het hoogste rendement heeft voor een bepaalde taak.

Speed Shift Technology

Een laatste, maar zeker niet minste, stap die daarbij helpt, is een nieuwe techniek die Speed Shift Technology genoemd is. De techniek volgt de bekende SpeedStep Technology op, waarbij het besturingssysteem de power states van de processor, zoals P1 tot Pn, bestiert. Dat is niet even efficiënt, zeker bij variabele workloads en binnen een streng energiebudget. Met Speed Shift Technology wordt die zogenaamde P-state control niet door het besturingssysteem aangestuurd, maar door de processor, hardwarematig dus. Wel worden de minimale en maximale P-states door het besturingssysteem gedefinieerd, maar daarbinnen is de processor de baas. Dat leidt tot veel sneller schakelen tussen lage en hoge frequenties, waardoor de responsiveness én stroombesparing optimaal zijn.

Disconnected Modern Standby

In Windows 10 wordt bovendien een nieuwe stand-by-modus mogelijk: Disconnected Modern Standby. Daarbij verkeert de soc in dezelfde superzuinige S0ix-staat, maar is de wifi uitgeschakeld. De Connected Standby van Windows 8 gebruikt daarentegen steeds stroom voor de wifi en vergt duurdere componenten. Aan de nieuwe DMS-status zijn geen extra kosten verbonden, maar wordt het systeem wel binnen een halve seconde 'wakker'. Bovendien is de S0ix-modus nodig om de computer met Cortana-stemopdrachten wakker te maken.

Overige features

We hebben het al even over de gpu gehad, maar de mediakant daarvan hebben we goeddeels onbelicht gelaten. Wel schreven we dat video dankzij hardwarematige decodering van hevc-content zeer zuinig gerenderd kan worden. Bovendien is er een vernieuwde Quick Sync-functie, die energiezuinig en snel video kan converteren. Daarbij is er ondersteuning voor raw-foto's en -video, waardoor onder meer witbalans, gammacorrectie en kleurconversie door de video quality engine uitgevoerd kunnen worden. Aan de codeckant worden hevc, jpeg en mpeg voortaan hardwarematig versneld gecodeerd. Er is overigens ook ondersteuning voor 4k/60fps-uitvoer, maar alleen via al dan niet embedded displayports. De hdmi-support is beperkt tot versie 1.4, maar met een actieve adapter kan een dp-uitgang een hdmi 2.0-signaal uitvoeren.

Skylake codec-ondersteuningSkylake-display

Veiligheid

Uiteraard wordt ook aan veiligheid gewerkt. De bekendste toepassing is Windows Hello, dat mogelijk wordt gemaakt door Intels RealSense-camera. Met geïntegreerde dsp's voor camera's in de Skylake-soc kan dat veilig en zuinig. Er is echter ook beveiliging tegen malware ingebouwd. Zo moet SGX-technologie, ofwel Software Guard Extensions, het mogelijk maken om vertrouwde geheugendelen, die niet voor onbekende processen toegankelijk zijn, te creëren. En om buffer overflow-exploits te voorkomen, zijn Memory Protection Extensions, kortweg MPX's, toegevoegd, die voorkomen dat processen buiten de aan hen toegewezen geheugenruimte kunnen groeien.

Conclusie

Met Skylake heeft Intel een nieuwe generatie processorarchitectuur neergezet, die een breed scala aan producten mogelijk maakt. De schaalbaarheid van afmetingen, prestaties en energiebehoefte maakt dit Intels veelzijdigste architectuur tot dusver. In de enige Skylake-processor die we tot dusver getest hebben, de Core i7-6700K, zien we echter maar een kleine prestatiewinst vergeleken met een eerdere generatie. Voor de desktop geldt dus dat de ipc-winst niet de grootste reden is om over te stappen; nieuwe features als ddr4-geheugen, pcie-lanes en usb 3.1 kunnen dat wel zijn.

De belangrijkste vernieuwingen zijn echter in het energiebeheer te vinden. Vooral in socs en zuinige processorvarianten moet Skylake goede prestaties combineren met een zeer laag verbruik. Skylake biedt bovendien volop innovatie op het gebied van veiligheid en het mogelijk maken van nieuwe manieren om computers te gebruiken, van gezichtsherkenning en biometrische identificatie tot gebaren- en stembediening.

Reacties (74)

74
73
72
1
0
0
Wijzig sortering
Er zijn wat mij betreft twee duidelijke grote verbeteringen in Skylake: Het stroomverbruik/powermanagement en de GPU. Op het gebied van de core lijkt er gebaseerd op de informatie die nu bekend is toch niet zo heel erg veel veranderd te zijn. Natuurlijk helpt een iets groter out of order window en een "betere" branch predictor en alle andere dingen die ze noemen, maar dat zijn toch in mijn ervaring allemaal maar dingen die een paar kleine procent extra IPC bij elkaar sprokkelen. Wat vooral belangrijk is dat al deze structuren goed op elkaar af gesteld staan in een gebalanceerd ontwerp, gebaseerd op benchmarks en gebruikers scenarios. Volgens mij waren er een tijdje geleden hier op Tweakers een paar slides over Skylake opgedoken met tot 20% single core performance verbeteringen, waarvan ik het waarschijnlijk acht dat minstens de helft daarvan door een iets hogere clock/turbo kwam en de overige 10% door de verbeteringen in de core. Wat dat betreft was Haswell een veel grotere stap naar een veel bredere core met meer execution units.
Wat mij opvalt is dat sinds Sandy Brigde (32nm) er nog steeds niet meer dan 4 cores/8 threads in een normale desktopplak zitten. Dat terwijl er met 14nm best 8/16 onder een TDP van 60-70W in zouden passen.

Maar je hoort het overal: de Wet van Moore is dood op het vlak van transistors/euro. 28nm is helaas nog steeds meest kosteneffectieve procede.
Nou ja, dat is eigenlijk niet zo vreemd vind ik, er zijn volgens mij meerdere goede redenen. Ten eerste, zoals je kan zien op het die-shot op pagina 4, heeft Intel besloten om (minstens?) net zoveel ruimte te besteden aan de GPU als aan de vier cores. Intel wil graag een product met een fatsoenlijke GPU neerzetten dus als zij vinden dat 4 cores voor normaal gebruik voldoende is, gebruiken ze liever de rest van het chip oppervlak voor de GPU. Dat levert voor veel mensen weer een compacter en zuiniger systeem op omdat ze geen aparte videokaart meer nodig hebben, en die markt is natuurlijk vele malen groter dan die voor hardcore gamers of andere professionals die veel meer rekenkracht willen.

Ten tweede, als je nog meer cores op je processor zet dan heb je echt niet meer genoeg aan twee DDR3L/DDR3 kanalen voor geheugen bandbreedte, en zullen je cores veelal alleen maar op data staan te wachten. Dat is waarom de Haswell High End Desktop Processors vier geheugen kanalen hebben, maar dan zit je ook met een heel andere socket met veel meer pinnen (en volgens mij zijn het ook gewoon rebranded Xeons met wat extra limitaties). En veel meer pinnen heeft weer andere nadelen; dat is veel duurder om als cpu package te produceren, maar ook de moederborden die zo'n socket ondersteunen worden veel complexer en duurden. En dan komt het weer uit bij wat ik hierboven aanhaalde, en dat is dat het dan te duur voor de algemene markt wordt.

Waarschijnlijk als de Skylake Xeons komen zal er ook wel weer een vergelijkbare high end desktop processor verschijnen zonder GPU, of gewoon Xeon workstation processoren, met meer geheugen bandbreedte, en met meer cores. Maar tussen de "normale" desktop cpus zullen ze dat niet uitbrengen, want dan zouden ze ook alleen maar hun eigen (zeer winstgevende) Xeon segment gaan beconcurreren.
Ik snap die hang naar GPU support niet. Volgens mij is het 90% Nvidia/AMD pesten, en 10% omdat de consument dat wil. Als die 4K kan decoden is het meestal al best, en dat kan volgens mij een CPU met HD3000 uit een ver verleden nog. Een desktop gamer is net zo'n exoot als een professionele beeldbewerker, en die wil denk ik nog steeds een discrete kaart.
Voor laptops zijn geïntegreerde GPU 90% van de markt. Ook voor eenvoudige desktop PC worden geïntegreerde GPU’s veel gebruikt. Denk dat +70% van de kantoor PC’s tegenwoordig geen losse videokaart meet heeft. Als je lichte toepassing gebruik is de meerwaarde van een losse videokaart laag.
Bij mij op werk staan ook alleen Dell bakken zonder videokaart. Zelf Solidworks werkt prima mist je geen +300 onderdelen in je tekening zet.
Klopt, maar in dat segment ga je geen i5 6600K gebruiken. Een kantoorbak met een quadcore op 3,5 GHz, een TDP van zowat 100W en dan zo'n on-die GPU gebruiken? Het zal wel te duur zijn om dat ding zo te ontwerpen dat die GPU achterwege gelaten kan worden, maar ik vermoed dat in de praktijk niemand zo'n CPU koopt en er dan geen losse videokaart bij installeert.

De reden dat AMD een relatief overbemeten GPU in hun APU's heeft zitten, is omdat het CPU-deel naar verhouding vrij licht is - AMD had gehoopt dat er veel meer werk naar de GPU geschoven zou gaan worden, maar in de praktijk valt dat vaak nog erg tegen.
workstations en het is op zich ook wel leuk als je de hele meuk bij elkaar hebt en net geen geld over hebt voor een videokaart(vaak 300euro+) dat je toch je systeem kan zien draaien. kom op het zit er in en is dus gratis.. bek paard kijken ?
Het is niet gratis, want de GPU neemt de helft van de ruimte op de chip in. Op diezelfde ruimte hadden ze dus ook 2 of 4 extra cores kunnen plaatsen (zonder de processor duurder te maken), of ze hadden de die kleiner kunnen maken (goedkoper).

En dat is dus een ontwerpkeuze van intel..

[Reactie gewijzigd door Verwijderd op 22 juli 2024 22:03]

Een slimme ontwerpkeuze. Want hierbij nemen ze automatisch een stuk markt af van amd en nvidia en dat is dus pure winst en meer werkgelegenheid. Met cpu's zijn ze al met afstand nummer 1 en de gpu drukken ze nu ook gewoon door je strot heen.

Als ze videokaarten gewoon zo los zouden verkopen konden ze de hele afdeling binnen een jaar opdoeken.

Door te investeren in gpu development zal het mij niet verbazen dat ze op de laptop markt een groot,Zo niet een meerderheid van de markt in handen hebben. In een wereld waar alles kleiner en mobieler moet is dat behoorlijk waardevol.

[Reactie gewijzigd door Bartosy op 22 juli 2024 22:03]

Die markt afnemen zal wel meevallen. Zoals ik al aangaf zal de overgrote meerderheid van de mensen die een high-end CPU koopt, toch wel voor een losse videokaart gaan en daar heeft Intel gewoon niets te vertellen. Dit soort processoren zie je in laptops zelden of nooit - daar verstoken ze teveel energie voor.

Voor de budget-range zit Intel inderdaad aardig bij AMD in het vaarwater, meer dan voor Nvidia denk ik. Nvidia maakt immers geen CPU's, alleen GPU's en sinds Nvidia ook geen chipsets meer maakt zal hun budget/low-end GPU verkopen behoorlijk ingekakt zijn. Waarom zou je immers een basis-GPU kopen van Nvidia als je een vergelijkbare GPU op je Intel/AMD processor hebt zitten?

Misschien dat ze op de tablet-markt nog wat klaar gaan spelen, ik weet niet hoe hun Tegra's het momenteel doen.
Ik kan me voorstellen dat het tegenvalt, je ziet ook dat multicore ondersteuning niet echt gemeengoed is. Voor powerhungry applicaties gaat dat wel, maar verder heb ik niet het idee dat het echt gemeengoed is.
Ik denk dat CPU --> GPU net zo'n stap is als single-threaded --> multi-threaded. Daarbij komt dat je deels voor de CPU, deels voor de GPU, wat fysiek een andere processur is, moet designen.

Geïntegreerde GPU vind ik veel slimmer. Er zijn legio situaties voor, zoals werk-computers, laptops, nettops (de huis/tuin/keuken pc van je ouders meegerekend), HTPC's, servertjes. Eigenlijk alleen game-pc's en werksituaties waarin een grafisch element zit kunnen baat hebben bij een losse grafische kaart.

Ik zie wel dat er (min of meer) HDMI 2.0 ondersteuning is, maar het is me niet duidelijk of audio ook hieroverheen kan. HDMI 2.0 is erg handig voor HTPC's, maar zonder audio: nutteloos.

[Reactie gewijzigd door Nas T op 22 juli 2024 22:03]

Ik kan je uit ervaring (als programmeur) vertellen dat de stap CPU -> GPU vele malen lastiger is dan single->multithreaded.

Dat laatste vergde vooral refactoren van bestaande code. Het eerste vergt een compleet nieuwe manier van denken.
Helemaal mee eens wat betreft de logica voor desktops etc, maar de K series voor desktops, is naar mijn idee vooral op "budget" poweruser workstations en gamers gericht. Anderen zullen veelal niet overclocken, ik heb om die reden regelmatig 4790 systeempjes gebouwd en niet de 4790K erin gestopt.
Maar daar ging dan altijd wel een matige GPU bij, zodat de hele 32GB voor virtualisatie beschikbaar was.

Als gamer zit je ook niet te wachten op de GPU in je 6700K / 6600K. Schakel ze persoonlijk ook maar altijd uit... Geeft je net die graad minder onder load en dat kleine beetje extra flexibiliteit voor de memory tune...

Ik zou persoonlijk graag een 6780K kopen als die gelijk was aan de 6700K maar dan met 6 cores / 12 threads. Nu is het niet echt te verantwoorden als vervanging voor m'n game 3570K's (zelfs met slechte OCs) en m'n WS 4690. (ook gezien de meerprijs nu nog tussen 4690 en 6600K + dat DDR4 tot CPU limiet erin stampen weer €€€€€ kost...)

Erg jammer dat Intel niet herkend dat ze voor die specifieke, kleine markt 50% van de Die verspillen. Op de mobile chips zou ik daarnaast ook gewoon graag een met-en-zonder CPU zien eigenlijk.
Ik heb hier op de zaak daarom al sinds 2011 geen nieuwe systemen meer neergezet. T.o.v. quad i7 Sandy's is amper snelheidswinst geboekt, en de net iets snelle systemen zijn bijna altijd duurder dan de Sandy's toen. Tja dat krijg je als helft van de die GPU is.
Ja maar op die laptop is GPU ook amper nodig. Nogmaals, 4K decoden is ongeveer het meest heftige dat ie moet kunnen, en kan een Raspberry Pi 2 dat niet ook.....
Intel loopt vooral te trekken aan de HD graphics lijn omdat ze mee willen komen. De koper doet er verder niks mee.

[Reactie gewijzigd door Verwijderd op 22 juli 2024 22:03]

Ik denk dat het heel goed is dat Intel steeds betere gpu's in alle processoren zet. Intel zit met een krimpende markt en een heel groot marktaandeel. Intel wil dus dat de markt groeit en er andere markten bijtrekken (zoals gpu's, tablets, chipsets, netwerkkaarten, sounkaarten). De enige gebruikers die nu interesse in nieuwe processoren hebben zijn pc-gamers en professionele gebruikers. Voor de gewone consument geldt vaak wel iets van het volgende.
- Op een laptop kan je niet gamen, die is alleen voor internet en documenten. De huidige laptop kan dat prima.
- Om te kunnen gamen heb je een dure PC of een spelcomputer nodig.
- Gamen is een hobby voor nerds (maar ondertussen is een potje patience, Diamond saga, angry birds etc. Wel leuk.)
- Als je een spelletje wilt kopen moet je goed naar 2 dingen kijken: of de videokaart en de processor het wel aankunnen, maar er zijn zo veel verschillende videokaarten dat alleen nerds het kunnen snappen.
- Intel processoren zijn goed maar intel videochips zijn maar niks (Intel en niks in 1 zin).
- Op een tablet/telefoon werken games vaker en beter dus speel daar maar op.

Stel dat alle Intel i3 6xxx processoren en duurder/nieuwer alle nieuwe games (op low) kunnen spelen, dan vervallen de punten hierboven. Hierdoor betekend een Intel chip weer dat het systeem alles kan en dus "snel" is, ontstaan meer pc-gamers en gaan mensen weer sneller upgraden en betere hardware kopen.
Die hang naar GPU support is heel simpel te verklaren. Het is Intel die hier namelijk marktleider is, ze zetten meer gpu's af als Nvidia en AMD bij elkaar.

En dat is echt niet alleen omdat ze overal een IGP bij drukken, maar omdat die IGP's ook worden gebruikt.

[Reactie gewijzigd door Vayra op 22 juli 2024 22:03]

met DX12 schijnt het nu wel mogelijk te worden de IGP idd te gebruiken naast de dedicated GPU : http://www.worldsfactory....ueeze-that-integrated-gpu

maargoed on die GPU zeker icm HBM kan ook voordelen hebben voor bijv compute, gezien data niet over de PCI-E bus hoeft, en dat dus latency scheelt. dus dat kan zeker icm Heterogenous computing (APU stijl) zeker wel voordelen hebben in de toekomst. zeker als bijv een compiler een igp verwacht en daar dus gewoon gevectoriseerde instructies heen kan sturen in de toekomst (ja dat is niet makkelijk maar het is ook niet iets wat onmogelijk is in de toekomst)

desalniettemin ben ik het met je eens,
intel had in dezelfde die space 8 cores kunnen proppen, en dat dus voor dezelfde prijs kunnen verkopen, en dat had wel erg interessant geweest imho,

maar als je 8 cores wil, dan moet je naar 2011 en moet je veel extra betalen, erg jammer dus, en Intel maar afvragen waarom niemand nieuwe Desktops maakt, tsja...

[Reactie gewijzigd door freaq op 22 juli 2024 22:03]

De Skylark is ook een processor voor de smartphone/tablet/automotive markt waarbij hij intel probeert de dominante ARM aan te vallen. Er worden veel meer van deze ARM apparaten verkocht dan alle PC bij elkaar in de afgelopen 5 jaar. Sinds de iPhone verwacht iedereen soepele mooie 3d graphics en animaties voor elke toepassing. Zonder GPU lukt dat niet.

Intel gaat ook inzetten op een architectuur van smartwacht tot workstation tot high end server zodat je straks je toepassingen van apparaat tot apparaat kan meenemen. Op dit moment kan niemand dit aanbieden. IOS en OSX ARM/Intel dus binaries lopen niet. Android / Chrome zou wel kunnen (bijde ARM maar Google wil geen offline markt ) Windows 10 Phone en Windows 10 desktop Intel/ARM kan ook niet (Modern Apps is geen alternatief voor desktop)

Als intel Apple en Microsoft van smartphone tot desktop tot automotive tot tablet kan aanbieden dan zijn de barieres weg en kan wel een binairy alle platformen bedienen. Intel heeft dan een troef tegenover ARM en Java (su) Blijft wel dat er een enorm verschil in complexiteit zit tussen ARM en Intel......

[Reactie gewijzigd door tweakerspim op 22 juli 2024 22:03]

Een Desktop hard-core gamer (en laptop).
Maar er is best wel een markt voor medium spelletjes spelers en daar is die GPU support goed genoeg voor :)
LGA 2011 heeft prima betaalbare bordjes hoor!

Probleem is inderdaad wel dat het instap model voor LGA 2011 duurder is dan het topmodel uit het midden segment.
Dat is ook niet zo gek, LGA 2011 heeft meer memory lanes/slots, meer PCI-E mogelijkheden, zwaardere stroomvoorziening en meer pins. Dat zijn allemaal factoren waardoor het moederbord duurder wordt. Een 5820K kost ongeveer evenveel als een 6700K, dus voor een paar tientjes meer krijg je toch een hoop value erbij!
Klopt, daarom ben ik zelf ook voor 2011 gegaan...
Meer toekomst perspectief (met broadwell-e nog voor de deur) en neit heel veel duurder...
Als ze die GPU gewoon weglaten dan kunnen ze hetzelfde leveren voor een stuk lagere prijs en concurreren ze AMD waarschijnlijk volledig weg.
In bijna elke guide wordt gezegd dat je AMD voor de prijs moet kiezen en als je wat meer te besteden hebt dat je voor Intel moet kiezen.
Een Core i3 kan al sneller zijn met z'n dualcore dan een AMD octocore... en daar houdt AMD op en begint Intel.

Ben het op het moment een beetje aan het uitzoeken ivm een systeem upgrade hier, ik ga denk ik toch na al die jaren over op Intel, wel duurder (anderhalf tot 2 keer) maar de prestaties zouden er ook flink op vooruit gaan.

Alleen jammer dat die GPU er ook in zit, anders was de keuze voor Intel een stuk makkelijker geweest.
Wat mij opvalt is dat sinds Sandy Brigde (32nm) er nog steeds niet meer dan 4 cores/8 threads in een normale desktopplak zitten. Dat terwijl er met 14nm best 8/16 onder een TDP van 60-70W in zouden passen.
Het gaat om wat gebruikers nodig hebben: meer dan 8 threads worden door bijna geen enkel programma efficient gebruikt. Sterker nog, de meeste programma's gebruiken maar 4, 2 of zelfs 1 thread en dan heb je dus meer aan hogere clockspeeds dan aan een groter aantal threads. Dit is trouwens best een fundamenteel probleem: heel veel taken lenen zich wiskundig gewoon niet voor parallellisatie (beter af met een CPU met weinig threads) of juist voor massale parallellisatie (beter af met een GPU). Een desktop CPU met 16 of 32 threads zou een beetje in een niemandsland vallen.

Ik vraag me af waarom we niet een paar nog hoger geclockte modellen krijgen die dan maar wat meer stroom gebruiken en/of geen GPU aan bord hebben.

[Reactie gewijzigd door Verwijderd op 22 juli 2024 22:03]

Omdat we met zo'n hoger geclockt, single-threaded focussed model waarschijnlijk weer een sandry-bridge achtige situatie krijgen waar mensen zelfs 4 generaties later totaal geen behoefte aan een upgrade hebben. En das weer slecht voor de verkoop.
De gemiddelde consument haalt amper voordeel uit 8 threads. Vele software is er nog altijd niet voor geoptimaliseerd, vaak ook al omdat het niet veel uitmaakt.

Mensen die nood hebben aan meer cores/threads zullen sneller kiezen voor Xeon CPUs en eventueel multi socket oplossingen.
Alle tamtam en herrie rond de GPU en power management is misschien alleen maar om te verhullen dat er aan de CPU zelf bijna niks verbeterd is. Zoals al jaren het geval is, de rek is eruit.

De klokfrequentie ligt al tijden rond de 4GHz, door fysieke beperkingen. Het aantal cores will ook maar niet boven de 8 uit komen. Dat komt waarschijnlijk omdat met meer cores de infrastructuur op de chip (om bijvoorbeeld al die L1 caches in sync te houden, en toegang tot alle periferie te regelen) steed complexer wordt, en ook steed meer een bottleneck voor het hele systeem.
Intel heeft ook Xeon's met meer dan 8 cores hoor, bijvoorbeeld dit 16 core model: http://ark.intel.com/prod...698-v3-40M-Cache-2_30-GHz

Veel meer dan een quad / hexa core lijkt mij op dit moment ook niet echt zinvol, de grootste performance verbeteringen zijn op het gebied van IO te halen. Moderne CPU's zie ik zelden nog als bottleneck in een PC.
Om een of andere reden wordt er alleen maar naar games gekeken, alsof dat het enige zware werk is dat een desktop PC nog zou kunnen doen.

Een van de meest zinnige taken die een PC kan doen is het compileren van code (meestal voor andere systemen dan zichzelf). Het bouwen van een image voor een settop box duurt ongeveer 1,5 uur. Deze tijd is volledig afhankelijk van de CPU snelheid, en schaalt 1:1 met het aantal cores. De harddisk door een SSD vervangen had geen meetbare invloed op deze tijd (iemand heeft op een 64GB machine geprobeerd alles in RAM te draaien, en dat scheelde iets van een enkele minuut in totaal).

Er zijn veel meer van dit soort workloads die perfect schalen met CPU kernen (helaas behoort het synthetiseren van FPGA firmware nog steeds niet tot die categorie).
True, maar dan kijk je ook eerder naar CPU's zoals de Xeon die ik al gelinkt had. Ook het opzetten van een distributed build systeem wordt dan zinvol, en schaalt ook een stuk beter dan een enkele server / workstation.
En een distributed systeem is veel goedkoper dan een Xeon. Een Xeon is alleen zonvol als je taken hebt die op een enkele machine moeten lopen.

Voor de prijs van een Xeon van (tussen 2000 voor 10 cores en meer dan 4000 euro voor 16+) kun je wel tien AMD FX8350 octacores (170 euro) kopen, incluis moederborden en RAM.
Ik weet niet zo zeer of het de rek is op CPU core gebied of het gebrek aan concurrentie / applicaties die erom vragen.

Aan de enterprise kant is vooral de RAM honger aanwezig, waar Intel wel in meegaat, maar dat is het toch multi-machine wat de klok slaat.
Voor de consument zijn de applicaties ook amper zwaarder geworden en de hoeveelheid concurrerende CPU's van AMD zijn ook op één hand te tellen sinds Sandy Bridge.

Als AMD een grote slag slaat met nieuwe architectuur, denk ik best dat Intel er opeens een grote stap bovenop kan maken.

Maar de GPU verbeteringen laten mij ook echt compleet koud. De helft van de punten komt op mij ook echt over als "marketing features".
Er zijn best 12 core CPU's, maar die zijn nog altijd redelijk aan de prijs en ipv de ruimte op de die voor meer cores te gebruiken gaat dat naar de GPU. Die voor workstations waarschijnlijk wegens RAM lenen uitgeschakeld worden op de high end chips.

Ik zie daarnaast liever de i3 met de high-end CPU dan dat ze die voor de i7's reserveren...
CPU/GPU vraag werd toch vooral door games gevoed. grafische toepassingen werden steeds veeleisender. Nu vrijwel alle games dezelfde engines gebruiken als de console varianten, is er geen grote vooruitgang en ontwikkeling meer op engine gebied.
Jammer dat ze zoveel aandacht/ruimte besteden aan die integrated GPU, die ondanks alles niet beter presteert dan een budget nvidia kaartje. Vrijwel elke gamer heeft bijvoorbeeld toch een betere, losse GPU in zijn systeem en gebruikt dus de helft van de chip nooit -- maar betaalt er wel voor. Nou zouden applicaties met OpenCL support die integrated graphics kunnen gebruiken om bijvoorbeeld wat extra physics oid te berekenen, maar ik vraag me af tot hoever dat ook daadwerkelijk gebeurt.

Ik snap niet zo goed wat de doelgroep is: voor gamers is de GPU nutteloos, voor een media center oid is de hele chip overkill, en voor power-cpu-users is het waarschijnlijk ook een kwestie van wachten op de xeon variant. De halve die neemt dus iets in dat niemand nodig heeft. Liever had ik nog vier cores en geen graphics gezien voor hetzelfde geld...
Weinig alternatief, je kunt kiezen voor een Xeon.
Maar een tot i7 vergelijkbare Xeon zonder iGPU is ~net zo duur.
Die zelfde Xeon als inclusief iGPU uitvoering is tevens tientallen euro's duurder.
Wat rest is overstappen op AMD :)
vb: http://cpuboss.com/cpus/I...v3-vs-Intel-Core-i7-4790K

[Reactie gewijzigd door Verwijderd op 22 juli 2024 22:03]

Ik zie bij Skylake nog geen Xeon processors staan? Maar het stroomverbruik zal denk ik wel iets lager zijn bij dezelfde processorkracht zonder iGPU ? Dat is voor mij een reden om zonder te willen.
Gamers zijn echter niet de grootste afzetmarkt, noch power-users. Ik heb jammer genoeg geen cijfers om dit te ondersteunen (misschien kan iemand anders dit wel?) maar het gros van de devices (laptops, pc's, mobile devices) die verkocht worden zitten niet in de doelgroepen die jij aanhaalt. (Waarschijnlijk wel hier onder tweakers, maar niet als je de globale markt bekijkt.)

Je betaalt trouwens niet meer omdat er een geïntegreerde grafische kaart inzit, je zou net meer betalen indien Intel voor elke doelgroep een aparte chip moet ontwikkelen (ééntje voor de gamer, ééntje voor de power-user, ééntje voor de huis-tuin-en-keuken gebruiker, enz.). Nu ontwikkelt men (grofweg) één ontwerp dat men voor elk van deze doelgroepen kan gebruiken. Ik geloof dan ook niet dat je te veel betaalt omdat je een deel van de chip niet gebruikt, mogelijk zelfs integendeel!
De occasionele gamer kan er wel mee overweg natuurlijk met iGPU. Daarnaast vergt het aansturen van meerdere schermen met een resolutie > FullHD ook de nodige bronnen, zeker als je daar nog wat 3D werk bij gaat doen.

Er is een reden waarom Intel de grootste GPU fabrikant is, en dat is niet omdat ze de krachtigste hardware hebben.
Erg interessant om te lezen! Goed uitgelegd ondanks dat ik wat delen heb geskipped (GPU). De interne GPU boeit mij helemaal niets, omdat ik er waarschijnlijk toch een GTX970 (of nieuwere generatie Nvidia chips) er in ga zetten. Maximus Gene VIII bordje eronder, CPU iets OCen (van 4 naar 4,5 of meer).

Dit gaat vooral leuk worden als ik mijn huidige Core i7 920 @ 2,8Ghz ga upgraden. Deze heb ik lichtelijk OCed om meer snelheid uit mijn RAM te trekken. Een overstap van DDR3-1333 naar DDR4-2133 is een gigantische klap!

Vooral ook leuk is de extra PCI-E Lanes. Geen idee wat mijn huidige CPU aan kan sturen, maar met die lanes in de i7-6700K, kan ik erg ver komen. M.2 vind ik echter wel de beste verbetering, ondanks dat dit bij de moederbord fabrikant ligt.

Dus mijn volgende PC wordt sowieso een 6th gen i7, omdat ik wel een keer "die-hard" wil gaan. Ondanks zou mijn setup niet verder komen dan de €2K (excl randapparatuur).

Jaah, dit gaat een leuk project worden. Nu eerst maar wachten tot ik voldoende geld heb :P
Dit gaat vooral leuk worden als ik mijn huidige Core i7 920 @ 2,8Ghz ga upgraden. Deze heb ik lichtelijk OCed om meer snelheid uit mijn RAM te trekken. Een overstap van DDR3-1333 naar DDR4-2133 is een gigantische klap!
hmm die heb ik ook, core I7 920, D0 stepping, prachtige first gen core processor, en ik zit nog te overwegen om deze ook binnenkort eens te upgraden want hij gaat al een tijdje mee,

Maar als ik kijk naar alle nieuwe features van de huidige/nieuwe generaties i7, kom ik nog steeds tot de conclusie dat ik dat voor mijn simpele desktop niet nodig heb.
Alles gaat nog steeds supersnel, en ik zie nog steeds geen reden om te upgraden. Misschien dat de tdp de hoofdreden zou zijn om te upgraden, want het is nogal een heethoofd met een tdp van 130 watt.

daarnaast allemaal prachtige nieuwe features, en als de boel het begeeft zou de core i5 van deze generatie een mooie vervanging zijn. Ik denk echter dat ik al die verbeteringen niet snel zal merken :)


edit: typo's

[Reactie gewijzigd door pjottrr op 22 juli 2024 22:03]

Zelfde verhaal hier, zit nog met een i7 860 gaat ook al een paar jaartjes mee. Maar hij doet het nog prima. I.C.M. mijn GTX 980 speel ik alle (nieuwe) games gewoon op 1920*1200 waarbij alles high en 60fps meestal ook geen probleem is.

Die nieuwe CPU's zien er interessant uit, vooral vanwege de extra snelheid//features en lagere TDP. Maar die lagere TDP haal je er écht niet uit qua kosten en die extra snelheid zal je ook niet snel merken. Woohoo, mijn programma start in 0.1 ipv 0.12 seconden op!

Enige wat ik misschien ga missen is USB3 support. Maar ik heb buiten een ToBo, muis, wireless 360 controller en een Thurstmaster T500RS geen enkel USB apparaat dat hoge snelheiden eist.
Écht nodig is het inderdaad niet. De i7 920 (ik heb ook een D0, aka heethoofd) is nog snel genoeg voor hedendaagse werkzaamheden en games.

Ik wil alleen mijn spul vervangen omdat ik een keer een andere pc wil en omdat mijn huidige GPU geen DP daisychaining ondersteund voor 3x 2560x1440.
Nou ik heb ook net de upgrade volbracht en ik kan wel zeggen dat aanzienlijk in de fps scheelt in arma 3, zomaar even 10-15 fps erbij (zowel de 920 als de 6600k op 3.5 ghz geklokt). De 920 met D0 is inderdaad nog een beest om rekening mee te houden maar de warmteproductie bij een stevige OC rees de pan uit, dit is bij mijn i5 6600k veel beter in de hand te houden. Daarnaast zijn de DDR4 ondersteuning, usb 3/3.1 en M2 ultra ook redenen geweest dat ik me nu al aan een update gewaagd heb. Zodra er M2 ssds met NVME beschikbaar zijn kan mijn oude Vertex 2 de laptop in.

Maarja zoals ik zei de 920 is een beest die zeker nog kan presteren in de nieuwste games, maar zelfs als de prestatiewinst tegenover haswell weinig is, de prestatiewinst tegenover de eerste en 2e serie Core i processors telt wel op.
Los gezien van gamen, want gamen heeft geen zware kracht nodig (geen 4 cores én 8 threads tenminste, het grootste gedeelte ligt toch aan de GPU). Een upgrade is sowieso wel fijn om van de 1e naar de 6e te gaan, wegens véél meer performance per core.

Tuurlijk, USB3.0/3.1 (mijn huidige pc heeft nog USB2.0), M.2, DDR4, meer lanes en SATA600 (heeft mijn huidige PC ook niet) is een groot gedeelte waarom ik graag een nieuwe pc wil.
Eens in de zoveel tijd wat nieuws is inderdaad veel leuker.

De 920 zuipt 130Watt, tenzij je hem gaat OCen, dan gaat hij daar overheen. Mijn D0 draait niet meer stabiel als ik hem naar 2,9Ghz klok, dus vandaar dat ik het bij 2,8Ghz houdt.
Als ik nu onder mijn 920 een moderner (socket 1366) moederbord zet, zou hij ook een stukkie sneller zijn vanwege SATA600 enzo.

NVMe zit ik ook op te wachten. M.2 is al een flinke upgrade, want daar jaag je ook ff 4Gbit doorheen. Mijn volgende PC wordt echter wel zo stil mogelijk, dus dat betekend dat er GEEN schijf in gaat, zoveel mogelijk stille waterkoeling en een goede kast.

[Reactie gewijzigd door SilentDecode op 22 juli 2024 22:03]

De gpu van Skylake is inmiddels al weer de negende generatie grafische processors. Vergeleken met Intels HD Graphics zouden de prestaties ruwweg twintigmaal zo hoog zijn. De Iron Lake-gpu haalde met 10 execution units ongeveer 43Gflops, terwijl de HD 530 uit Skylake tot zo'n 1152Gflops zou komen.
Wat betekent dit in de praktijk? Dat je elk modern topspel met alle eyecandy ingeschakeld vloeiend kunt spelen op een zuinige processor? Of is dit iets te optimistisch?
[...]


Wat betekent dit in de praktijk? Dat je elk modern topspel met alle eyecandy ingeschakeld vloeiend kunt spelen op een zuinige processor? Of is dit iets te optimistisch?
Heb niet de beschikking over een skylake chip om dit in de praktijk mee te testen. Maar op basis van het aantal Gflops is dat inderdaad iets (of meer dan iets) te optimistisch.

Gflops zeggen natuurlijk niet absolut alles, maar als we het als indicatie gebruiken: een 750ti heeft 1306 Gflops tegen 1152Gflops voor Skylake. Afhankelijk van drivers zou een performance rond (of iets onder) die van de 750ti dus meer in de lijn der verwachting liggen dan iets in de buurt van de absolute top kaarten (980ti, Fury X en Titan X zitten allemaal rond de 7000 of 8000 Gflops meen ik).

Kortom: als de drivers goed genoeg zijn zou Medium/High op 1080p waarschijnlijk aardig kunnen met deze iGPU (gebaseerd op mijn ervaring met de 750ti), maar veel meer dan dat zal 't naar verwachting niet zijn. (En als de drivers niet goed genoeg zijn wordt dat natuurlijk nog minder.)

[Reactie gewijzigd door Lixwulf op 22 juli 2024 22:03]

Voor de af en toe gamer zal het dus wel voldoende zijn...

Ik ga er ook vanuit dat zo'n processor zuiniger is bij normaal 2D gebruik dan de normale combinatie van CPU en aparte videokaart. Oftewel, je hebt alleen het stroomverbruik van 3D als je inderdaad aan het gamen bent. Klopt dat?
Ik speel witcher2, cryis2, mass effect 2/3 etc allemaal vloeiend op 1080p alles op high op een laptop met een twee en een half jaar oude i7-4702MQ in combinatie GTX760M en die heeft 965Gflops dus in theorie zal je enkel in extreme spellen naar medium of naar 1600x900 moeten gaan. Let wel, in theorie... drivers zijn ook belangrijk. Ik kijk uit naar de benchmarks.
Ok, dat valt mee. Zover ik weet is Crysis2 toch een aardige performance-slurper.... correct me if I'm wrong...
Intel heeft de rest van de line-up (cpu's) ook aangekondigt; hier een artikel van de buren.
http://nl.hardware.info/n...-voor-desktops-en-laptops
Het zijn er maar liefst 48 :/

[Reactie gewijzigd door pwillemske op 22 juli 2024 22:03]

Blijkbaar heb je onze review niet gelezen. Busted!. }) :P
Wut, ik heb er overheen gekeken...heb uitgebreid zitten lezen..maar ach, ik heb genoten van het lezen :D !
> De belangrijkste vernieuwingen zijn echter in het energiebeheer te vinden.

Nou... De grootste verniewingen zijn mijns inziens AVX-512 en de manier waarop met memory wordt gewerkt.

AVX-512 heeft op lange termijn enorme impact; op korte termijn vrijwel nihil. AVX-512 is een enorme uitbreiding van de instructieset, die ongeveer net zo groot is als alle andere SIMD uitbreidingen bij elkaar. Zie: https://software.intel.co...nsicsGuide/#techs=AVX_512 voor de wijzigingen. Dit is echt een major leap.

Vwb. memory moet je je beseffen dat veel applicaties tegen geheugenbandbreedte problemen aanlopen, waardoor ze het maximale potentiaal er niet uit halen. Ter vergelijk: programma's die hierop optimaliseren halen meer dan 10x zoveel performance uit dezelfde machines. Mike Acton legt het uit: https://www.youtube.com/watch?v=rX0ItVEVjHc . Iedere significante verbetering op het gebied van CPU memory fetches zie je meteen enorm terug.
Deze Skylakes hebben helaas geen AVX-512. De nog te introduceren Skylake Xeons waarschijlijk wel.
Hee ik zie inderdaad een update op de Wikipedia hierover.

Dank voor de toelichting!
Zeer interessante CPU's. Het sterk verminderde stroomverbruik voor dezelfde snelheden en dan alsnog veel betere GPU prestaties is echt een mooi staaltje ontwikkeling en zeker de upgrade waard... De benchmarks wijzen echt veel betere videoprestaties uit en het stroomverbruik is geniaal laag.

Ik wil d'r wel eentje. :)
nou stuur die officiele benchmarks met geniaal lage stroomverbruik dan maar eens door....
Mediacenter gebruikers hebben niet zoveel aan Skylake zonder die DP 1.2 > HDMI 2.0 adapter. En HDCP 2.2 is dan uitgesloten. Een gemiste kans.
Is die adapter er al dan ? (En dan bedoel ik niet die nepperd op Amazon die gewoon een Belkin DP 1.2 > HDMI 1.4 adapter bleek te zijn)
En ik wou gisteren een ASUS i7-4720HQ laptop kopen van de 4e generatie processor, omdat die nog een Quad Core is. En de vijfde generatie nog niet.

Kan iemand mij vertellen of die nog wel mee zal komen de komende 4 jaren?
Of is dit nu een oude Processor?

Dank jullie wel.
Nou, het zal niet bijzonder veel uitmaken denk ik. Maar de Skylake serie heeft wel veel verbeteringen weer doorgevoerd voor mobiele processors, meer dan voor desktops.
Nog 4 jaar meegaan zal dat ding zeker, intel processors raken bijna niet verouderd tegenwoordig. Mijn i7 920 hield het vol sinds 2009 tot vorige week, ook bij de nieuwste games, en hij gaat straks vrolijk verder door het leven als videomontagebak bij een maat van me. Ik ken ook nog lui die hun 920 niet gaan upgraden totdat Cannonlake er is.
Wat is dat met onderhand elke Intel CPU die VT-d / VT-x support biedt, daar de meeste chipsets het vervolgens weer niet ondersteunen(een enkele Q..., of vertraagde X... series, los van de server varianten).
Zo de bios het vaak wel aanbied als configureerbare optie, maar zo ik begrijp dan enkel van toepassing is op overige componenten, dus buiten de chipset. https://en.wikipedia.org/wiki/List_of_Intel_chipsets *

Het kromme vind ik zelfs, dat fabrikanten(vb: Asrock) met bijv. de C266 chipset te kennen geeft de i7 niet officieel te ondersteunen :?
(verspilde moeite om uitvoerig te testen, omdat mensen met die chipset als keuze er toch wel een Xeon in proppen? :9 )

En hoe zit dat dan met het RAM, verkrijgt het toegewezen geheugen daar dan ook geen geisoleerde eigenschappen, of is het volledig afhankelijk van de inzet per moederboard fabrikant op de BIOS firmware wat VT-d daar mag betekenen?

*Opgezocht en aangepast op wiki, de meeste mobile chipsets bieden uiteraard weer wel VT-d support... :/

[Reactie gewijzigd door Verwijderd op 22 juli 2024 22:03]

Op dit item kan niet meer gereageerd worden.