Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 47 reacties
Submitter: KevinDbr

Intel komt eind 2017 met het Purley-platform van Xeon-processors die op de Skylake-architectuur gebaseerd zijn, blijkt uit slides die op internet zijn verschenen. Purley is volgens Intel de grootste platformvooruitgang sinds Nehalem. Er komen cpu's met 28 cores.

De slides met roadmap stonden kortstondig op een site van een HPC-congres in Polen waar Intel een presentatie gaf. De slides zijn inmiddels verwijderd maar onder andere The Platform bericht erover. Het Purley-platform komt eind 2017 en wordt op de Skylake-architectuur gebaseerd: een tock in Intels tick-tock-stramien om aan te geven dat het om een nieuwe micro-architectuur gaat. De eerste Skylake-chips voor consumenten komen al dit jaar.

De Xeons van de Purley-generatie zijn bedoeld voor hpc-, storage-, netwerk- en enterprise-toepassingen. De chips moeten aanzienlijk betere prestaties per Watt gaan leveren en onder andere de uitbreiding naar 512bit-verwerking bij de AVX-instructieset moet hiervoor zorgen, terwijl ook de geheugenbandbreedte omhoog gaat. Dat laatste komt door de verhoging van vier naar zes geheugenkanalen per socket.

Purley gaat de optische 100Gbit/s-interconnects, die Intel Omni-Path noemt, geïntegreerd krijgen. Ook komende Xeon Phi-accelerators gaan over deze interconnects beschikken. Daarnaast maken de slides melding van een 'upi' als opvolger van de qpi als processorinterconnect. Bij gebruikmaking van drie kanalen zou de doorvoersnelheid op 10,4GT/s uitkomen waar dat bij qpi op maximaal 9,6GT/s zou zijn. Verder krijgen cpu's de beschikking over 48 pci-e 3.0-lanes en kan de pch van Purley 20 pci-e-interfaces ondersteunen.

Er komen Purley-Xeons op basis van Skylake met tdp's van 45W en de maximale tdp van Xeon-modellen ligt op 165W. De modellen krijgen ondersteuning voor Socket P. Het maximaal aantal cores komt op 28 te liggen, waar dat bij de Broadwell-EP op 22 en Broadwell-EX op 24 cores ligt. Bij de huidige Haswell-generatie van Xeons is het maximumaantal cores 18.

Intel Purley Xeon SkylakeIntel Purley Xeon SkylakeIntel Purley Xeon SkylakeIntel Purley Xeon SkylakeIntel Purley Xeon SkylakeIntel Purley Xeon SkylakeIntel Purley Xeon SkylakeIntel Purley Xeon Skylake

Moderatie-faq Wijzig weergave

Reacties (47)

Ben benieuwd wat dit nou uiteindelijk gaat brengen. De laatste jaren is er weinig spannends gebeurd op het gebied van de CPU's bij Intel. Het is zuiniger geworden en wat sneller gebundeld met nieuwe versies van standaarden maar verder weinig wat de 'Tweaker broek doet bollen'.

Ben benieuwd wat ze bedoelen met die nieuwe geheugen structuur, dat 100G netwerk gebeuren klinkt ook interessant (fiber ingebouwd?). Voor de consument zal het nog wel even duren voordat dit vrij beschikbaar gaat komen voor de meeste gebruikers, lijkt me meer gericht op hi-end servers.
De optische interconnects van 100Gbit/s waar het artikel over spreekt gaat niet zozeer over de gangbare LAN-mogelijkheden, maar voor specifieke koppeling van verschillende servercomponenten zoals in dit geval tussen CPU en Xeon Phi-accelerators. Dit in plaats van conventionele elektrische verbindingen die afhankelijk zijn van de beweeglijkheid van elektronen in draad (met daarmee gepaard gaande weerstand en signaalverlies).
Ik heb een vraagje hierover. Waardoor komt het dat gemiddelde GPU veel meer cores heeft dan een CPU? Als je bijvoorbeeld kijkt naar een Nvidia GTX 980 heeft deze 2048 CUDA cores.
Nou begrijp ik dat dit een hele andere architectuur is en dat een core in een CPU veel ingewikkelder in elkaar zit; maar een core is een core, het is heel klein en is in staat veel berekeningen uit te voeren. Het is toch niet zo dat een CUDA core simpeler is te maken (relatief gezien?).

Heeft dit iets met de prijs te maken? Ik vind het gewoon raar, bijv. 28 cores die gemaakt zijn om van alles te doen tegenover 2048 cores speciaal gemaakt om grafische en wiskundige berekeningen uit te voeren.
Een cpu core is geen gpu core, een core is een core is dan ook een verkeerde uitspraak.
een gpu core is vele malen kleiner en inderdaan simplistischer, zoals je al zegt. Een Cuda core is niet alleen simpeler te maken, het word al simpel gemaakt.

reviews: Het huwelijk van gpu en cpu
Zoals je hier ook leest, is de cpu veel sneller met serieele taken, de gpu veel sneller met parralle taken. De CPU is niet zomaar sneller met serieele taken, dat is express zo gedaan daar veel code niet gebaat zijn (nog) bij parralle verwerking en sommige code altijd serieel zal moeten worden uitgevoerd. Heb ik nog niets eens over het nut van cache en brance-prediction, die ook een groot deel van de cpu-core in beslag neemt. Zaken, die bij de GPU ontbreken; logisch, want anders blijft er geen ruimte voor 2000+ cuda cores.

http://nl.wikipedia.org/wiki/Aantal_transistors
Hier zie je dat een quad core intel uit 2010 pakweg 2/3 van het aantal transistors heeft dan de GF100 GPU. De laatste heeft dus wel veel meer cores , maar iedere core ansich telt veel minder transistors dan de cpu core. Het programmeren voor de gpu cores is ook een stuk lastiger en vergt algauw 2x zoveel code, juist omdat de gpu core nogal "dom" is.

http://www.legitreviews.c...11-video-card-review_1258
480 cuda cores, die echter "slechts" op 700Mhz werken. Ook al een verschil, de cpu cores draaien tot zo'n 5 Ghz heden ten dage.

Maar goed, de cpu cores zijn dan ook bij uitstek geschikt voor multitasking en multi-threaded operaties, de gpu cores zijn dat zeker niet, deels onmogelijk en deels wellicht te bereiken met complexere software code. Op dat gebied zal de cpu, zolang er niets veranderd, veel sterker in blijven. Parralle verwerking, van vooral specifieke taken, veelal slechts te gebruiken door 1 applicatie tegelijk, daar is de GPU heer en meester in. Zo is het ook bedoeld.

Er word naar meer taken gezocht voor die gpu cores, deels lukt dat aardig en deels schiet dat niet echt op. Ondanks alle mooie beloften bijv; kan de cpu nog altijd beter video encoden dan een gpu. Niet sneller, maar vooral beter. Vooralsnog, heeft men daar bij de gpu nog geen oplossing voor gevonden, behalve het zo encoden dat de gpu snelheid drastisch inkakt om maar in de buurt van de cpu kwalteit te komen.

[Reactie gewijzigd door Madrox op 26 mei 2015 14:35]

Mooie comment. Nou begrijp ik het. Ik had je graag willen upvoten, maar dat mag niet. Het zou dus inderdaad extreem duur worden als we een CPU met zoveel cores zouden uitbrengen; Ik hou al op :P

Wellicht op een dag...
Het is wel zo dat een CUDA core simpeler te maken is. GPU's hebben veel kleine cores die in specifieke taken heel goed zijn en CPU's hebben grote cores die heel veel verschillende taken kunnen maar niet voor een specifieke taak geoptimaliseerd zijn.

Een CPU met 4 grote, complexe x86 cores is per core duurder dan een GPU met 2048 eenvoudiger CUDA cores. Je kan het een echter niet zomaar met het ander vergelijken.
GPU Cores zijn eenvoudiger maar worden ook toegepast op zeer concurrent friendelijke taken. Zo is GFX zeer schaalbaar.
Princiepe is dit.

Je hebt een routine met shared constants Die op rits aligned en uniform onafhankelijk non shared data wordt losgelaten.
Wat kwa code caching en data caching zeer friendelijk is en dus optimaal concurrent gaat. Als zoon core block van enkele honderd cores daarop los laat is de klus na paar gangen zo geklaard.

Nou is de meeste taken niet zo eenvoudig optimaal extreme concurrent schalend te maken.
Een CPU core is groter out of order met branch prediction units en kan meerdere threads out of ourder aan. Dus ontworpen om zoon meer afhankelijke operand en opcode mix effecenter te verwerekn door de pipeline gevuld te houden zodat cores zoveel mogelijk bezig blijven.

Bij een in order core zoals een CELL moet men meer concurrent programmeren in branch arme en cache en latency friendelijke manier. Zoals Data oriented en funcioneel programmeren. Bij critical code secties.
Is hier een opleiding voor of zo? Er zijn zoveel richtingen op het gebied van ICT en Technologie, maar zulke opleidingen zie ik nooit langskomen. Het is zeker een specialisatie? Na jaren bij een een of ander bedrijf gewerkt te hebben?

Want ik weet nu al veel meer over het verschil tussen GPU's en CPU's, maar volgens mij is dit nog echt niks...
Intel sprak een paar jaar geleden al over het uitfaseren van koper en om fiber te gaan gebruiken voor interne connecties. Ben benieuwd of dit de eerste stap daarin is. Lijkt me dat ze beginnen met interne connecties en daarna overstappen naar de externe (de verschillende PCI-E lanes en daaraan gekoppelde bussen)
Omni-Path is toch weldegelijk vooral bedoeld als netwerk technologie om verschillende servers met elkaar te verbinden en is dan ook directe concurrent van Infiniband.

Waar je waarschijnlijk mee in de war bent zijn de nieuwe Xeon Phi's (knights landing) die geïntegreerde Omni-Path zullen krijgen. Deze nieuwe Xeon Phi's (met Omni-Path) zijn echter niet meer bedoeld als co-processors maar zijn volwaardig zelf-bootende processors/systemen geworden.

[Reactie gewijzigd door knirfie244 op 26 mei 2015 16:47]

als de processoren zuiniger worden betekend dit dat de wattage lager komt te liggen, dus de energie die er doorheen vloeit minder is, wat tot gevolg heeft dat het een lagere temperatuur kan behouden en dat lijkt tot een betere en/of stabielere over-clock te leiden. Een lagere energieverbruik betekend natuurlijk ook een lagere temperatuur wat betekend dat de materialen minder uit gaan zetten. Dit alles zal voor een langere levensduur zorgen van een processor.
overclock? Denk dat dit eerder richting een "zuiniger' datacentrum is, waar de energie waardes zo laag mogelijk moeten/willen liggen.

Steeds meer datacentres willen een PUE van 1.2 of lager - met meer cores, minder enrgies (en minder warmte) maakt dit het een stuk makkelijker.

zie ook: http://www.42u.com/measurement/pue-dcie.htm
Ik lees maximaal 165 watt en max 28 cores. dat is max 6 watt per core voor de cpu met hoogte tdp.

De snelheid per watt gaat dus een stuk omhoog.
Ik wil nog wel eens zien wat arm hier tegen daalt doen qua snelheid/verbruik.
Er is zat gebeurd qua features de afgelopen jaren. De gratis performance winst die iedereen wil zit er al lang niet meer in maar er komen steeds meer manieren om er toch een dikke performance winst uit te halen. Zie bijvoorbeeld de AVX 512 functies die er aan zitten te komen. Daar valt veel leuks mee te doen.
Ik vraag me af wat socket R3 betekend. Is dat niet gewoon socket 2011 v3, of een compleet nieuw socket?

Eind 2017, dat is behoorlijk ver weg. Zo een stagnatie in ontwikkeling en vernieuwing heb ik nog nooit meegemaakt.

[Reactie gewijzigd door Deem op 26 mei 2015 13:12]

Eind 2017, dat is behoorlijk ver weg. Zo een stagnatie in ontwikkeling en vernieuwing heb ik nog nooit meegemaakt.
Het is huilen met de pet op.

Ik wil al 2 jaar een berg(je) geld verkwisten aan een vervanging van mijn 2600K voor een dual Xeon systeem.

Nog steeds is het én niet te betalen én sub-3GHz/core én relatief laag aantal cores.
Alleen het laatste -en tevens meest onbetaalbare- platform levert een leuk aantal cores.

Tenminste, het is wel te betalen, maar als ik de geschiedenis/ontwikkelingen volg dan kan ik het simpelweg niet aan mijzelf verantwoorden om zo enorm te investeren in iets wat eigenlijk al jaren niet meer significant verbeterd is qua zuivere brute force prestaties.
Het is echt 'dramatisch' voor iemand zoals ik die graag 3D rendert en niks anders wilt dan héél veel GHz en héél veel cores.
Brute kracht wil ik. Die TDP's zijn leuk, maar laten mij koud.

Kan niet wachten totdat AMD weer eens kan en durft of dat een of ander Chinees bedrijf in komend decennium een rol van betekenis gaat spelen.
Dit is allemaal naar mijn mening een zuiver resultaat van gebrek aan concurrentie :(

[Reactie gewijzigd door TangledUniverse op 26 mei 2015 16:27]

Ik zit in dezelfde boot. Ik heb relatief goedkoop een i7-970 kunnen kopen en die tot 4Ghz kunnen overklokken. Elke keer als er een nieuwe reeks uitkomt zit ik te vergelijken en kom ik tot de conclusie dat het niet de moeite is om te upgraden. Daarbovenop komt nog dat ik in de periode dat DDR3 spotgoedkoop was meteen 24GB heb gestoken, dat moet ik dus ook vervangen door DDR4 als ik een CPU upgrade doe.

Tege dit tempo zit ik over 3 jaar nog op mijn i7-970,,,
Het is eigenlijk cheaper om een bak neer te zetten met 4 GPU's en dan met gpu renderen te gaan expirimenteren.

Of netwerk renderen op een paar 5960x's met OC is natuurlijk veel goedkoper :)

Het is idd jammer dat intel niet 1 cpu heeft die de TDP limiet compleet negeert.
Je krijgt naast de huidige Haswell Xenon: Broadwell-EP en Broadwell-EX en pas daarna Xeons op Skylake.

Voor de tweakers die wachten op wat nieuws: Skylake gaat UHD@60fps, h.265 hardwarematig versnellen. Die komst dus in mijn volgende HTPC build (35watt tdp)
28 cores dayum. Hoop ik dat consumenten hiervan ook nog wat krijgen tegen die tijd.
Dat zou wel leuk zijn ja. Maar ik ben bang dat ze daar nog wel even mee wachten. Zeker omdat het niet voor iedereen nuttig zou zijn. Maar voor video-hobbyisten zou het leuk zijn om een een snelle 8-core te hebben (16 hyperthreaded) die niet 1000 euro voor enkel de CPU kost.
Aan de andere kant zou het denk ik nuttig zijn dat in plaats van steeds meer cores, dat de performance van een enkele core drastisch omhoog gaat. Dat heeft ook voor singlethreaded applicaties voordelen.
Dat zou zeker fijn zijn denk ik :P Maar het lijkt mij (maar wie ben ik) makkelijker om extra cores te plaatsen, dan om de performance per core hoger te krijgen.
Dat zal inderdaadaa, maar met meer cores is het wel weer moeilijker de TDP onder controle te houden. Blijkbaar is het laatste makkelijker uitvoerbaar dat een hogere IPC per kloktik.
Juist niet, de TDP is makkelijker onder controle te houden met 2 cores op 2 GHz dan met 1 core op 4 GHz.
Maar ik heb het dan over de 2011 socket. Die zitten op dit moment volgens mij op 6 tot 8 cores (tenzij je xeons neemt). Lijkt me niet vreemd als dat met skylake op 8 tot 10 zit of zelfs meer.

De cpu's voor de gewone consumenten van skylake zitten op gewoon 4 cores. Gaat denk ik ook niet heel snel veranderen. Tenzij amd mischien met zijn zen cores wat geweldigs doet.

[Reactie gewijzigd door Barsonax op 26 mei 2015 13:04]

Ik hoop het ook. Verwacht het ook wel een klein beetje... Maar zolang Intel in de High-End nog geen echte concurrentie heeft, hebben ze geen haast heb ik het idee. :o
Hopen dat Zen wat wordt. Ik vind het wel weer eens tijd voor een AMD cpu in mn pc...
je kunt prima gamen op een xeon 18 core (bij single threaded gaat de turbo omhoog klokken) zie video van linus techtips, kan hem nu even niet opzoeken voor je. Overklokken lukt niet met xeons gezien multiplier locked is (logisch, een bedrijf heeft zijn SLA uiteraard). Persoonlijk heb ik ook nagedacht over 2e hands xeon setup gezien ik niet gek veel game, maar wel andere dingen doe waarbij wat meer cpu performance geen kwaad kan, alleen single threaded is een 2600k op 5ghz toch iets leuker als een 18 core die "maar" 3ghz doet.
Mn x5650 draait ipv 2,67 op 4,0 ghz.. Of bedoel je 2011-socket xeons?
Sorry voor de onduidelijkheid, k bedoelde socket 2011-3 waar de 18 core xeons(36 threads dus :+ ) voor zijn, die konden qua single thread load nog een leuke snelheid behalen waardoor gamen op deze chips goed mogelijk was, zelfs non-ECC geheugen werd geaccepteerd (XMP niet) , daarnaast ook gewoon ECC geheugen op een consumenten bord (asus nogwat) werkte gewoon. Temperaturen op full load (dus echt alle 36 threads lekker aan het werk) leverde geen schrikbarende temperaturen op ~55 graden met de closed-loop corsair waterkoeler (even gemist welke) dus gewoon netjes zoals verwacht volgens het TDP.
Als ik het me goed herinner was het de Corsair H100i, maar het viel mij ook al op dat bij 100% gebruik van alle 18 cores de temperatuur relatief zo laag bleef.
Met 1366 Xeons kon je de FSB inderdaad nog verhogen ja, dat is er sinds 2011 niet meer bij(ja 5% misschien).
Het is een beetje rare tijd als je in de markt bent voor een nieuwe pc. Broadwell desktop CPU gaan zeer binnenkort komen, maar skylake gaat daarna niet lang meer op zich laten wachten.

Ook jammer dat de E3 series niet wordt besproken. Bij Haswell was de 1200-v3 iig bijna hetzelfde als een i7 maar dan met ECC support, de v4 zal dan de broadwell versie worden maar hoelang zal het wachten zijn op een E3-1200-v5 dat een nieuwe socket zal krijgen met een nieuwe chipset en wat nieuwe features.
Niet geheel duidelijk die slides.

Is het nu 28 Cores met de mogelijkheid van HT = 56 Virt. Cores, of 14 Cores + HT = 28 Virt. Cores.
Intel gaat geen cpu's met minder cores uitbrengen in dezelfde performance bracket. Dus de E7 8000 Skylake cpu's hebben 28 cores + HT = 56 vituele cores.
"virtuele cores" zijn gewoon de 2 threads. Een core is de fysieke hardware die de intructies afwerkt, de threads zijn de laag tussen de echte hardware en de software die uitgevoerd word, een i7 ziet er niet wezenlijk anders uit dan een i5 op silicon niveau.

[Reactie gewijzigd door aadje93 op 26 mei 2015 17:34]

Joh... Ik snap niet helemaal waarom je dat als antwoord op mijn opmerking geeft maar goed. En het is het is als reactie op de vraag hoeveel threads je nou tegelijk de CPU in kan feeden, niet hoe een CPU in elkaar zit.

En virtuele cores zijn niet twee threads. Wat intel heeft gedaan is de decoder en displatcher dubbel uitgevoerd om de enkele core efficiënter van data te kunnen voorzien. Het heeft maar bar weinig met threads te maken die zich aan de software kant bevinden. Het "virtuele core" is gewoon een simpelere benaming voor de extra unit die het OS ziet.

[Reactie gewijzigd door Thekilldevilhil op 26 mei 2015 15:56]

28 cores met HT mogelijkheid.

De "virtuele cores" worden doorgaans threads genoemd ipv cores.
Is thread meer de software kant.
Logical cores ( HT ) vs physical Cores is dan de hardware kant.
Open een Intel pagina van een willekeurige CPU, bijvoorbeeld deze.
Daarop vind je dat deze CPU 14 cores heeft en met HT 28 threads.

Wil je dus niet zoals Bart_Smith verward worden, volg dan simpelweg de termen die Intel hanteert: "cores" voor physieke cores en "threads" voor de logical cores.

Nu kun je wel argumenteren of Intel ze wel of niet threads moet noemen, maar dat is allemaal irrelevant.
Zal Linus leuk vinden :+

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True