Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 29 reacties

Intel heeft tijdens ISC 2013 in Duitsland zijn productlijn coprocessors uit de Xeon Phi-serie uitgebreid. Het bedrijf heeft drie nieuwe producten in de Xeon Phi-coprocessorfamilie aangekondigd, die in verschillende hpc-omgevingen toegepast moeten worden.

Tijdens de vorige editie van de International Supercomputing Conference kondigde Intel zijn eerste generatie Xeon Phi-producten aan. De coprocessors bestaan uit Knights Corner-cores die compatibel zijn met x86-code. Concurrerende gpgpu-producten hebben speciaal geschreven code nodig om van de parallelle rekenkracht gebruik te maken. De eerste serie Xeon Phi-coprocessors bestond uit de 5110P met 60 cores die op 1053MHz geklokt worden. Destijds kondigde Intel aan in de loop van 2013 met uitbreidingen van de Xeon Phi-producten te komen: uitbreidingen voor de 3100-serie, meer producten in de 5100-serie en een nieuwe high-end 7100-serie.

Xeon Phi

In de 3100-serie heeft Intel de 3120P en 3120A aangekondigd, die respectievelijk passief en actief gekoeld worden. De rekenkracht moet boven de 1Tflops uitkomen en de Xeon Phi's krijgen 6GB gddr5-geheugen met een bandbreedte van 240GB/s. In de 5100-serie wordt met de 5120D een nieuwe formfactor geïntroduceerd. Deze coprocessor is bedoeld voor systemen waarin geen ruimte voor pci-expresskaarten is. De 5120D haalt meer dan 1Tflops in double precision-berekeningen en heeft 8GB gddr5-geheugen, met een bandbreedte van ruim 300GB/s.

De nieuwe serie Xeon Phi's bestaat uit de 7100-serie, met de 7120P en 7120X. De 7120P wordt passief gekoeld, terwijl de 7120X een kaal pcb betreft. De 7100-serie moet het topsegment bedienen en is voorzien van 16GB gddr5-geheugen met een totale bandbreedte van 352GB/s. De coprocessors moeten 1,2tflops aan rekenkracht kunnen leveren. Alle huidige Xeon Phi-coprocessors zijn op de Knights Corner-architectuur gebaseerd en worden op 22nm geproduceerd.

Xeon Phi wordt in de snelste supercomputer ter wereld gebruikt. Dit Milky Way 2-systeem, met 32.768 cores van 22nm, Ivy Bridge Xeon-processors uit de E5-2600 V2-serie en 48.000 Xeon Phi-coprocessors, levert 54,9Pflops piekrekenkracht en 33,86Pflops Linpack-rekenkracht. De 4096 processors worden aan 1PB werkgeheugen en 12,4PB opslag gekoppeld. Het systeem vergt 17,8MW aan energie en wordt in 162 serverbehuizingen ondergebracht.Intel Knights Landing

Een nieuwe generatie Xeon Phi-coprocessors werd eveneens aangekondigd, maar is nog niet beschikbaar. De Knights Landing-generatie zal op 14nm geproduceerd worden en de prestaties van supercomputers verder omhoog schroeven, terwijl het opgenomen vermogen moet dalen. Anders dan de coprocessors van Knights Corner zal de Knights Landing ook als stand-alone-cpu gebruikt kunnen worden. Knights Landing krijgt, net als sommige producten uit de onlangs geïntroduceerde Haswell-processors, geheugen op dezelfde chipverpakking. Het geïntegreerde geheugen zit niet in dezelfde die, maar wel in de package.

Moderatie-faq Wijzig weergave

Reacties (29)

Jammer dat er hier weinig details worden genoemd over de nieuwe generatie Knights Landing chips behalve dan dat ze op 14nm gebakken zullen worden. Was er niet meer informatie beschikbaar over bijvoorbeelde de verwachte clocksnelheden en/of het aantal cores op deze chips? Of moeten we het zo zien dat intel ook hier een tick/tock toepast en dat dit in principe nagenoeg het zelfde chipontwerp is als de eerste generatie?

Ik ben ook benieuwd hoe de chips in elkaar zullen steken voor stand-alone CPU werk; opzich is dat niet vreemd aangezien de huidige "gewone" x86's zijn en in principe een groot shared memory multicore systeem alleen dan op een insteekkaart. Als ik me niet vergis hebben ze nu ook een Linux draaien op (een van de?) cores om de Xeon Phy te managen.
aangezien de huidige "gewone" x86's zijn en in principe een groot shared memory multicore systeem alleen dan op een insteekkaart. Als ik me niet vergis hebben ze nu ook een Linux draaien op (een van de?) cores om de Xeon Phy te managen.
Nee, het zijn geen gewone x86's, ze zijn binary incompatible. Je moet je code ervoor hercompileren om ofwel native op zo'n ding te laten draaien, of om tijdens de uitvoering van de code aan "offloading" te doen: Stukjes code worden dan op de mic gedraaid. Je kunt ernaar ssh'en als hij in je systeem zit (of van buitenaf als je iets met bridging doet), hij (het ding, alle cores dus) draait op Linux:

$ ssh mic0
~ $ uname -a
Linux grepit-demo-e5-mic0 2.6.38.8-g5f2543d #2 SMP Tue Apr 30 17:22:20 EDT 2013 k1om k1om k1om GNU/Linux
~ $ free
total used free shared buffers
Mem: 7882356 236416 7645940 0 0
-/+ buffers: 236416 7645940
Swap: 0 0 0
~ $ df -h
Filesystem Size Used Available Use% Mounted on
none 3.8G 0 3.8G 0% /dev
none 6.4G 75.3M 6.3G 1% /
none 3.8G 0 3.8G 0% /dev
none 3.8G 0 3.8G 0% /dev/shm
192.168.13.79:/home 24.0G 5.9G 16.9G 26% /home
192.168.13.79:/opt/intel
844.6G 6.6G 795.1G 1% /opt/intel

~ $ cat /proc/cpuinfo | tail -n 26

processor : 239
vendor_id : GenuineIntel
cpu family : 11
model : 1
model name : 0b/01
stepping : 3
cpu MHz : 1052.630
cache size : 512 KB
physical id : 0
siblings : 240
core id : 59
cpu cores : 60
apicid : 239
initial apicid : 239
fpu : yes
fpu_exception : yes
cpuid level : 4
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic mtrr mca pat fxsr ht syscall nx lm rep_good nopl lahf_lm
bogomips : 2114.09
clflush size : 64
cache_alignment : 64
address sizes : 40 bits physical, 48 bits virtual
power management:

[Reactie gewijzigd door Gerb op 17 juni 2013 20:28]

was de nieuwe chinese supercomputer niet de snelste?
nieuws: Chinese supercomputer Tianhe-2 pakt koppositie in top 500

verder 16GB GDDR5 dat is wel erg goed voor flinke simulaties,
verder wel soortgelijke chip, mogelijk nieuwe stepping, want verder lijkt er weinig veranderd of zie ik dat fout?
Tianhe is Chinees voor Milky Way, dus ze hebben het over hetzelfde apparaat. Wel licht verwarrend overigens dat ze in 2 artikelen 2 verschillende namen gebruiken voor hetzelfde apparaat.
Ok thanks, ik zat ook al te denken, maar dat verklaard het.
Hah, en je leert zelfs nog een woordje Chinees hier op Tweakers ;)
Weinig veranderd zo lijkt het. Intel gaat gewoon beginnen met de verkoop binnenkort zo lijkt het.

En als ze 61 cores ewrkend krijgen dan betaal je 3 staven goud ervoor en als er 57 cores werken zoals i nde Chinese supercomputer dan gok ik 2 staven goud :)
Kondigt aan? In china wordt al gebruik gemaakt van deze chip in hun nieuwe en (kennelijk) 's werelds snelste supercomputer

http://www.nu.nl/tech/350...cordhouder-van-troon.html

Edit, eerst lezen..

Moet ik me hier iets bij voorstellen als het minen van Bitcoins op een GPU? De GPU (met beperkte instructieset) zo snel mogelijk bepaalde berekeningen uit laten voeren waar een gemiddelde CPU wellicht wat minder goed in is?

[Reactie gewijzigd door ScoeS op 17 juni 2013 20:38]

Bijvoorbeeld. Dergelijke producten (gpu's) kunnen heel wat simpele berekeningen parallel en zeer snel doen, omdat dat is waarvoor ze zijn ontworpen. Cpu's zijn veel flexibeler, kan je veel verschillende zaken mee doen maar kunnen niet tippen aan de brute snelheid hiervan.

Voor sommige software is brute rekenkracht nodig naast het intelligente werk, en daarbij komen dergelijke hulp-processors goed van pas. In desktop land heb je daardoor bv. hardwarematige versnelling van videos op je gpu, waardoor de cpu niets moet doen.

[Reactie gewijzigd door Mathieu_Hinder op 17 juni 2013 21:10]

Xeon Phi wordt in de snelste supercomputer ter wereld gebruikt. Dit Milky Way 2-systeem, met 32.768 cores van 22nm, Ivy Bridge Xeon-processors uit de E5-2600 V2-serie en 48.000 Xeon Phi-coprocessors, levert 54,9Pflops piekrekenkracht en 33,86Pflops Linpack-rekenkracht.
Is deze niet sneller, of via een andere benchmark? nieuws: Chinese supercomputer Tianhe-2 pakt koppositie in top 500
Die komt op "Het Tianhe-2-cluster weet bij de Linpack-benchmark, waarop de rangschikking in de top 500 is gebaseerd, een score van 33,9 petaflops te behalen.

Overigens had ik totaal vergeten dat Intel weer coprocessors maakt...
Dat is oudere versie van de Xeon Phi met 57 cores. Zo'n supercomputer bouw je niet zo maar eventjes...
nouja, uiteindelijk is het gewoon hetzelfde als een server inelkaar knuppen maar dan x heelveel en een dikke interconnect.
天河 (chinees voor tianhe) door google translate halen levert op............
en die 2 snap je zelf wel toch?
Ah, okay, ze gebruikten het verkeerde schrift. :)
ik vindt dit toch een betere oplossing als die nvidia add-on cuda meuk, aangezien je met dit ding nauwelijks je code hoeft aan te passen om toch een flinke performance boost te krijgen.

vooral voor de wetenschappelijke markt, zal nvidia uiteindelijk volledig verdwijnen (aangezien Intel toch meer kan prijs stunten als dat moet).
Nou, reken er maar op dat je je code moet aanpassen om op zo veel cores te kunnen werken. Bovendien wordt in de doelgroep code waarschijnlijk sowieso al geschreven voor een specifieke machine, dus het voordeel is niet zo groot als Intel het uitmeet.

Als je je dan ook nog bedenkt dat de huidige Xeon Phi chips groot (en dus duur) zijn en veel stroom gebruiken, wordt het plaatje eigenlijk gewoon onaantrekkelijk... Klopt zeker dat Intel met prijzen kan stunten, maar zouden ze dat echt vol kunnen houden?
ja maar het voordeel is wel dat het gewoon x86 is, met nvidia weet je nooit wat er gaat gebeuren.

ik blijf toch van mening dat Nvidia over 5 jaar niet meer bestaat.

[Reactie gewijzigd door stewie op 18 juni 2013 13:52]

Nou ja, als code voor een bepaalde machine wordt geschreven maakt het natuurlijk niet zo veel uit of het bedrijf wat de chip gemaakt heeft nog bestaat of niet. Daar naast is er natuurlijk OpenCL, wat toch wel redelijk constant is, denk ik. :)

Tot slot ondersteunt de Phi processor niet 'gewoon' x86, ten minste, niet zoals we die nu kennen. De architectuur kan bijvoorbeeld geen SSE instructies aan, die nu toch best veel gebruikt worden om applicaties sneller te doen draaien. Er is ook geen MMX, x87, FMA of AVX, laat staan AVX2. Maar wel weer IMCI, wat gewone x86 CPUs weer niet hebben, en wat de Phi zijn hoeveelheid FLOPs geeft.
Prijs prijs prijs en nog belangrijker bij intel: Wanneer liggen ze in de winkel?

Ik herinner me al jaren geleden tijdens presentaties zo'n intel bobo die dan sheets vol disclaimers presenteerde over larrabee wat vervolgens gecornered werd en later weer geknight. Nu dan dus Xeon Phi heet... ...zij het met meer cores nu...

Passief koelen van Xeon Phi lijkt me overigens niet zo'n best idee - zelfs niet wanneer hij idle is :)

Die 7120X is overigens de versie met 61 cores. Dat zal dus wel wat gaan kosten...

De 300 watt TDP, ach, Nvidia en AMD plakken overal ook van die stickers op, dat klopt nooit als je 'm onder 100% load zet. Ik heb hier ook wat van die Tesla's... :)
Passief koelen van Xeon Phi lijkt me overigens niet zo'n best idee - zelfs niet wanneer hij idle is :)
Passief koelen betekent voor de Phi "In een chassis stoppen waarin de high power fans het heel hard kunnen laten waaien, en waarbij de lucht per se door de Phi heen moet (via air ducts)." Dus niet in een gewoon towertje.
"Deze coprocessor is bedoeld voor systemen waarin geen ruimte voor pci-expresskaarten is."

mss rare vraag maar welke aansluiting heeft het dan wel ?
het ziet eruit als een GPU vandaar.
Via een speciaal stekkertje voor in een blade bijvoorbeeld. Tzt komen ze ook wel onboard verwacht ik, als Intel het niet te moeilijk maakt om ervoor te programmeren.
Ik ben eigenlijk wel benieuwd naar de flops/w van deze xeon-phi's. Met name omdat AMD en Nvidia 'vastzitten' op TSMC's 28nm-procede, terwijl Intel al vrolijk op 22nm bakt, inclusief hun 3d-transistors. Met name in supercomputers is een hogere efficiŽntie erg belangrijk.
Leuk, maar ik ben wel een beetje skeptisch. Je moet sowieso parallel-compatible code moeten schrijven, heeft zijn eigen geheugen (wat heel erg logisch is, anders kun heb je goed kans dat je cores alleen maar aan het idlen zijn tijdens het memory fetch), memory management zal niet veel anders zijn dan op cuda of openCL en je zult sowieso hardware specific api moeten gebruiken. intel is goed bezig on zichzelf te pushen in parallel computing markt met gpus, succes.
Daar zitten de chinezen dan met hun nieuwe supercomputer, is die gelijk alweer verouderd ;P

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True