Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Je kunt ook een cookievrije versie van de website bezoeken met minder functionaliteit. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 53 reacties, 25.141 views •

Intel heeft zijn Xeon Phi-coprocessors formeel aangekondigd tijdens het SuperComputing-symposium, dat plaatsvindt in Salt Lake City. Het bedrijf toonde de Xeon Phi-coprocessors voor parallelle rekentaken al eerder, maar gaf de specificaties en typenummers nog niet vrij.

De eerste versie van de Xeon Phi-coprocessor die Intel uitbrengt, is de 5110P. Deze pci-express-insteekkaart wordt passief gekoeld en wordt nu al aan sommige klanten geleverd, maar algemene verkrijgbaarheid is gepland voor 28 januari 2013. De kaart kost dan 2649 dollar. De Xeon Phi-architectuur is gebaseerd op Knights Corner, een doorontwikkeling van Intels Larrabee-techniek, en wordt gekenmerkt door een x86-architectuur met een 512bit brede vectorunit. De code wordt op de coprocessor uitgevoerd; de pci-express-verbinding wordt primair als netwerkinterconnect gebruikt.

Het grootste voordeel van de Xeon Phi's is de mogelijkheid om x86-code op de coprocessors uit te voeren. Code hoeft dan niet apart geschreven te worden, zoals bij gpgpu-computing. Als code geschikt gemaakt wordt voor parallelle verwerking, is het recompilen van de sourcecode voldoende om deze op de Xeon Phi-hardware uit te voeren. Vergeleken met een normale Xeon-processor zou de Xeon Phi twee- tot driemaal zo snel de geoptimaliseerde parallelle code kunnen uitvoeren. Het inzetten van de Xeon Phi-kaarten in supercomputers moet toepassingen als weersvoorspellingen, klimaatmodellen en simulaties versnellen.

De Xeon Phi 5110P wordt geleverd met 8GB gddr5-geheugen dat 5GT/s aan bandbreedte heeft. Omdat ecc ontbreekt in het geheugen, wordt een algoritme gebruikt om data-integriteit te waarborgen. De zestig cores van de 5110P worden op 1,053GHz geklokt en beschikken over 30MB cache. De kaart kan 1011Gflops aan double precision-rekenkracht halen. Twee 'special editions' met 1073Gflops en 61 op 1,1GHz geklokte cores zijn eveneens leverbaar.

In de tweede helft van 2013 wordt ook de 3100-serie Xeon Phi-coprocessors geleverd, die net als de 5110P op 22nm wordt geproduceerd. Deze komen in een passief en actief gekoelde pci-express-uitvoering beschikbaar. Intel geeft het aantal cores nog niet vrij, maar gezien de hoeveelheid cache-geheugen zou dat 57 zijn. De hoeveelheid geheugen voor deze kaarten bedraagt 6GB en de 3100-kaarten zouden nog altijd ruim 1Tflops halen. Waarschijnlijk worden de cores daartoe sneller geklokt dan de 5110P-kaarten.

Intel Xeon Phi-specificaties

Reacties (53)

Reactiefilter:-153052+136+23+30
Moderatie-faq Wijzig weergave
Stomme vraag wellicht... maar moet je daarvoor je kode aanpassen? Of kan een J2EE webserver die ook wat zware processing doet hier meteen van profiteren?
300W passief koelen :?
in serverracks heb je altijd een vrij hoge airflow van voor naar achter in de kast, deze kaart zou direct in de airflow staan, er hoeft dus geen fan meer op die eventueel kan slijten. De lucht die door de kaart naar buiten geblazen wordt is dan voldoende koeling.
correctie: direct in de al hete airflow. Dus de lucht die eerst al over cpu en zo is gegaan. De meeste PCI kaarten in servers zijn niet zulke straalkacheltjes (in tegenstelling tot de videokaart in jou systeem)
De videokaart in mijn systeem verbruikt anders een heel stuk minder dan deze kaarten.

Dus juist dan vind ik het zeer onverstandig om ze passief uit te brengen, want hoe kun je nou de werking garanderen als je maar moet vertrouwen op de airflow van de rest van de kast? Intel heeft er realistisch gezien geen invloed op waar deze kaarten ingestoken gaan worden.
Daar kan mooi een koe op!
Ow wat zou het mooi zijn. quad 1,7ghz snapdragon processors van qualcomm. Dat zijn mobile processors . Een stuk of 20 op 1 moederbord rekenpower!!! En laagstroomverbruik!!!!! ben benieuw of je dan een teraflop haalt met pak hem beet 50 watt?
Hier iets soortgelijks https://tweakers.net/nieu...-en-64-raspberry-pis.html

Zowel deze als de snapdragons zijn geen match voor reguliere cpu's.
Beetje afhankelijk van de taak. Jouw voorbeeld zijn ARMv6 raspberry pi's (pies?) op 700 mhz.
Een Snapdragon S4 1.7 ghz Quad (APQ8064) is toch wel iets andere koek.

Zet er zoals hierboven 20 in, en je hebt 80 S4 cores (met 20 Adreno 320 GPU cores!)

Daar wil ik best een paar benchmarks van zien :-) Beetje makkelijk om dat maar meteen af te doen als 'dat is geen match'.
Kort door de bocht is dit een grote multi-core CPU op een PCIe kaart, that's it. Toch weten veel mensen de discussie te sturen richting gamen, wat ik dus niet begrijp. Enfin.

Mijn grote vraag is juist, hoe zou zo'n kaartje het doen met renderen/raytracen??
Ik zou echt heel graag benchmarks willen zien met MentalRay/Vray of Renderman waarbij gekeken wordt hoeveel een kaartje zoals deze toevoegt t.o.v. een single/dual CPU renderbak.

Als ik thuis zo'n ding in mn PC steek en hij geeft 60 x 1GHz raw power, met in de wetenschap dat hij 2 a 3x sneller is met parallelle code dan een Xeon, dus 120-180GHz dan is dat toch wel rond de 10x sneller dan mijn i7-2600K.

Voor 2500 euro 10 i7-2600K's op een PCIe. Render fappy...eh happy!

edit: hmmm...uit andere bronnen blijkt dat de toename 2-3x is, in TOTAAL als geheel.
Dus niet per core t.o.v. single Xeon.
Bovengaande redenatie/berekening gaat dus totaal niet op.
Wat dat betreft niet echt handig overgenomen van Tweakers?

[Reactie gewijzigd door TangledUniverse op 13 november 2012 15:47]

Dat was iets waar Larrabee goed in zou zijn. En dit is eigenlijk een moderenere versie van Larrabee. Dus dat is best een interessante vraag.
Waarschijnlijk een idiote vraag... Maar zou dit werken als een mega server voor een minecraft hosting bedrijf? Minecraft servers nemen vaak flink gebruik van de CPU en met zon kaart zou je toch makkelijk 30000 klanten op 1 zon server kunnen houden.
Deze cpu cores zijn lang niet zo krachtig als een sandy bridge of Ivy bridge cpu core. Daarnaast zijn ze alleen goed in bepaalde bewerkingen dus zijn ook lang niet zo flexiebel qua instructies die ze kunnen uitvoeren. Het ligt dus heel erg aan de soort workload.
Valt wel mee; de x86 core (P54C) is vrijwel net zo flexibel qua instructies als de x86 core op Sandy Bridge. De vector unit is zelfs beter dan de SSE4.2 unit. Evengoed haal je met een blade server (meer sockets, meer geheugen) waarschijnlijk een betere performance.
Misschien een hele domme vraag, maar kan je (als je het geld hebt bijv) zo'n ding ook in je thuis computer stoppen?
Heeft dat nut voor bijv decoden / inpakken / uitpakken van bestanden, (veel) achtergrond berekeningen doen, en in de toekomst evt voor een simpele pc upgrade (2dehands/prijszakking) dmv een pci-e ipv cpu te vervangen??

[Reactie gewijzigd door Ting87 op 12 november 2012 23:45]

De code moet nog steeds opnieuw gecompileerd worden, dus dat moet de software leverancier dan nog wel voor je doen :)
thanks. Geen oplossing dus voor mijn oracle database met extreem veel (veels te veel) PL/SQL....
Het grootste voordeel van de Xeon Phi's is de mogelijkheid om x86-code op de coprocessors uit te voeren. Code hoeft dan niet apart geschreven te worden, zoals bij gpgpu-computing. Als code geschikt gemaakt wordt voor parallelle verwerking, is het recompilen van de sourcecode voldoende om deze op de Xeon Phi-hardware uit te voeren.
Ja, ja ... wat een marketing BS zeg. Voor gpu-computing zijn ook gewoon optimaliserende compilers beschikbaar hoor.

[Reactie gewijzigd door Killemov op 13 november 2012 01:25]

uhm, heb je wel eens voor een gpu geprogrammeerd? die zijn in hele andere dingen goed dan x86 cpu's ;) tis niet even een kwestie van cross compilen, maar meer de architectuur van je software herzien.
GPU's zijn met name goed in het enigzins uniform bewerken van grote sets data. En dat is nou precies waar deze Phi's ook voor gepusht worden. EN is het wel degelijk mogelijk om de meeste "normale" cpu instructies te vertalen naar gpu instructies. Niet dat je dat zou moeten willen, maar het kan.
"De Xeon Phi 5110P wordt geleverd met 8GB gddr5-geheugen dat 5GT/s aan bandbreedte heeft."

Wat betekent 5GT/s?
En ik vraag me bij dit soort kaarten altijd af, voor wie of welk bedrijf zijn deze nu geschikt? Vanaf welke grootte van een bedrijf komt deze kaart nu te pas?
GigaTransfer per seconde.

Een term verzonnen, omdat er per klokcyclus meerdere bits kunnen verstuurd worden.
Dit staat voor Gigatransfers per seconde.
Deze kaarten zijn uitermate geschikt voor clusters en andere supercomputers

https://tweakers.net/tag/Supercomputers/
Timer erbij gepakt, duurde 12 seconde
In computer technology, transfers per second and its more common derivatives gigatransfers per second (abbreviated GT/s)
Tekst:
...toepassingen als weersvoorspellingen, klimaatmodellen en simulaties versnellen...
Bedrijven die werken met supercomputers en daarmee weersvoorspellingen, klimaatmodellen of simulaties willen berekenen. Deze kaarten kunnen dat process versnellen.

En 2600 dollar is echt niets als je zonder die kaarten veel langer moet wachten en daarmee je werknemers van het werk afhoud.
Weermodellen zijn dusdanig complex dat waarschijnlijk 1 zo'n kaart niet volstaat.
Waarschijnlijk doelt Intel meer op een cluster met in enkele node een paar van deze kaarten.
Dan wordt de berekening :
#aantal_nodes * #aantal_kaarten_per_node * 2600 dollar = heel veel $$$$
En, omdat de data elkaar beinvloed, mag je onderling wat infiniband oid leggen.
Het is wel de dag van de Compute Kaarten :) Dit is dan wat Larra Bee had kunnen worden als dekstop kaart (wel een modernere refresh van larrabee maar dan nog)

Ik ben benieuwd hoe hij het doet tegen de K20 van nVidia en de S9000 en S10000 van AMD. Qua raw power is hij iets trager. Maar dat zegt niet altijd iets.

[Reactie gewijzigd door Astennu op 12 november 2012 22:09]

Yep, Vanavond is het openingsgala op supercomputing in Salt Lake City, (na de 2 dagen workshops die net gedaan zijn) hier zijn alle grote vendors aanwezig, vandaar dat vandaag vanalle vernieuwingen op het vlak van supercomputing bekend gemaakt worden.

De top 500 van supercomputing is ook net op hun site verschenen (vandaar de Titan update eerder vandaag) Deze wordt hier naar goede gewoonte elk jaar in november voorgesteld. (De update in july gebeurd in de europese versie van SC12, dat was dit jaar in hamburg)


bron:
Ik ben hier aanwezig.
deze kaart is voor zover ik heb gelezen geen (directe) concurrent voor de Tesla K20 van nvidia. Die zit echt in een hoger (hoogste) segment. maar is ook juist GPGPU en cuda. Net als de AMD die dan juist OpenCL is. Maar kwa kracht totaal andere klasse.

[Reactie gewijzigd door Jazco2nd op 13 november 2012 00:17]

Op dit item kan niet meer gereageerd worden.



HTC One (M9) Samsung Galaxy S6 Grand Theft Auto V Microsoft Windows 10 Apple iPad Air 2 FIFA 15 Motorola Nexus 6 Apple iPhone 6

© 1998 - 2015 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True