Intel heeft tijdens de International Supercomputing Conference 2012 in Hamburg zijn nieuwste productlijn aangekondigd. De Xeon Phi-serie processors moeten in de nabije toekomst de drijvende kracht van supercomputers worden.
Het Xeon Phi-merk werd maandag door Rajeb Hazra, Intels nieuwe topman van de Architecture Group, formeel geïntroduceerd. Het eerste product onder de nieuwe vlag is de Xeon Phi Coprocessor, een 'videokaart' met Xeon-technologie aan boord. Intel geeft geen details over de hardware, maar bevestigt dat de gpgpu-kaart over meer dan vijftig cores beschikt. Die cores zijn, anders dan Nvidia's Tesla-gpgpu's waarmee Knights Corner concurreert, compatibel met x86-code. Dat zou programmeren eenvoudig moeten maken. De coprocessors worden volgens hetzelfde 22nm-procedé met trigate-transistors als Ivy Bridge geproduceerd.
Een enkele Knights Corner-kaart zou al ruim een teraflops scoren in Linpack-benchmarks. De eerste experimentele supercomputer met de nieuwe coprocessor is al doorgedrongen in de supercomputer-top 500, waarvan een nieuwe lijst eveneens maandag werd gepubliceerd. Die Discovery-computer maakt gebruik van nodes waarin een enkele Knights Corner-kaart samenwerkt met twee Xeon E5-processors, om gezamenlijk 118tflops te halen. De computer is nog niet getweaked, zo benadrukt Intel, zodat de prestaties op termijn verbeterd kunnen worden. Het totaal aantal Xeon E5-2670-cores bedraagt 9800 stuks.
De coprocessor, die als pci-express-kaart met x8-interface beschikbaar komt, moet voor het eind van het jaar beschikbaar zijn. Knights Corner moet het dan opnemen tegen Nvidia's K20, met Kepler-architectuur. Knights Corner zal verkrijgbaar zijn als passief gekoelde kaart, waarbij de server voor de benodigde koeling zorgt, of als actief gekoelde kaart. De kaart heeft 8GB gddr5-geheugen aan boord.
Diverse fabrikanten hebben aangekondigd systemen met de Xeon Phi Coprocessor op de markt te zullen brengen. Onder meer HP, Dell en Acer brengen servers met Knights Corner uit. Ook Cray, fabrikant van snelle interconnects voor supercomputers, ondersteunt de nieuwe producten.
[Reactie gewijzigd door Astennu op dinsdag 19 juni 2012 08:34]
[Reactie gewijzigd door player-x op dinsdag 19 juni 2012 10:15]
Inderdaad, ik vermoed ook dat er een verregaande integratie zal plaatsvinden op een gegeven moment. Het grootste probleem wat je nu met dit soort systemen hebt namelijk is dat het zijn eigen geheugen heeft en je dus moet zorgen dat de data daar in aanwezig is voordat je kan rekenen, en je moet ook de resultaten weer terug krijgen. Het is voor de hand liggend dat dit geintegreerd zal worden binnen in toekomstige CPUs.Denk ook dat net als zoals nu AMD zijn GPGPU onderdelen in de CPU verwerkt, Intel deze Larrabee 3.0 techniek ook deels zal gaan verwerken in zijn CPUs.
Dat hangt er helemaal vanaf hoe goed het alternatief is. Ik heb er zelf geen ervaring mee, maar hoor vaak dat CUDA veel fijner en makkelijker is om mee te werken dan OpenCL. Mocht dat inderdaad zo zijn (en zo blijven) dan lijkt het me te vroeg om CUDA nu al af te schrijven. Ga maar na, iedereen legt zich neer bij de (halve) vendor lock-in van x86, gewoon omdat het alternatief (zoals ARM; dat is weliswaar niet "open", maar ARM-licenties zijn zachtgezegd "aanzienlijk makkelijker" te krijgen dan x86-licenties) totaal niet competitief is.Waarom ik denk dat CUDA zal verdwijnen is dat bedrijven geen verschillende programmeertalen willen gebruiken, en zeker niet een vendor lock-in willen zo als dat nu met CUDA is.
Bron: http://www.streamcomputin...l-vs-cuda-misconceptions/Conclusion
You might be completely missing the differences in the API. There are language-differences between CUDA 4.0, OpenCL 1.0 and OpenCL 1.1, but I will give an overview of differences later (will be linked from here). Also enough to tell on how to port your CUDA-software to OpenCL.
My verdict:
CUDA
+ is marketed better.
+ has developer-support in one package.
+ has more built-in functions and features.
- only works on GPUs of NVIDIA.
OpenCL
+ has support for many processors.
+ is a completely open standard.
- Only AMD’s and NVIDIA’s OpenCL-drivers are mature – Intel and IBM expected soon to mature their drivers.
- is supplied by many vendors, not provided as one packet or centrally orchestrated.
I hope you found that OpenCL is not a cute alternative to CUDA, but an equal standard which offers more potential. I also pointed out that OpenCL has to do some catch-up, but that will all happen this year.
[Reactie gewijzigd door player-x op dinsdag 19 juni 2012 12:48]
Was het maar zo! Maar nee, helaas is dat echt niet waar. Ten eerste heb je al een probleem met je yields als je grotere chips gaat bakken. Hoe groter je chip namelijk is, hoe groter de kans op een productiefout, en dus groter de kans dat hij het niet goed doet. Stel dat je op een wafer een bepaalde kans hebt per vierkante cm dat er een fout optreed in het proces, bijvoorbeeld omdat je je materiaal niet 100% puur krijgt. Als je dan een wafer volstempelt met een hele berg kleine chips, dan zullen er een aantal het niet doen maar voldoende zullen prima zijn. Stel een andere extreme voor; je maakt een chip zo groot als de hele wafer, dan heb je een zeer grote kans dat je hele chip niet werkt. Er is dus qua productietechnologie een vrij goeie reden om de chips niet al te groot te laten worden. De experimentele Intel SCC chip was bijvoorbeeld vrij groot, 1.3 miljard transistors op 567 mm2. Het resultaat, een slechte yield: meer dan de helft van de chips die ze gebakken hebben voor dit project bleken niet te werken.Het maakt letterlijk geen moer uit of deze chips 100mm2 of 1000mm2 zijn.
Zolang de chips niet meer dan $500 per stuk kosten, zijn de productie kosten van min of meer niet van toepassing bij een speciaal product als deze.Tesla kaarten beginnen van ¤ 2000 tot wel ¤ +5000, met zulke prijzen zijn de kosten van het silicium verwaarloosbaar, en ik neem aan dat Intel vergelijkbare prijzen zal hanteren.
[Reactie gewijzigd door player-x op dinsdag 19 juni 2012 16:04]
Het is net zo iets als een bedrijfspand, waar je maar een deel van het vloer oppervlakte van gebruikt.Als de helft niet mee doet, hoe kunnen ze dan gelijk zijn, vraag ik mij af?
[Reactie gewijzigd door player-x op woensdag 20 juni 2012 09:07]
Men heeft de P54C alleen gebruikt als grove blauwdruk, van zo groot en niet groter.with Intel confirming that it is indeed using an enhanced Pentium 1 (P54C) core with the addition of vector and FP64 hardware. Intel has also confirmed that Xeon Phi will offer 512-bit SIMD operations, which means we’re almost certainly looking at a 16-wide vector ALU in each core, the same kind of vector unit that Larrabee was detailed to have.
[Reactie gewijzigd door player-x op dinsdag 19 juni 2012 16:05]
Nee je bent in de war met de Intel Teraflops research chip uit 2007, dat was dat 80 core prototype. Die had een compleet andere architectuur dan de Larrabee/MIC chips die nu hier gebruikt worden. De Teraflops research chip had een 80-tile mesh netwerk met simpele ALUs die geen complete x86 cores waren. In 2009 werd deze chip opgevolgd door de Intel SCC, een 48-core chip met een verbeterde versie van het zelfde mesh netwerk maar die wel simpele 32-bit Pentium 1 (P54C) cores. Die leek meer op de Larrabee/MIC chips maar er zijn nog steeds zeer grote verschillen; zo is de Larrabee/MIC 64bits, heeft een ring netwerk ipv een mesh, en heeft deze wel cache coherent shared memory.Deze many core architectuur is ongeveer het geen de knight corner samples met 80 cores waren die ze een jaar of twee geleden zo af en toe lieten zien.
Volgens mij valt de grootte van een x86 core nog best mee, als je kijkt naar bepaalde single-core Pentium M modellen dan was maar 10% van het chip oppervlak de core en de rest was voornamelijk de L2 cache. De cores die ze gebruiken in de Larrabee/MIC chips zijn ook nog een stuk simpeler, ze zullen meer op de Pentium 1 (P54C) cores lijken met een in-order pipeline. Dat scheelt een boel logica in je chip als je geen complexe out-of-order execution engine hoeft te hebben. Maar deze cores zijn wel verder uitgebreid, ze ondersteunden 64 bits en hebben een extra brede vector unit toegevoegd, als ik het artikel op Anandtech moet geloven;Ik vermoed alleen dat deze chip een flinke plak zal zijn 50 cores is niet niets je moet communiceren met elkaar en met het geheugen en natuurlijk wil je ook nog eens andere dingen doen zo als signalen met de PCI-e interface communiceren en zo dat neemt nog al wat ruimte in en een x86 zelf is nu ook weer niet echt klein.
[Reactie gewijzigd door Squee op dinsdag 19 juni 2012 12:42]
Dus ja, dat zou op een "normaal" moederbord geprikt moeten kunnen worden.De coprocessor, die als pci-express-kaart met x8-interface beschikbaar komt
Op dit item kan niet meer gereageerd worden.
Populair: Tablets Samsung Websites en communities Mobiele telefoons Google Apple Microsoft Sony Games Politiek en recht
© 1998 - 2013 Tweakers.net B.V. Contact Over Tweakers Jouw privacy Algemene voorwaarden Cookies
Tweakers wordt uitgegeven door De Persgroep en wordt gehost door True