Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 37 reacties
Bron: ClearSpeed, submitter: T.T.

ClearSpeed blaast met zijn nieuwe CS301 een oud concept nieuw leven in: de coprocessor. De 'Multi-Threaded Array Processor' heeft een maximale capaciteit van maar liefst 25,6 GFLOPS of 12.800 MIPS. De chip is gebaseerd op brute kracht met behulp van relatief simpele elementen: kleine blokjes met een tweetal FPU's, 4KB cache en twee verbindingen met het ClearConnect-netwerk. Dit on-chip datapad heeft een capaciteit van 51,6GB/s en er hangen in totaal 64 cores aan die allemaal niets anders kunnen dan rauwe data verwerken. Voor het algemene regel- en rekenwerk is dus nog steeds een volwaardige CPU nodig, maar voor specifieke toepassingen waarbij alleen cijfers uitgekauwd moeten worden kan de chip volgens het bedrijf een uitkomst bieden.

Het product is verrassend zuinig met energie: op 200MHz wordt slechts 2 Watt gebruikt. De chip kan zelfstandig werken binnen een embedded systeem, maar kan net zo makkelijk geïntegreerd worden in een standaard x86-computer. Daarnaast kunnen meerdere chips aan elkaar gekoppeld worden voor nog meer capaciteit. Software kan met behulp van de meegeleverde SDK (om)gebouwd worden om gebruik te maken van de coprocessor. Volgens ClearSpeed kunnen met name wetenschappelijke applicaties die nu vertrouwen op clusters of supercomputers er enorm voordeel van hebben, maar er zijn legio toepassingen te bedenken. Er zouden al verschillende fabrikanten interesse hebben getoond in de techniek, maar concrete beloftes over toepassingen worden niet gedaan:

The CS301 can serve either as a co-processor alongside an Intel or AMD CPU within a high performance workstation, blade server or cluster configuration, or as a standalone processor for embedded DSP applications like radar pulse compression or image processing. In applications where the CS301 is acting as a co-processor, dynamic libraries offload an application's inner loops to the CS301. Although these inner loops only make up a small portion of the source code, these loops are responsible for the vast majority of the application's running time. By offloading the inner loops, the CS301 can bypass the traditional bottleneck caused by a CPU's limited mathematical capability, executing the core of the application more than twice as fast as anything else in the marketplace.
ClearSpeed CS301
Moderatie-faq Wijzig weergave

Reacties (37)

maar kan net zo makkelijk geïntegreerd worden in een standaard x86-computer.
Hoe moet ik me dit voorstellen? Op een extra insteekkaartje? Geïntegreerd op het mobo? :?
Naast PCI kaartjes hebben ze het in dit artikel hebben ze het zelfs over PCMCIA kaartjes voor laptops. Over de bandbreedte van de PCI bus hoef je je denk ik weinig zorgen te maken. Als er gebruik wordt gemaakt van een soort distributed computing systeem hoeven er maar kleine pakketjes verzonden te worden terwijl de data die berekend wordt toch groot is.
ClearSpeed said the new chip is also very low-power, operating at about 2 watts, which would allow it to run off a laptop battery and wouldn't require special cooling.

"At 3 watts, you could put it in a PCMCIA card," said McIntosh-Smith. "With two chips on a PC Card, you can have 50 gigaflops on a laptop, running off a battery. That's equivalent to a small Linux cluster on your notebook."

McIntosh-Smith said that down the line, a PC Card with a pair of second-generation chips would perform at about 200 gigaflops, which is equivalent to a big Linux cluster and would nearly qualify the laptop for today's Top 500 supercomputers list.
Lijkt me wel leuk om te zien wie het eerste zijn lapdoosje in de lijst van 500 supercomputers krijgt. :Y)

Jammer eigenlijk van de prijs in dat zelfde artikel hebben ze het over een prijs van $25.000 dus dat ligt toch een stukje boven het budget. Maar voor bedrijven is dit wel heel interessant. iig stukken goedkoper dan een cluster zaal.
Naast PCI kaartjes hebben ze het in dit artikel hebben ze het zelfs over PCMCIA kaartjes voor laptops. Over de bandbreedte van de PCI bus hoef je je denk ik weinig zorgen te maken.
Dat zegt niet zoveel, er zijn ook externe 100Mbit/seconde netwerkkaartjes met alleen een USB1`aansluiting.
Beide is mogelijk lijkt me, maar het zal hoe dan ook niet standaard PCI zijn, dat is lang niet snel genoeg om dit ding van genoeg data te voorzien om 'm bezig te houden. PCI Express x8 of iets dergelijks zou wel kunnen.
Heb het gelezen in een krant. Zij spreken ervan het te kunnen gebruiken als co-processor en desnoods via PCI-kaarten te implementeren.
Ze maakten uit dat als je je 6-PCI sloten vult, met op al die kaartjes het maximaal aantal dat de chip hier toelaat, en je (uiteraard) systeem kan hier mee weg; dan mag jij trots zeggen dat jou systeem tot één van d e500 SNELSTE pc's ter wereld behoord !

Zou dat niet fijn zijn; Quake3 tegen 3500FPS te kunnen berekenen, maar maximaal 450FPS omdat je bandbreedte bij huidige systemen nogal 'schraal' uitvalt ;)
Heel interessant ding dit, maar ik ben wel benieuwd naar benchmarks die gebruik maken van dit ding

en natuurlijk is dit weer lekker voor de }:O
jah een athlon MP 2800+ heeft 'maar' een piek van 4,5 Gflops.

En dan is dat niet eens voor berekeningen alleen, dus dan zou je }:O, 5,7X Tot 10?-12?X zo snel kunnen zijn :9~
"Voor het algemene regel- en rekenwerk is dus nog steeds een volwaardige CPU nodig, maar voor specifieke toepassingen waarbij alleen cijfers uitgekauwd moeten worden kan de chip volgens het bedrijf een uitkomst bieden. "

Ik snap het niet.. wat doet dat ding nu precies? Een coprocessor werd vroeger altijd gebruikt om berekeningen te maken.. Deze kan niet eens algemeen regel en rekenwerk doen aar zou toch een serieuze hulp zijn computerclusters en supercomputers?!
Voor een aantal toepassingen heb je een berg invoer data die verwerkt moet worden naar de gewenste uitvoer.
Dat is dan vaak per blokje data heel vaak dezelfde bewerkingen achter elkaar.
Bijv het comprimeren van video of een 3D-FFT berekenen van een hoop MRI-data om een 3d plaatje te kunnen maken van een persoon in de MRI-scanner.
Het geen de PC dan alleen maar hoeft te doen is de data aan de coprocessor aan te leveren en de uitvoer van die processor op het beeldscherm te tonen.
Zo'n coprocessor is voor dat soort berekeningen een stuk sneller dan een complexe P4. Mede ook omdat een ander stukje van die coprocessor tegelijk ook kan rekenen.
Software kan met behulp van de meegeleverde SDK (om)gebouwd worden om gebruik te maken van de coprocessor.
Ik denk niet dat we dit op grote schaal in onze pctjes gaan tegenkomen omdat er aanpassingen gedaan moeten worden aan applicaties..

Wellicht als AMD & Intel gezamenlijk deze coproc zouden implementeren dat er ondersteuning komt, maar ik zie eerder Intel verder ontwikkelen aan SSE, wat eigenlijk net zoiets als dit produkt is..

Denk dat voor gespecialiseerde toepassingen met maat soft en hardware er wel een marktje is..
krijg je met deze coprosessor ook zon boost als met mijn 486sx33 naar een 486dx33 ???
het ziet er allemaal wel leuk uit, maar zou iemand mij kunnen uitleggen wat GFLOPS en MIPS zijn?
MIPS
The number of MIPS (million instructions per second) is a general measure of computing performance and, by implication, the amount of work a larger computer can do.

GFLOP
As a measure of computer speed, a gigaflop is a billion floating-point operations per second

FLOP
In computers, FLOPS are floating-point operations per second. Floating-point is, according to IBM, "a method of encoding real numbers within the limits of finite precision available on computers."
en voor de duidelijkheid een floating point is dus een getal met cijfers achter de koma.
En voor nog meer duidelijkheid een floating-point (drijvende comma) hoeft niet precee cijfers achter de comma te hebben, maar het houdt in dat de positie van de comma variabel is (aangegeven door b.v. een exponent (X tot de macht +/-10)) en de precisie dus min of meer altijd gelijk is onafhankelijk van de grootte van het getal.
GFLOPS = Giga (miljard) FLOating Point operations per Second

MIPS = Milion Instructions Per Second
De meest geschikte uitleg van MIPS vind ik nog altijd Meaningless Indication of Processor Speed
de aanduiding MIPS zegt meer dan bijvoorbeeld de kloksnelheid van de processor, dus dat Meaningless slaat nergens op hoor
De top 500 supercomputers van de wereld worden mbv GFlops gerangschikt.
www.top500.org
(nr 1. 35860.00 GFlops)
(nr 500. 245.10 GFlops)

Lijkt me dan sterk dat dit nergens op gebaseerd zou zijn. GFlops zeggen inderdaad weinig over 3d performance of frame rates, maar soms is dat gewoon niet belangrijk.

\[edit: type fout]
soms?

soms is frame rates belangrijk, in de andere 99,9% van de gevallen is brute rekenkracht van belang ;)
Ik ben het met je eens dat Flops een nuttige eenheid is, maar hier staat het _theoretisch_ maximum Flops, en mijn mening is dat dat juist weinig zegt. Die getallen die jij quote zullen reeel haalbare aantallen zijn, en die liggen meestal (veel) lager dan het theoretisch maximum, omdat dit afhangt van geheugenbandwidth en noem maar op...
De benchmarks die gebruikt worden voor de top500 doen meestal tussen de 50 en 70 procent v an theoretisch maximum. Als je gaat kijken in die top500 zie je in de tabelletjes ook zowel de benchmarks als de theoretische max, en dat ligt bij vrijwel iedere architectuur in die regio.
Ik ben dit niet met je eens, met MHz weet je, zeker als je iets over de architectuur weet, ongeveer in welke performance ballpark je zit. Het is namelijk zo dat de meeste code bestaat uit van elkaar afhankelijke instructies, zodat er maar één instructie tegelijkertijd uitgevoerd kan worden. Oftewel, het aantal MHz geeft zeker wel een belangrijke indicatie van de te verwachten performance (natuurlijk is MHz alleen niet zaligmakend, kijk maar naar AXP vs P4).

Een getal als het aantal MIPS of GFlops daarentegen zegt echt helemaal niets over standaardsituaties, die theoretische getallen haal je alleen maar in synthetische tests (en dan meestal nog bij lange na niet).

Vergelijk bijvoorbeeld de PS2 specs:
"...A 128-bit central processor, to be called the 'Emotion Engine', running at 300MHz with a 16KB cache. For real tech fans, there will also be a FPU running at 6.2G Flops - for those who don't understand, this will basically make it faster at certain mathematical operations!..."

UPDATE:
Kijk dan vooral ook naar de (ongeinformeerde) conclusies uit deze specs:
"The specifications currently being touted are very impressive to say the least! The chipset seems much more advanced than current high-end PC technology and should outperform Sega's Dreamcast quite noticeably. Sony are touting the new system as being several times more powerful than Intel's new Pentium III technology and some have claimed that it may be able to handle up to fifty times more 3D image data than the Dreamcast (although this may be an exaggeration, and a figure of nine times the performance of Dreamcast seems more realistic.)"
Interested in buying a few of these to speed up your Folding@home programs? Well I got some bad news, ClearSpeed only plans to sell these within next few months to research companies and universities for a price of $16,500 :z
Wat ik inderdaad wel heel logisch vind, want als iedereen dit kan kopen, hebben we op zeer korte termijn problemen met huidige encryptie-technieken. Want als dir daadwerkelijk veel harder number-crunched, zijn inderdaad de }:O koetjes interessant om "even" een paar sleutels te kraken.
Preices! Want iedereen weet dat juist de studenten op universiteiten nooit iets proberen te kraken ;)
Is die brute rekenkracht ook goed voor het renderen van 3D beelden / ani's?

Zo ja... }>
Jazeker. Vooral raytracers (POVRay en dergelijke) zijn floating point number crunchers van het Zuiverste soort. Dat soort software moet veel delen en wortel trekken, wat op een x86 errug traag is.
Geloof maar dat er meer coprocessoren gaan volgen.
ClearSpeed is nu weer de eerste, maar niet voor lang.

Ik voorspel dat er binnekort meerdere bedrijven met een coprocessor aan komen zetten. Voor een wél-betaalbare-prijs.

Geloof maar dat het zal aanslaan bij menig tweaker :)
Bijv. om je 3Dmax filmpjes te renderen ?

edit: typo
Eerste??

Volgens mij wordt dit al gedaan sinds de eerste x86 en waarschijnlijk al wel eerder hoor.

En of er veel zullen volgen weet ik niet aangezien het redelijk bewerkelijk is om dit goed op een mobo te implementeren als er niet veel interesse is.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True