Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 19 reacties

AMD heeft twee nieuwe FireStream-videokaarten aangekondigd die bedoeld zijn voor servers en zakelijke workstations. De FireStream 9350 and 9370 zijn twee keer zo krachtig als hun voorgangers en verschijnen in het derde kwartaal.

Met de nieuwe FireStream-kaarten verdubbelt AMD het aantal double-precision flops dat een enkele videokaart kan uitvoeren in vergelijking met de vorige generatie FireStream-kaarten. Als het om single-precisionberekeningen gaat, kan de FireStream 9350 twee teraflops produceren; de double-precisiontopsnelheid bedraagt 400 Gflops. De videokaart beschikt verder over 2GB gddr5-geheugen en verbruikt 150W. De gpu wordt gekoeld door een single-slot koeler.

De FireStream 9370 is met een single-precisioncapaciteit van 2,64 Tflops en 528 double-precision Gflops een stuk krachtiger. Deze videokaart beschikt verder over 4GB gddr5-geheugen, waardoor ook het verbruik echter aanzienlijk hoger uitvalt: de 9370 heeft een tdp van 225W. Om de warmte af te voeren is deze videokaart uitgerust met een dual-slot koeler.

De videokaarten zullen vanaf het derde kwartaal te koop zijn, voor nog onbekende prijzen. Systeembouwers One Stop Systems en Supermicro hebben al servers met de nieuwe FireStream-kaarten aangekondigd.

Moderatie-faq Wijzig weergave

Reacties (19)

Deze kaarten zijn voornamelijk bedoeld voor Ati-Stream, de tegenhanger van CUDA van NVidia.
Om die reden hebben deze kaarten dus veel geheugen en extra veel shaders, want er moet naast het reguliere renderwerk, ook veel ruimte en rekenkracht overblijven voor het parallel kunnen berekenen van dirverse (complexe) algoritmes.

@hieronder, jazeker OpenCL is, zoals Zoijar al zegt, vergelijkbaar met CUDA. Echter is de ontwikkeling van OpenCL nog niet marktbreed geoptimaliseerd, waardoor de GPU-specifieke programmeertalen/frameworks dus nog beter en sneller zijn dan OpenCL.

[Reactie gewijzigd door Matis op 24 juni 2010 11:21]

Zou het ook werken met OpenCL en DirectCompute? Wat mij betreft wordt Stream en CUDA morgen gedumpt. Wat heb je nou aan een compiler die niet voor alle systemen compileert? Ik geloof niet zo in vendor specifieke API's.
CUDA performance is hoger dan die van OpenCL (wat niet zo vreemd is: abstractie laag minder). Zie ook: http://arxiv.org/abs/1005.2581 :

"In this paper we used a specific real-world application to compare the performance of
CUDA with NVIDIA’s implementation of OpenCL. Both programming interfaces have
similar functionality and porting the kernel code from one to the other needs minimal
changes when using NVIDIA’s development tools. Porting the rest of the GPU-related
code, including GPU setup and data transfer code, involves writing new code.
In our tests, CUDA performed better when transferring data to and from the GPU. We
did not see any considerable change in OpenCL’s relative data transfer performance as
more data were transferred. CUDA’s kernel execution was also consistently faster than
OpenCL’s, despite the two implementations running nearly identical code."
Ik zet daar toch serieuze vraagtekens bij. Er wordt getest met code die geschreven is voor CUDA, en daarna deels wordt gepoort naar OpenCL en deels opnieuw geschreven wordt. Er wordt getest op een GeForce kaart. Allicht dat er dan uit gaat komen dat CUDA sneller is - Nvidia zorgt daar wel voor, CUDA en de GPU zijn immers helemaal op elkaar afgestemd, terwijl OpenCL op elke moderne GPU moet werken.

Daarom heb ik moeite met de conclusie dat CUDA sneller is als OpenCL, je hebt immers geen data van de performance van CUDA op andere GPU's. Misschien zou op een Radeon OpenCL juist wel sneller zijn.
Dat zegt alleen maar dat de Nvidia implentatie van OpenCL langzamer is.
Het zegt helemaal niets over de prestatie op AMD.
Ik ken dat DWaveSys waar die onderzoekers voor werken niet, dus ik heb geen idee hoe onafhankelijk ze zijn. Er zijn wel vaker onderzoeken met een hoog WC-eend-gehalte geweest...
In this paper we used a specific real-world application to compare the performance of CUDA with NVIDIA’s implementation of OpenCL
Als ze het hebben over "a specific application" dan bedoelen ze "ONE specific application". Dus als ze willen is het relatief eenvoudig om zo'n onderzoek opzettelijk (of zelfs per ongeluk!) scheef te trekken.

[Reactie gewijzigd door robvanwijk op 24 juni 2010 22:01]

Uiteraard werkt het met OpenCL, want juist AMD zit OpenCL te pushen.

Je had natuurlijk ook even op het linkje naar AMD kunnen klikken waar dat ook zwart op wit staat...
Met Hyper-V (SP1) en Windows 7 (SP1) wordt het mogelijk om een ťchte desktop-experience te krijgen op je server (RDP). Volgens zeggen is het kijken van streaming video en zelfs gaming geen probleem. Dit wordt deels gedaan door visuele data op de cliŽnt te renderen, maar ook door gebruik te maken van videokracht in de server zelf.

Zijn dit ook kaarten die daarvoor geschikt zijn?
hoewel deze kaarten technisch gezien ook kunnen renderen, zijn ze er minder voor geschikt dan hun Radeon tegenhangers. Deze kaarten zijn meer bedoeld voor GPGPU toepassingen waar rauwe rekenkracht belangrijker is.
Ik denk dat je zulke hardware pas koopt als professionele gebruiker als je zeker bent dat je al in gebruik zijnde of geplande software er optimaal mee overweg kan.
Als CS5 thuis gebruiker met weinig geduld zal wel voor een nvidea kaart gaan
Dit zijn dus de professionele versies van de Radeon HD58XX series?
Yep en ik denk dat ze door het grote hoeveelheid geheugen volgens mij iets unieks proberen toe te voegen aan deze kaarten. En ik denk dat je het geheugen wel nodig hebt bij renderen of andere soort zaken.
Ja. Als je gaat renderen is meer geheugen op je videokaart een pre. Hoewel bij renderen je CPU ook nog snel een bottleneck kan vormen, maar als je zo'n kaart in je pc hebt hangen zit er waarschijnlijk ook een prima processor in.
De FirePro-kaarten zijn de professionele versies die je in een 'normale' desktop gebruikt. De FireStream-kaarten zijn meer bedoeld voor servers en workstations die veel parralelle computing doen. Stel je een programma als matlab voor of zo (dat nu volgens mij enkel CUDA gebruikt) maar ook servers die 'cloud computing' mogelijk maken.
Of als je lekker wilt 3ds maxen en je maakt schrek 4 of iets in die richting.

Waarom worden de clocksnelheden en de rest van de specs niet getoont?
Want die TFLOP snelheden moeten weer met een correltje zout worden genomen.
Waarom worden de clocksnelheden en de rest van de specs niet getoont?
Want die TFLOP snelheden moeten weer met een correltje zout worden genomen.
Toegegeven, TFLOPs worden (nagenoeg) altijd gegeven volgens een best-case scenario, maar in elk geval is het een echte maat. Als een kaart twee keer zoveel TFLOPs haalt als een andere kaart (en dan bedoel ik daadwerkelijk halen, niet in theorie) dan is ie ook twee keer zo snel.
De kloksnelheden zeggen al tien jaar niks meer; tot ongeveer de 486 kon je nog kloksnelheden vergelijken en dan ongeveer een idee hebben welk product sneller was en zelfs een indicatie hoeveel sneller ongeveer. Maar als je een i7 en een Phenom II (of een nVidia en een ATI videokaart) gaat vergelijken door alleen naar de MHzen te kijken dan sla je de plank echt hard mis. Binnen dezelfde architectuur (dus bijvoorbeeld twee ATI 5xxx kaarten) kun je er nog een klein beetje iets mee, maar zelfs dan alleen als het de bottleneck is.
Nee, geef mij maar "performance specs" zoals GFLOPs, daar heb je meer (maar inderdaad nog steeds niet alles) aan dan "GHz specs".
Zit daar niet vaak een andere BIOS in die speciaal voor dit soort werkzaamheden is verbeterd. Dit soort kaarten hebben meestal een slechtere game preformance dan de normale modellen.
dingen die in OpenCL geschreven zijn kunnen zowel nVidia als ATI kaarten gebruiken voor GPGPU.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True