AMD demonstreert 'Teraflop In A Box'

AMD heeft tijdens een persconferentie in San Francisco een machine gedemonsteerd die meer dan een teraflop aan rekenkracht levert. De Opteron-machine is volgens de processorfabrikant tien maal zo krachtig als hedendaagse high-end servers.

'Antieke' teraflopmachine (2002) De getoonde 'Teraflop In A Box'-machine beschikte over een enkele dualcore Opteron en twee R600-gpu's. Hoewel deze Opteron naar verluidt over de nieuwe en krachtige Barcelona-cores beschikt, zullen het vooral de twee R600-stream processors zijn die het aantal bewerkingen per seconde tot recordhoogte opschroeven. Het gebruik van een gpu als coprocessor voor niet-grafische doeleinden wordt bij zowel AMD/ATi als nVidia uiterst serieus genomen; met de AMD Stream introduceerde dit bedrijf eind vorig jaar al een R580-variant waaruit 360 gigaflops geperst konden worden. De R600 moet het uiteraard nog wat beter doen, al was de ontwikkeling problematisch en beleefde de nieuwe chip enkele malen uitstel - grafische kaarten met de nieuwe krachtpatser aan boord worden momenteel niet eerder dan 'in het tweede kwartaal' van dit jaar verwacht.

AMD-topman Dave Orton liet weten dat met de demonstratie werd aangetoond 'dat het nieuwe AMD het industrielandschap ingrijpend wijzigt.' Wie behoefte aan teraflopcapaciteit heeft is nu nog aangewezen op supercomputers, stelde hij, maar met deze teraflopmachine zet AMD straks een geduchte concurrent voor dergelijke machines op de markt. De nieuwe machine, die in eerste instantie met name bedoeld is voor wetenschappelijke en industriële doeleinden, is daarom een 'mijlpaal' in AMD's Accelerated Computing-plannen. De thuisgebruiker die niet opziet tegen een extra kachel krijgt met producten als de Radeon X2800XTX dan ook niet zomaar een videokaartje in huis: het lijkt er sterk op dat AMD de prestaties van de Core 2-chips niet alleen met cpu-verbeteringen wil bestrijden, maar de aanval op alle fronten zal openen.

Door René Wichers

Eindredacteur

01-03-2007 • 13:24

44

Submitter: Astennu

Bron: AMD

Lees meer

ATi R600 is monsterkaart
ATi R600 is monsterkaart Nieuws van 9 februari 2007
ATi R600 wordt Radeon X2x00-serie
ATi R600 wordt Radeon X2x00-serie Nieuws van 18 januari 2007
'Productie R600 verloopt moeizaam'
'Productie R600 verloopt moeizaam' Nieuws van 11 januari 2007
Eerste foto's ATi R600 gepubliceerd
Eerste foto's ATi R600 gepubliceerd Nieuws van 26 november 2006
'ATi's R600 verstookt 250W'
'ATi's R600 verstookt 250W' Nieuws van 18 september 2006
ATi's R600 en nVidia's G80 vertraagd
ATi's R600 en nVidia's G80 vertraagd Nieuws van 14 september 2006

Reacties (44)

44
43
18
9
1
16
Wijzig sortering
Als nVidia en ATi de markt voor "serieuze" toepassingen echt willen veroveren doen ze er goed aan om IEEE double precision floating point eindelijk goed te ondersteunen. Single precision met hier en daar wat slordigheden in randgevallen (zie http://www.gpgpu.org/sc20...p/Apple_GPUintrinsics.pdf) is genoeg voor DOOM etc, maar voor de meeste wetenschappelijke toepassingen komt het nog wat tekort.
komt eind 2007, begin 2008 maar bij het gebruik van DP zal het aantal flops gevoelig zakken (denk, 3-4x minder tov SP)
Nvidia 8800 serie GPU's ondersteunen double precision floating point.
Nee, niet echt. De CUDA programeertaal ondersteunt wel DP, maar op de G80 chips worden ze gedegradeerd naar SP.
Oja sorry pas eind 2007 is de verwachting,
Nvidia FAQ quote:
NVIDIA GPUs supporting double precision in hardware will become available in late 2007
Als de GPU's sneller zijn dan de CPU waarom baseren ze dan geen CPU op de GPU cores?
Welke features van de CPU maken het dat de GPU meer FLOPS kan maken?
Kan je een OS draaien op een GPU?

Nee doe mij maar een 2900XTX en geen Quadcore CPU want die GPU is toch sneller!
Anoniem: 207146 @cyctech1 maart 2007 15:27
Flops = floating point operations per second. Je moet dus gewoon goed kunnen rekenen met floating points om veel flops te halen.
Dingen zoals geheugen toegang, integer performance en branching worden daarbij buiten beschouwing gelaten, en dit zijn nu net de punten waarmee je cpu nu het drukst mee bezig is.
Het was allang al duidelijk dat AMD 5 Miljard dollar niet voor een 3D chip bedrijf uit zou geven omdat ze zulke leuke videokaarten mee kunnen maken.

Blijkbaar zit de toekomst in de grafische chips wat betreft pure rekencapaciteit.

Maar ook mogelijkheden om nieuwe platformen te creeeren in de laptop en Home entertainment markt.

Vergeet niet dat de Xbox 360 en de Wii AMD chips bezitten.

Dus AMD is voorlopig financieel gezien wel "binnen" :)
Dat is maar de vraag,
op dit moment hebben we al twee dode mussen,
ten eerste het 64bit verhaal,
dat loopt al een hele tijd, maar wil nou niet bepaald van de grond komen.
Het andere verhaal gaat over duo of zelfs vier cores. Deze lopen al een tijd en de software maakt er niet echt gebruik van. Misschien dat deze boxes hun nut zullen vinden in de bedrijfswereld,
maar op consumentenschaal en/of werkplekken in bedrijven hebben er nog maar weinig aan. De killeraplicatie die gebruik zal maken van eerdergenoemde functies moet ik nog tegenkomen. Het is elke keer weer te specifiek waardoor het grote publiek niet wordt bereikt.

Als nou blijkt dat morgen een vb spraakherkenningssoftware dat voor 99,99% werkt, die eist dat je minstens 64bit windows en dualcore nodig hebt, dan zie ik de mensen naar winkels gaan om hun PC te vervangen, nu voorlopig nog niet.
64 bit zal vanzelf van de grond komen. Ik zit nu al met 2 GB ram in mijn pc, en vind dit al geen luxe meer. Dan loop je binnenkort vanzelf tegen de 4GB limiet van 32 bit aan. het is zelfs zo dat als je effectief 4GB wilt gebruiken je al 64 bit nodig hebt, anders krijg je er maar 3,6 te zien dacht ik.

Wat bedreft dual core, voor iemand die zijn pc gebruikt als werkinstrument is het wel degelijk handig. De tweede core wordt wel niet constant 100% gebruikt, maar als de ene bezig is, hou je nog de andere over, waardoor je OS nog vlot reageert
Anoniem: 64607 @losealot1 maart 2007 14:34
@losealot

Er zit toch wel verschil in 'adress-lijnen' en 'data-lijnen' en 'registers'. Vroeger had je bijv. de MC 68000, intern met 32 bits registers, naar buiten to 16 data-lijnen en 24 adress-lijnen. Als 4GB de absolute grens was geweest in een PC voor alles dan hadden we nu al lang problemen met HDs groter dan 4 GB...
@ DikkeDouwe
Het gaat dan ook om werkgeheugen en niet om je harde schijf.
Wat maakt het nou uit als de 'software' er niet voor geschreven is, het is mooi meegenomen maar echt niet noodzakelijk. Windows verdeelt de verschillende applicaties zelf wel over de verschillende cores. En aangezien bijna iedereen wel multitasked heeft bijna iedereen er wel baat bij.


BV. Winamp, virusscan en andere achtergrondprogsels op core 1 en Photoshop ofzo op core 2.

Daarnaast zijn er bij intel de laatste tijd meer multicores verkocht dan singlecores.
Anoniem: 97275 @ZpAz1 maart 2007 20:18
Virusscan :Z

Neptweaker ;)
op dit moment hebben we al twee dode mussen,
ten eerste het 64bit verhaal,
dat loopt al een hele tijd, maar wil nou niet bepaald van de grond komen.
Het andere verhaal gaat over duo of zelfs vier cores. Deze lopen al een tijd en de software maakt er niet echt gebruik van.
64bit komt met vista van de grond want daar word het pas echt goed gebruikt. (en hiervoor al lang in linux natuurlijk)

en 2 cores zie je steeds meer gebruikt worden zo langzaam aan.
64bits software is alleen op de desktop nog niet van de grond...wij draaien al een behoorlijke tijd al onze servers op 64bits linux met alle services erop.
@Iblies:
ten eerste het 64bit verhaal,
dat loopt al een hele tijd, maar wil nou niet bepaald van de grond komen.
Voor consumenten-PC's heb je hier helemaal gelijk maar in workstations en servers heeft 64-bit toch al z'n nut bewezen.
Het andere verhaal gaat over duo of zelfs vier cores. Deze lopen al een tijd en de software maakt er niet echt gebruik van.
Dat er niet veel applicaties zijn die multithreaden wil niet zeggen dat je niets aan multicore hebt. Tel zelf eens hoeveel applicaties je open hebt. (Ik heb er 60) De meeste echte CPU-vreters die ik heb zijn ook multithreaded.
Ik dacht dat ibm de cpu's voor wii x360 en ps3 maakte, ik kan me vergissen.
xbox 360 een Custom IBM PowerPC CPU.
ps3 IBM cell cpu.
IBM Broadway-cpu's voor de Nintendo Wii .....
ATI is nu ook AMD, de cpu's zijn van IBM (of afgeleide daarvan?) maar de gpu's zijn AMD/ATI.
processor, Darm-man heeft het ook opver de overname van ATI...
Nu zit er dus een ati (=amd) videokaart in die 2 genoemde apparaten.
Of het bedrijf daarvan binnenloopt weet ik niet.
Dit geeft al aan waarom Intel opeens weer werk maakt van het ontwikkelen van een serieuze graphics chip! Ook zij hebben de mogelijkheden gezien van de GPU en aangezien AMD al bezig was met ATi over te nemen en nVidia buiten bereik lag (vermoed ik, de reden weet ik echter niet) zijn ze dus begonnen met mensen aan te trekken die een serieuze poging kunnen doen om een concurrerende GPU te maken t.o.v. die van ATi en nVidia.
Aan grafische chips is niets nieuws en dit zal zeker niet de rede zijn voor de overname van ati door amd.

Het klinkt allemaal heel leuk maar de praktijk is anders.

Even een klein voorbeeld de cell cpu heeft ook een aantal snelle rekeneenheden voor specifieke taken. Lees webwereld er op na en zie wat voor een problemen men heeft om daar software voor te maken die maximaal gebruikt maakt van die mogenlijkheden.

Intel is ook met vergelijkbare chips bezig voor meerdere taken.

Het grootste probleem zal software zijn die gebruik kan makem van de mogenlijkheden. Het is nu al moeilijk om software geschikt te maken die het maximale uit quad cores of meer halen. Met deze gpu's praaqt je over 128 cores die aangestuurt moeten worden, ga daarmee maar eens aan de slag.

Voordat deze techniek werkt ben je al een stuk verder, daarbij kun je het alleen voor specifieke rekentaken gebruiken.
Anoniem: 128222 @Dark_man2 maart 2007 07:57
De WII CPU:
PowerPC CPU (codenaam 'Broadway'). Gemaakt volgens een 90 nm SOI CMOS-proces, ontwikkeld en geproduceerd in samenwerking met IBM.

De Xbox360:
Op IBM PowerPC gebaseerde processoren. De XBox 360 heeft 1 processor met drie cores, iedere core heeft 2 hardware threads, wat dus op 6 hardware threads neerkomt.
Samengevat

Processor Core Spec 3 Cores, 2 hardware threads per core
1MB Level 2 Cache
Processor Custom IBM PowerPC CPU
Custom IBM PowerPC Processor
1 Megabyte Level 2 Cache
3.2 Ghz
Marketing Performance Measurement 1 Teraflop


Xbox360 en WII ( en Gube ) Bevatten enkel ATI GPU's en niet CPU's voor de duidelijkheid.
;) Maar idd ze zijn goed bezig en dit is nu allemaal uit het straatje van ATI ( de nieuwe geldt machine van AMD )
Anoniem: 207146 1 maart 2007 14:27
Dit is misschien leuk voor enkele niche markten waar men veel rekenkracht nodig heeft om problemen op te lossen die perfect te paralleliseren zijn op een GPU. Maar dit is nog lang geen bedreiging voor de klassieke cpu, daarvoor is de instructieset van een GPU te beperkt.

Teraflops zijn trouwens niet echt een goede benchmark van real-life performance. Intel heeft enkele weken geleden al een cpu gedemonstreerd die ook 1 teraflop haalde, met een verbruik onder de 100W.

http://www.anandtech.com/...s/showdoc.aspx?i=2925&p=2
Voor de markt waar dit voor interessant is, hebben ze uiteraard voornamelijk problemen die parallel op te lossen zijn. Dat is namelijk de methode waarmee supercomputers nu ook werken (heel veel losse CPU's gegroepeerd).

Zie het meer als een supercomputer op kleine schaal. En daar gaat iemand wellicht weer een hele grote supercomputer mee bouwen.

Wat betreft het Intel artikel: Dat is nog maar een proof of concept, en is verre van productie-rijp (if ever). Deze AMD doos is zo goed als af.

Overigens is ook de cell-CPU een kandidaat in deze sector.
Anoniem: 207146 @brama1 maart 2007 15:07
Er zijn een beperkingen die een GPU heeft die hem niet zo geschikt markt voor alle HPC workloads. Zo is een GPU gemaakt om streamende data te werken, als je code dat niet kan uitbuiten zal de performace daar enorm onder lijden. Het is ook maar de vraag hoe het zit met de betrouwbaarheid van de data, voor zover ik weet zit er zelfs geen pariteits controle op de geheugen paden in een GPU (misschien heeft AMD dat met de R600 verholpen, zou eigenlijk wel moeten als ze serieus zijn met dit initiatief).
Daar dacht ik ook gelijk aan, geen supercomputer met cpu's maar met gpu's.
een machine gedemonsteerd
ik ben wel benieuwd wat dit precies inhoud.
Zoals we gisteren hebben kunnen lezen is het lang niet gemakkelijk om een fatsoenlijke applicatie op een GPU te draaien.

Het is natuurlijk een stuk gemakkelijker om gewoon een teraflops aan precies dezelfde berekeningen die precies goed bij een gpu passen uit te voeren, dan om een échte applicatie te draaien met 1 teraflops. Er moet dan immers veel meer gemanaged worden binnen en tussen de verschillende processors.
De thuisgebruiker die niet opziet tegen een extra kachel krijgt met producten als de Radeon X2800XTX dan ook niet zomaar een videokaartje in huis
Kleine correctie. Het wordt X2900XTX. ;)
Wordt dat niet de volgende serie binnen de X2x00 lijn? Zoals nVidia 7800 (G70) --> 7900 (G71) en Ati met X1800 --> X1900...
Volgnes mij klopt dat X2800XTX wel gewoon hoor.
Ff een vraag, de GPU hier gebruikt (ofjah, 2 dus), zijn toch alleen zeer snel op bepaalde rekengebieden, zoals veel parralele werk. Bijvoorbeeld het optimaliseren van vanalles.

Maar als je gaat kijken naar andere vormen van programeren en rekenen.....behoudt deze "machine" dan zijn top-waarde?
Des al niettemin erg netjes van AMD, gister was nog te lezen dat de rekenkracht van de G80 chip van nVidia moeilijk te gebruiken was voor programeurs. En AMD komt op proppen met een apparaat dat de rekenkracht van hun r600 benut (toch?).
Anoniem: 207146 @Sibylle1 maart 2007 14:36
Flops stelt als benchmark niet veel voor. Het feit dat ze 1 teraflop hebben kunnen halen zegt niets over hoe moeilijk of makkelijk de R600 te gebruiken is.
Supercomputers heb je zowiezo bijna alleen maar voor werk wat goed parallel kan worden uitgevoerd. Dus alles wat je op een supercomputer wilt uitvoeren zal hier ook wel lekker op draaien.
Anoniem: 52621 1 maart 2007 13:49
De koeien zullen nu wel blij zijn..
op het moment dat je nu een simpele screensaver krijg, kan er nu op de achtergrond pas ECHT gewerkt worden!
Anoniem: 14124 1 maart 2007 14:24
Als dit echt de nieuwe stroming wordt, zal er ook heel goed gekeken moeten worden naar de modellen, en op welke wijze je types gaat aanduiden.

Nu wordt min of meer de snelheid in Ghz uitgedrukt, P4 2Ghz, AMD XP 3400, enzovoorts.

Dit zal dan in Teraflops moeten worden uitgebeeld. Krijg je dan straks AMD 1TF en AMD 1.5TF?
Anoniem: 205245 1 maart 2007 16:19
En die ATI R600 gaat voor de beste uitvoering 2500 dollar kosten.Voor dat geld heb je 2 goedkoperre quadcores en een leuk videokaartje
Uhm ja en dus die doen samen lang geen Terraflop. een R580 ( X1950 XTX ) was met zijn 340 Gigaflop al sneller dan 20 Core 2 Duo's op 3 GHz. In Sommige gevallen zelfs te vergelijken met 40.

En ik denk dat die Stream R600's met 2 GB ram rond de 100 0-1200 zitten.

Op dit item kan niet meer gereageerd worden.