Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 39 reacties
Bron: AMD.com

AMD heeft vandaag de nieuwste telg in de Opteron 200-serie ge´ntroduceerd. De Opteron 246 draait op een kloksnelheid van 2,0GHz en is geschikt voor gebruik in systemen met maximaal twee processors. De CPU's zijn per direct beschikbaar voor een prijs van 794 dollar bij afname in aantallen van 1.000 stuks. Met de prijstelling van de Opteron 246 continueert AMD zijn strategie om de Opteron 2xx-serie tegen hogere prijzen aan te bieden dan de duurste 2-way Xeon-processors van Intel. AMD wil hiermee kennelijk gebruikmaken van het beproefde concept dat een hogere prijs door de consument veelal automatisch wordt geassocieerd met een hogere kwaliteit en betere prestaties. Machines met de Opteron 246-processor zijn verkrijgbaar bij Appro, Boxx, Einux, IBM, Penguin Computing, RackSaver en diverse andere fabrikanten. De 2,0GHz versies van de Opteron 1xx- en 8xx-series, respectievelijk bedoeld voor single processor en 4-way tot 8-way systemen, zijn nog niet aangekondigd, maar zullen volgens AMD binnenkort beschikbaar komen.

AMD processorPrijsIntel processorPrijs
Opteron 246 (2,0GHz)$794
Opteron 244 (1,8GHz)$690Xeon 3,0GHz (1MB L3, 533MHz)$690
Opteron 242 (1,6GHz)$455Xeon 3,0GHz (533MHz)$455
Xeon 3,0GHz (400MHz)$433
Xeon 2,8GHz (533MHz)$316
Xeon 2,8GHz (400MHz)$294
Opteron 240 (1,4GHz)$256Xeon 2,66GHz (533MHz)$256
AMD Opteron perspic - chip background (groot)

AMD claimt een SPECint2000 Peak performance van 1317 punten. Daarmee presteert de Opteron 246 beter dan de Intel Xeon 3,06GHz met 1MB L3 cache en is de integer performance vrijwel gelijk aan de Itanium 2 6M 1,5GHz. SPECfp2000 Peak werd gemeten op 1293 punten, waarmee de 246 in dezelfde regionen presteert als de Pentium 4 3,2GHz. De hoogste SPECfpu scores zijn in handen van de Itanium 2 en de IBM Power4+. AMD gebruikt overigens nog steeds een 32-bit versie van de SPEC CPU benchmark. Klaarblijkelijk zijn de beschikbare AMD64-compilers nog niet in staat om snellere code te produceren dan de 32-bit C++ en Fortran compilers van Intel en Microsoft.

SPECint2000 Peak performance
Intel Itanium 2 6M1,5GHz 1322
AMD Opteron 2462,0GHz 1317
Intel Xeon 1MB L33,06GHz 1294
Intel Pentium 43,2GHz 1261
IBM Power4+1,7GHz 1113
HP Alpha 21264C1,25GHz 928
SPECfp2000 Peak performance
Intel Itanium 2 6M1,5GHz 2119
IBM Power4+1,7GHz 1699
HP Alpha 213641,15GHz 1482
AMD Opteron 2462,0GHz 1293
Intel Pentium 43,2GHz 1285
Intel Xeon 1MB L33,06GHz 1186

Vorige week slaagde IBM erin om een toppositie te veroveren in de TPC-H clusterbenchmark van het Transaction Processing Performance Council. Gebruikmakend van zestien Opteron 246 processors verdeeld over acht nodes bereikte het eServer 325 cluster van IBM een TPC-H score van 12.216 punten bij een databasegrootte van 100GB. Het Opteron-cluster presteerde daarmee meer dan twee keer zo hoog als een cluster van zestien Alpha 21264C 1,0GHz processors en een systeem met acht Xeon MP 2,8GHz processors.

TPC-H performance 100GB database (QphH)
IBM eServer 3258x2Opteron 2462,0GHz 12216
IBM eServer 4458xXeon MP2,8GHz 5602
HP AlphaServer ES454x4Alpha 21264C1,0GHz 5578
Maxdata Platinum 9000-4R4xItanium 2 6MB1,5GHz 4307

Gerelateerde content

Alle gerelateerde content (28)
Moderatie-faq Wijzig weergave

Reacties (39)

Het valt me op dat bij die SPECint2000 en SPECfp2000 niet dezelfde Alpha is gebruikt... vreemd eigenlijk....

De performance van de Itanium verbaasd me toch ook wel, deze doet het per clock cycle toch 33% beter dan de Opteron met Integers, en met floating point is hij per cycle 2x zo snel! :9
Ik neem aan dat die 6M voor de 6MB cache versie staat, dus dat is natuurlijk ook iets wat enorm meehelpt. Hoeveel Cache heeft zo'n Opteron eigenlijk standaard? :?
Tja, da's het voordeel van een andere architectuur. Een Itanium voert expliciet meerdere instructies per tik uit (instructies zijn gegroepeerd om parallel uitgevoerd te worden), terwijl een Opteron uit een stroom van instructies parallellisme moet toveren. Oh ja, een Opteron heeft 1MB cache.
Hmm ja dat is waar ook, de Itanium legt de complexiteit meer neer bij de compiler, eigenlijk een beetje een VLIW achtige strategie.

Maar 6 MB Cache tegenover 1 MB is natuurlijk ook wel een aardig voordeeltje ;)
EPIC is een vorm van VLIW. Maar omdat VLIW al bestond en intel een eigen marketing naam wilde, zijn ze dat EPIC gaan noemen. Overigens, beiden zijn een uitbreiding/variant op RISC (Reduced Instruction Set Computing), namelijk een waarbij meerdere Risc-instructies expliciet paralel gebundeld worden aangeleverd, en dus ook de scheduling door de compiler gedaan moet worden (de meeste Risc processoren zijn OO = Out of Order Scheduling, de itanium is een pure in order scheduling proc).

Zo, heb ik toch fijn al die afkortingen kunnen noemen.

CISC :-)
eigenlijk een beetje een VLIW achtige strategie.
eigenlijk... dit is absoluut een VLIW proc.

Dat is ook dereden waarom de emulatie zo langzaam is. Dan haal je de voordelen van VLIW helemaal niet.

Een goede compiler is absoluut noodzakelijk voor goede performance. maar tenenswoordigs zijn compilers hiertoe meer dan goed toe in staat.
Was het geen EPIC (Explicitly Parallel Instruction Computing) architectuur?
To date, Intel has revealed almost nothing about IA-64 other than to trumpet it as the first "post-RISC" architecture. Moreover, Intel firmly insists it has not implemented a very-long-instruction-word (VLIW) approach--something that's been widely assumed. "It's going beyond VLIW--it's a new technology," said an Intel spokeswoman. "There are no VLIW concepts in IA-64."
wou ik ook ff wete, dus gezocht:
1 AMD OpteronÖ processors Model 246 with 1MB L2 cache
De performance van de Itanium verbaasd me toch ook wel, deze doet het per clock cycle toch 33% beter dan de Opteron met Integers, en met floating point is hij per cycle 2x zo snel! Ik neem aan dat die 6M voor de 6MB cache versie staat, dus dat is natuurlijk ook iets wat enorm meehelpt.
De Itanium 2 6M lijkt in bepaalde onderdelen van SPECfp2000 buitensporig veel te profiteren van zijn grote hoeveelheid cachegeheugen. In de meeste real world applicaties is het verschil in floating point prestaties ten opzichte van andere processors kleiner. De verhoudingen zouden in SPECfp2004 wel eens ten nadele van de Itanium 2 kunnen veranderen.

De IPC van de Opteron is vanzelfsprekend gehandicapped door z'n x86 instructieset, maar door de hogere kloksnelheid weet hij toch gelijk te presteren aan de Itanium 2 6M in SPECint en daar gaat het uiteindelijk om.
Volgens mij presteerde de itanium ook al buitengewoon goed toen hij nog op 1 Ghz draaide met 2 MB cache.
De meeste Spec-test zijn sowieso nagenoeg cache-onafhankelijk (draaien bijna allemaal binnen 256 k cache).
de fp-performance van de itanium is m.i. vooral te verklaren door de combinatie van RISC (nagenoeg alle RISC-procs scoren veel hoger op SPec-fp dan een gelijkgeklokte x86) en het verbeterde paralellisme, mogelijk omdat veel spec-fp tests om onderling onafhankelijke berekeningen gaan en dus makkelijk paralelliseerbaar zijn.
Een van de doelen bij het ontwikkelen was ook om een processor te maken die het goed doet bij wetenschappelijke toepassingen waarbij veel moet worden gerekend. Dat de FPU dan een beest is lijkt me logisch :)
Wat me ook interressant lijkt is de performance van Vector instructies op deze processoren, zeker ook voor het wetenschappelijke aspect wat JeroenB aankaart.

Hoe zou het zijn met de performance van de SSE/SSE2 instructies t.o.v. de Intel processoren? :)
Die is minder goed. Dat zou kunnen komen door een slechtere implementatie van SSE, of gewoon door het klokfrequentie voordeel van intel.
de SSE implimentatie van AMD is juist zeer goed, alleen wat langzamer dan intels puur omdat AMD's SSE op minder mhz werkt.
Da's weer eens wat anders. AMD CPU's met een lager prijs/performance verhouding dan intel CPU's bij de top processors.

Natuurlijk zijn dit wel erg summiere benchmarks om dit op te basseren, en het zegt zowiezo weinig (mijn celeron 1GHz zou wel eens een betere prijs/performance kunnen hebben ;) ). Maar toch wel grappig.


Specint score/$:
XEON 3.06 -> 1294/690=1.875
Opteron 246 -> 1317/794=1.659

Specfp score/$
XEON 3.06 -> 1186/690=1.719
Opteron 246 -> 1293/794=1.628
Die prijs prestatieverhouding die Japs uitrekend klopt niet. Je moet de rest van de hardware ook mee nemen in de berekening. Een cpu alleen daar heb je natuurlijk niks aan.
In veel servertoepassingen was de Opteron 244 al een behoorlijk stuk sneller dan de Xeon 2,8GHz (kijk maar eens op Ace's Hardware en AnandTech) dus de 246 is zijn hogere prijs ten opzichte van de Xeon 3,06GHz met 1MB L3 cache wel waard. Zeker als ook het voordeel van de grotere hoeveelheid adresseerbaar geheugen (dat je in benchmarks vaak niet terug ziet vanwege de kleine datasets en beperkte geheugenconfiguraties in testsystemen) wordt meegeteld.

We zijn voor Tweakers.net nu ook een aantal Opteron servers aan het bouwen. 64-bit is al met 4GB geheugen een voordeel omdat MySQL onder 32-bit Linux niet meer dan 2GB geheugen kan gebruiken.
AMD wil hiermee kennelijk gebruikmaken van het beproefde concept dat een hogere prijs door de consument veelal automatisch wordt geassocieerd met een hogere kwaliteit en betere prestaties
Even los van de daadwerkelijke prestaties van de opteron, maar als ik zoiets lees voel ik me op voorhand al bekocht......... |:(

Gelukkig is het alleen maar een mening/veronderstelling van Femme

(Femme, weten je sponsors wel van deze uitspraak?!? :9 )
Ja dat kan ik me voorstellen, maar ik vind de redenatie van AMD gewoon slim. Niet alleen kunnen ze op de manier meer marge pakken, voornamelijk om eens een positieve cashflow te genereren, maar als je het zo bekijkt...

Hoeveel mensen kopen Nike om de prijs en het merk?
Hoeveel mensen kopen Levis om de prijs en het merk?

En dat terwijl de Levis broeken er in de consumentengids als slechtste uitkomen, en Nike producten een geschiedenis van kinderarbeid hebben.

Goedkopere producten, komen gewoon vaak bij mensen over als budget producten, en op de server markt wil men geen budget producten maar kwaliteitsproducten. Dus zodoende maken ze de prijs hoger, en dan moet de gedachte in de richting van een kwaliteitsproduct worden geduwd.
Als thuis-gebruiker vind ik die spec-scores wel leuk klinken, maar op http://www6.tomshardware.com/cpu/20030422/opteron-23.html#3drendering en op http://www6.tomshardware.com/cpu/20030422/opteron-24.html
komt de opteron er heel wat minder leuk af dan dat de spec-scores doen vermoeden. En aangezien ik geen serverpark draai thuis, zal de keuze, als het om workstation-snelheid gaat, toch gaan tussen de dual xeon en apple's g5, waarbij die laatste mijn voorkeur heeft. Voor serieuze servertoepassingen zal het een keuze worden tussen de power 4 en de opteron, waarbij de power 4 de snelste is, maar misschien niet de goedkoopste. De opteron is gemiddeld misschien de snelste, maar voor workstation ˇf server-gebruik zijn er volgens mij geschiktere oplossingen.
Dat lijkt me enorm afhankelijk van je server toepassing. En je budget.
De Opteron is qua budget vergelijkbaar met een Xeon, maar qua prestaties en vooral qua schaalbaarheid vergelijkkbaar met een Power4. En dan wel de snelste en duurste. De Xeon schaalt nauwelijks door, terwijl de Opteron op dat gebeid fenomenaal presteert.
Op dit moment werk ik (professioneel) aan een zware high-performance J2EE-applicatie, die een proc puur op integer-operaties (het gaat om tekst-bewerking) belast en (voorlopig) niet expliciet machine-paralleliseerbaar is, omdat er te veel afhankelijkheden zijn. Dat betekent dat de applicatie geclustered moet gaan draaien, liefst op 1 grote machine met meerdere processoren. Daarnaast wordt nagenoeg alles infromatie gecache di in het werkgeheuden, om performance-degradatie door HardDisk access te minimaliseren. Waarschijnlijk is een Opteron-server daarvoor de ideale kandidaat, vanwege zijn lage latencies, goede spec-int prestaties en zijn schaalbaarheid.
In ieder geval is mijn eigen dual Athlon 2400+ twee tot drie keer zo snel als de huidige dual power-3 server op 900Mhz die nu door de klant gebruikt wordt...
Ah. IBM is toch nog trots op z'n opteron server! Speurde ik gister nog vruchteloos de diverse ibm sites af, inmiddels staat het ding te prijken bovenaan de serverpagina:

http://www-132.ibm.com/content/home/store_IBMPublicUSA/en_US/eServer/e Server.html

Als nou Dell ze ook nog gaat verkopen, en ze nog nÚt wat sneller&goedkoper worden, gaan wij d'r ook een stel kopen denk ik zo.
Wat ik wel een prettig idee vind is dat het AMD dus daadwerkelijk gelukt om voor 22 september de 2 GHz te halen. :) Als de Athlon 64 uitkomt hebben ze dus daadwerkelijk een concurrerend systeem, waarmee ze het eindelijk Intel weer een beetje moeilijk kunnen maken in de consumentenmarkt. Met een beetje mazzel kunnen ze de Athlon 64 zelfs op 2.2 GHz uitbrengen, en die zal wel een heel eind tegen een P4 3.2 GHz opgewassen zijn. Als ze 'm dan een beetje conservatief labelen (3300+?) zijn ook die ratings weer wat realistischer. (Jaja, ik weet dat je ze moet vergelijken met een oude Athlon...) Kortom, we krijgen weer een soortgelijke strijd als bij het uitkomen van P4, met alle voordelen voor de consument.

Let the games restart! :D
Ja idd , 2GIG lijkt men dus te halen , en uit eerdere berichten zou men bij de athlon 64 meer cache steken dan eerst maar was voorzien. Dus het ziet er goed uit. Nu enkel die prijs was naar beneden :p maar dat zal wel wat zakken voor een consumenten pc ... hoop ik.
Wat ik mij nu afvraag is in hoeverre we deze benchmarks moeten geloven.
Het komt AMD best goed uit dat de Opteron beter presteert dan de Xeon. Eigenlijk iets te goed als verliesgevend bedrijf wat zich stort in een nieuwe tak van de brache.

Daarom lijkt mij enige voorzichtigheid geboden. Net als die vorozichtigheid er moet zijn bij de benches van GPU's & mobo's door de fabrikant zelf.
Deze benches zijn zo simpel te draaien dat ze perfect reproduceerbaar zijn en iemand zo door de mand valt als ze de boel proberen te flessen. Je downt de source, compileert het en draait de binary. Als je dezelfde hardware en dezelfde compiler gebruikt krijg je ook dezelfde score.

Nadeel, en waarom je deze waarden rustig kunt negeren, is dat dit een volledig synthetische resultaat geeft. het zegt enkel hoe 'pure' int danwel FP instructies verwerkt worden. Helaas zegt dat weinig tot niets over real-world apps, zeker niet als je het hebt over CPUs die meerdere extra vector instructiesets hebben. Deze tests overdrijven ook de performance van de Itanium (zoals hieronder gezegd wordt) omdat de vele simpele instructies daar gebundeld worden tot VLIW instructies. IRL gaat dat moeilijker omdat er veel meer onderlinge afhankelijkheden van de code zitten, waardoor de meerwaarde van VLIW sterk daalt.

* 786562 dion_b
Deze tests geven niet pure 'int' performance op de specint. Voor specint is de L2 en L3 cache heel belangrijk bij de meeste applicaties. Kijk hoe de itaniums presteren.

Voor mij presteert een itanium2 1.3Ghz
met gcc 3.0.4 : 72k nps *
intel c++ 7.0 : 88k nps *
* = met pgo

P4 3.06Ghz
visual c++ 6.0 sp5 procpack : 95k nps
intel c++ : buggy verliest bits omdat
floating point van 80 bits naar 64 of zelfs
32 bits wordt geoptimaliseerd.

K7 2.127 Ghz
visual c++ 6.0 sp5 procpack : 104k nps
intel c++ : buggy random resultaat bij
casting zelfs. Maar qua snelheid vergelijkbaar
met visual c++
gcc 3.3 (met PGO) : 105-106k nps

pgo = profile guided optimizations

Als we dan kijken naar specint dan zien we hetzelfde. Het enige programma in heel specint dat niet alleen maar kickt op een grote L2 of L3 cache is Crafty.

Snelheden crafty in specint:
GCC 64 bits opteron 1.8Ghz : 1562
2.2Ghz K7 32 bits : 1324 score
3.06Ghz Xeon 32 bits : 1192 score

En waar staan de itanium en de zo beroemde alpha 21264C?

Juist *stukken* lager.

Die specint en specfp testsets zijn er om dure cpu's goed te laten lijken. De meeste programma's zijn public programma's. heel slecht geprogrammeer t.o.v. hun commerciele equivalenten.

Sommige programmeurs snappen bijvoorbeeld niet dat in C het volgende tering traag is:
{
if( a[x] )
b = 5;
else
c = 2;
..
}
Terwijl de meeste C compilers wel heel snel is:

{ int tempa=a[x];
if( tempa )
b = 5;
else
c = 2;

Dit loopt tot factor 10 sneller op de P4 en K7.

Maar om een triviaal voorbeeld te geven. Maar de open source programma's zullen al dat soort optimalisaties nooit begrijpen.

Dan verder is er nog iets aan de hand met specint en dat is de working set. specint werkt met een veel te kleine working set.

*logisch dus* dat processors met grote L2 en L3 caches, waar de gemiddelde gebruiker niks aan heeft, dat die snel zijn.

Enige programma dat een beetje lijkt op de schaling van mijn software is Crafty.

Dit terwijl crafty 64 bits code is en ondergetekende altijd braaf in 32 bits voor de PC's heeft gewerkt (en 64 bits voor alpha).

Specint geeft dus een enorm vertekend beeld kortom van de werkelijkheid. Het gaat zo ver zelfs dat intel c++ bij heel veel software totaal gammel werkt maar wel goed scoort op specint. Zo ver is het al heen met de werkelijkheid!

Kortom de x86 cpu's zowel Xeon als K7 zijn voor ondergetekende en al de pappenheimers die ik ken, vet sneller als het gaat om integer software.

Over floating point daar ligt de werkelijkheid wel iets anders. Want het aantal gflops dat 1 processor effectief kan halen, is heel eenvoudig te meten.

MVG
Onzin, spec resultaten worden echt niet vervalst. Of een bedrijf riskeert zijn geloofwaardigheid, en als AMD zich iets niet kan veroorloven is het dat wel, ze beginnen net binnen te dringen (proberen het) in de high-end markt.

En die TPC-H resultaten zijn door IBM aangedragen.
Vervalst worden ze ook niet, maar ze kunnen wel op een "voor de opdrachtgever mooi manier" aangepast worden.
Denk maar eens aan de Apple G5 benchmarks VS de Intel p4 3,0 Ghz. De G5 zou alle records verbreken tov de Intel. Alleen is voor de Apple een optimale compiler gebruikt en voor de Intel niet.
Dus vervalsen nee, maar betrouwbaar, dat ook niet!
Voor zowel de G5 als de Xeon is in die test de GCC-compiler gebruikt. Weliswaar niet optimaal voor de Xeon, maar ook niet per se voor de G5.
Dat was benchmarketing, maar je moet niet vergeten dat alle resultaten die in de SPEC database worden ingevoerd door alle partijen op de voor hun systeem beste manier worden verkregen.

Dus intel optimaliseert hun Xeon, P4 en Itanium systeem (met keuze van de juiste compiler, opties, hardware, bios instellingen, etcetc), Apple doet dat net zo, idem voor AMD.
Ik kan me vergissen - maar vergelijkt men hier niet de Dual-versies van de Xeon met de 4-way versie van de Opteron qua prijs?
Je vergist je. :) 24x is voor Opterons 2-way processor. Eigenlijk geen idee of je Xeons default 4-weg kan zetten...
Gewone Xeons kan men max per 2 steken - voor Quad systemen moet je Xeon MP's hebben...

Maar je hebt idd gelijk - de Opteron 24x zijn duals - de 84x zijn 4way en 8way :)
1xx is 1-way
2xx is 2-way
8xx is 8-way
Ik verwacht dat AMD het laatste half jaar van dit jaar veel winst maakt.

AMD staat helemaal in de picture.. amd dit, amd dat.. alsof intel niet meer bestaat.
(8> :9~ :Y) :*)

dus wat blijkt amd is stukken beter dan pentium by far :P

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True