Hoofdcategorieën
Device Settings

Grote servertest tussen dual Xeon, dual en quad Opteron

Door Jonathan Brugge, vrijdag 5 december 2003 14:48
Bron: Ace's Hardware, submitter: T.T., views: 2.197

Johan de Gelas van Ace's Hardware heeft een artikel online gezet waarin de verschillen tussen de Xeon en de Opteron getest worden. AMD vaardigt een dual en een quad Opteron 848 af, Intel levert enkele dual Xeons. Om de getallen in perspectief te plaatsen, zijn op enkele plaatsen ook resultaten van AMD's voor de thuismarkt en een G5 meegenomen. Na een uitleg over de opbouw van de servers, hun features en de gebruikte instellingen, worden een aantal typische server- en workstationtests gedraaid.

De prestaties van de Opterons blijken flink toegenomen in vergelijking met eerdere tests, mogelijk door betere NUMA-ondersteuning van de software en een nieuwer BIOS. Ook de Xeon, uitgerust met 1MB L3-cache en Hyperthreading, presteert beter dan zijn voorgangers. In de renderbenchmark neemt Intel met een klein verschil de leiding, terwijl databases en webservers duidelijk sneller draaien op een Opteron. Deze CPU schaalt bovendien beter door dan de Xeon, waar alle processors gebruik maken van één bus. De Opteron zal voorlopig de snelste blijven in de markt voor x86-servers:

Overall, the Opteron is the best server CPU of its class and we doubt very much that the 3.2 Xeon DP with 2 MB L3-cache, coming early next year is going to change that. The Opteron will probably remain the fastest CPU for the server tasks tested here until Intel introduces Nocona, the "Xeon Prescott" at 3.4-3.6 GHz (1 MB L2, 800 MHz FSB) at the end of the 2nd quarter of 2004.
AMD Opteron processors (4x voor serverpark)
Volgende 15:51 IDC voorspelt verhoogde technologie-uitgaven in 2004
Vorige 14:31 Canon XNU i255 inkjetprinter beproefd
Advertentie

Reacties

«  1  2  »

Ja, waarom ook niet ff quaken en unrealen tegelijk. }>
Ik hoor alleen maar positieve dingen van AMD 64 bit de laatste tijd. Dus mijn volgende processor wordt zeker een AMD 64 bit. :)

Als het zo simpel zou zijn dan zou iedereen voor het topmodel gaan... Het probleem is alleen het geld....

OK dit was bet wel offtopic....

je hebt ook al jaren goede verhalen kunnen horen over de xeon en itanium, ik neem aan dat je die niet in je desktop hebt gehad?

Tuurlijk niet :Z

Maar het is ook pas nu, dat er eindelijk een makkelijk bereikbaar 64 bit platform voor thuis in de maak is. De performance in ronduit indrukwekkend, maar nog steeds wordt het volledige potentieel van de 64-bitters niet benut.

Het blijft dus voor mijn gevoel nog even wachten op een 64-bits Windows voor thuis, om de Athlon64 serie tot een daverend succes te maken. Reken maar dat mijn volgende ook een AMD 64-bitter wordt. Alleen is er dan nog steeds een hoop keuze, wordt het een Athlon64 een AthlonFX, of misschien toch een Opteron met de mogelijkheid om later een 2-de CPU erin te prikken ? Maar da's dan ook meer een luxe probleem denk ik ;)

Dit zijn echt uitslagen die ik niet had verwacht en zeker zo'n klein verschil tussen de kleine verschillen tussen thuismark procs en de operton's. hier had ik graag meer verschil in gezien

Johan de Gelas heeft voornamelijk 32 bits windows software vergeleken met elkaar. Niet native gecompileerd 64 bits software.

Kortom zonder te upgraden naar 64 bits software is die quad opteron al zo snel, laat staan als er voor geoptimaliseerd gaat worden.

Lekker geloofwaardige round-up :o

Een Dual Xeon vergelijken met een Quad Opteron en dan als conclusie opschrijven dat de Xeon systemen slect presteren ten opzichte van de Opteron :+

lezen is een kunst he ;)
"Grote servertest tussen dual Xeon, dual en quad Opteron"

je hebt waarscheinlijk het artikel niet doorgenomen :+

Doornemen is 1 ding... begrijpend lezen blijkbaar een tweede....

even snel uit 1 bench gepakt, omdat het hele artikel kwoten vrij lastig is:
A dual 1.3 GHz Itanium (3 MB) is able to calculate about 170 knodes/s, so we are pretty sure that even a Quad 1.5 GHz Itanium won't beat the Quad 848 machine in this particular discipline. We can conclude that the Opteron really shines in these types of A.I. workloads. Scaling is also very good: twice as many CPUs results in almost 90% higher performance.
Dit was overigens bij de laatste test, een schaaktest, waarbij puur de kloksnelheid de bottleneck vormt. Dus de Opteron doet het wel degelijk beter, iig kwa kloksnelheid :).

Dat was een hele specifieke test van een programma dat niet gebruik kan maken van de specifieke kwaliteiten van de Itanium 2, maar wel van de specifieke kwaliteiten van de opteron.
In dit geval geen FP-berekeningen met hoge mate van voorspelbare paralellisatie, maar wel integer-berekeningen met enorme hoeveelheid random-access naar geheugen.
In de omgekeerde situatie, bijvoorbeeld als je de beide servers zou gebruiken om een grote eindige-elementen methode berekening te laten maken (enorm paralel en FP) zou de Itanium 2 de Opteron met hetgrootste gemak verslaan.

En dan te bedenken dat ook daar een 32 bits windows executable op de opteron vergeleken is met native geoptimaliseerde executables.

Het gros van de software op deze planeet is integer software.

voor die paar programma's die volledig op 64 bits floating point leunen is de I2 niet overdreven veel sneller hoor. Het ding kan 2 bundles per clock executeren. Kortom dat betekent 2 floating point multiplies per clock.

De budget processors, zonder uitzondering worden deze 1.3Ghz en tegenwoordig 1.4Ghz, processors door de overheden gekocht, die kunnen dus 2 FMULs verwerken per cycle.

De opteron 1, maar die is wel bijna 2x hoger geclockt.

Een FDIV op de opteron kost laten we zeggen rond de 73 cycles.

Op de itanium2 zit geen FDIV!

Dus de meeste software wordt hier bedonderd door in maar een paar decimalen nauwkeurig te werken (er zit wel een snelle 1/x op). Een volledig algoritme afwerken dat in evenveel decimalen nauwkeurig werkt als de FDIV op de opteron kost tientallen cycles op de itanium2. Laten we zeggen een cycle of 45 (dan heb je nog steeds niet even nauwkeurig decimalen).

Kortom hier is de opteron sneller.

Dan komt er nog heel veel overhead bij etcetera, waarbij de snelheid van de level2 cache best wel belangrijk is voor de I2 omdat de L1 te klein is, terwijl bij de opteron veel meer instructions in de L1 passen.

Die is vet sneller van de opteron en ook nog groter. Die van de I2 is tenslotte maar 256KB en de L1 cache maar 16 + 16 KB.

Dus de overhead van de overige instructies zorgen er per saldo voor dat de opteron in netjes gecodeerde software, de I2 volledig wegblaast.

Alleen wat wetenschappelijke tests, overigens vaak piepkleine programma's in tegenstelling tot datgene wat in het dagelijks leven nuttig is, waar ook nauwkeurigheid niet telt en dus de I2 lekker 32 bits nauwkeurigheid kan gebruiken, lijkt het ding snel te zijn en 5.2 gflops op 1.3Ghz te halen.

Echter zodra nauwkeurig gecompileerd wordt voor software die daadwerkelijk gebruikt wordt en die niet test, dan zie je direct dat zo'n opteron de I2 overal wegblaast!

Nou, omdat er hier al voluit wordt vermeld dat de test een aanfluiting is, heb ik het even doorgenomen. Maar ligt het dan aan mij :? Ik zie toch overal steeds gewoon ook Dual en single Opterons staan.

De Dual Xeons zijn helemaal niet afgezet tegen de Quad Opterons, die staan er voornamelijk bij om schaalbaarheid te laten zien, niet om de vloer aan te vegen met de Dual Xeon configs. Daar lijken de Dual Opterons al prima toe in staat ;)

weljaaaaa

en waarom geen alpha erbij gepakt ?? of durven die door amd gesponcerde tester het niet aan om vol op hun bek te gaan ??

Zijn Alpha cpu's niet ietsje duurder dan alle systeempjes in de test bij elkaar?

Ook goedemiddag, de mensen daaro draaien toevallig op SUN hardware. Dus fuck off met je ongegronde biased vermoeden :r

Het is tamelijk zinloos om de prestaties met een Alpha te vergelijken aangezien Alpha doos is. Pak dan een Power4 en een Itanium als vergelijking. Waarom Ace's Hardware dat niet doet? Hoogstwaarschijnlijk omdat het niet eenvoudig om een Power4 of Itanium reviewsysteem op de kop te tikken.

dan moeten ze gewoon niet beginnen om 2 verschillende dingen te gaan testen.

ik test ook geen 4 cilinder opel met een 6 cilinder ferarri.


dus test dan ook geen 32bits met een 64bits.

blijft appels met peren vergelijken .

Waarom niet?
Als de V4 en V6 voor ongeveer dezelfde prijs te koop zijn, kun je ze prima vergelijken. Het gaat niet om het aantal bits wat 'onder de motorkap' zit, maar om de price/performance ratio bij een bepaalde prijs.

Een 6 cilinder Ferrari ?

Waar waar ;)

Zo kennen we er nog wel meer. Nog even en je hebt alleen een 'eerlijke' vergelijking als de CPU's gelijkt geklokt zijn, gelijke cache hebben en nog wat meer van die bullshit. O, en ze moeten dan natuurlijk ook uitgaan van dezelfde instructieset ?

De Opteron en de Xeon zitten in hetzelfde marktsegment, dus dan mag je ze ook met elkaar vergelijken.

Of gewoon onder Windows benchmarken ( da's gewoon 32 bits hè ) en dan de prestaties van de AMD's met een factor 1,4 vermenigvuldigen, omdat die op een lagere snelheid lopen ? Zou toch ook onzin zijn |:(

welke alpha had je dan gedacht te testen. De 1.25Ghz alpha 21264?

Die kan 4 instructies per clock retiren met een branch predictie table van 2048 entires (dubbel geindexeerd).

Hoe gaat die dat doen denk je tegen een 2.2Ghz opteron die 3 instructies per clock kan retiren met een BPT van 16384 entries.

Kortom je vergelijkt iets wat op papier 5G instructies per clock kan verzetten (alpha) met iets wat 6.6G instructies kan verzetten (en veel kleinere branch mispredictie penalties heeft en veel snellere caches).

Dan is de L2 cache van de opteron verder nog heel vet hoger geclockt als van de alpha.

En gezien de prijs moet je dan een single cpu alpha vergelijken met een 4 processor opteron.

Wie gaat daar op zijn bek denk je bij deze software?

Ik vind dat HyperTransport en een ingebouwde geheugen controler een slimme zet van AMD is geweest, dat heeft meer effect dan bijvoorbeeld extra Cache en HyperThreading.

Dat is erg duidelijk te zien. Bijna alle software profiteert ervan, zelfs oude software van 3 jaar geleden. Petje af voor AMD's design team ! En dan hebben we nog geen speciaal voor Opteron geschreven software gehad.

Ik denk dan ook dat er dankzij de sterke prestaties van de Opteron zeer snel software ervoor zal komen.

Ze hadden de Madison met 6 MB cache ook eens mogen testen... :(

Dat had erg leuk geweest om die mee te testen, al had een Quad Itanium mobo erg hard door de mand gevallen evenals de Quad Xeon borden. Ze maken beiden gebruik van 1 centrale bus waar alle procs op moeten werken. De NUMA architectuur die AMD bij de Opterons gebruikt zorgt voor de mogelijkheid om kruislings interconnects te maken tussen alle procs onderelkaar. Dit levert minder snel een volle bus op bij handelingen tussen geheugen en processors.

Als software NUMA geoptimaliseerd is zeker.

De latency op quad opteron van 1 cpu naar geheugen is *meer* als factor 2 sneller als op itanium2.

Daar staat een iets grotere cache voor de I2 tegenover.

Belangrijkste is prijs.

quad opteron 2.2Ghz rond de $14k

dual itanium2 1.5Ghz bij HP af te halen voor rond de $20k.

Als je dan je software test op die itanium2, dan is de cpu ongeveer gelijk aan een K7 op 2Ghz of een P4 op 2.4ghz.

Al die academische testjes en freeware testjes ten spijt op de itanium2, dat zijn vreselijk kleine programmaatjes, ook vaak enorm slecht geoptimaliseerd. In de echte wereld is software complexer en wordt die alleen maar complexer en complexer. Kortom dat gaat totaal mis voor intel in de toekomst. die beslissing van kleine level1 caches gaat ze vreselijk opbreken.

Aan de nocona zien we al hoeveel spijt intel van zijn beslissing heeft.

Wat je dan overhoudt is dat de opteron voor software die je gebruikt, zo die al op de itanium2 zou werken, dus die itanium2 enorm voorbijstreeft. Simpelweg omdat het complexere software is als de simpele benchmarkjes.

Intel zal een enorm verlies gaan maken op de itanium2. Het feit dat itanium2 nog niet eens geheel 0.13 is (alleen de 1.5Ghz versie) zegt wel genoeg in dit opzicht.

Slechts bij wat wetenschappelijke floating point software is de itanium2 sneller.

Zoals we kunnen lezen is dat bij bijvoorbeeld NASA software al niet het geval. Die hebben een 256 processor itanium2 SGI altix3000 en het ding is erg snel voor ze, maar ze maken er wel de opmerking bij dat er erg veel instructies in hun code zitten die op hoog geclockte out of order chips het beter doen.

Kortom zelfs voor dat soort floating point software is de itanium2 niet de snelste!

Het is nu het wachten op T3Es met opterons en hypertransport interconnects, voor het duidelijk gaat worden wat voor enorm gat de opteron ook in die markt gaat slaan.

je vergeet blijkbaar dat de Xeon en de Opteron met elkaar moeten concurreren, de Itanium is een prijsklasse hoger ...

Maar wel beide 64 bits ...................

Dus wat mij betreft hadden ze die er ook nog wel bij mogen pakken. De Opteron zit gewoon over een groter deel van de servermarkt uitgesmeerd. En hierbij overlapt hij de scheiding die Intel heeft tussen 32 en 64 bits. Voor mijn gevoel dus concurent van zowel de Xeon als ook van de Itanium.

ik ben net even de tabel aan het doorkijken op deze pagina maar ik snap het niet helemaal. Zou me iemand kunnen verklaren waarom er bij de optron 2xx en 8xx.

"Max. Physical Address Space 1024 GB flat (40 bit)" en

"Max. Virtual Space 256 TB (48 bit)" staat?


Zover ik weet is de optron toch 64bit waarom maakt hij dan gebruik van de al verouderde 40/48bit geheugen adressering. Dit zou toch net 1 van de grote voordelen zijn van de 64bit architectuur?
edit:
Het performance verlies van de render benchmark is volgens mij toe te rekenen aan de smallere cache pipelines. de optron maakt gebruik van 128bits pipelines en de intel tegenhangers (xeon en itanium) hebben daar 256bits lijnen lopen

Misschien ff bij AMD in de tech.details duiken?

Toms Hardware had er dit over te zeggen, ooit:
Opteron can handle up to 1 TB (1024 GB) of system memory, which in detail means that it comes with a 40-bit wide physical address space and a 48-bit wide virtual address space. This may sound significantly less than the 64-bit one might expect, but it offers a lot larger main memory than the 32-bit wide address space of Pentium 4, Xeon or AthlonXP.
Better yet, het blijkt dat de eerste Opterons gewoon zo gemaakt zijn, later wellicht wijzigingen:
64-bit virtual address space with 52 bits of physical memory addressing that can support systems with up to 4 petabytes of physical memory - more than one million times the amount of memory supported by 32-bit x86 systems. In the first iterations, the Athlon 64 and Opteron will support only 48 bit virtual memory and 40 bit memory addesses, though, meaning that the amount of supported physical memory increases by 256x from 4 GB to 1024 GB (1 Terabyte). This, by far surpasses the 64 GB physical memory space enabled by Physical Addressing Extensions (PAE) enabled by some server class 32-bit x86 processors.

"oude" ?? Uhm, voor deze generatie Opteron is 64bit address space niet noodzakelijk, of wil jij als enige 1024TB aan ram in je systeem ? De AMD64 architectuur is 64bit address space voorbereid, dus mocht het echt nodig zijn dan kan het alsnog ! :)

En dat is allemaal per processor, dus je kan in een Quad Opteron systeem theoretisch gezien maximaal 4096GB aan geheugen kwijt. Als dat niet genoeg is voor je dan weet ik het ook niet.

Nou, dan moeten we het daar maar mee doen he?

48-bit adressering heeft voorlopig geen nadelen (Want is toch veel te veel) maar wel voordelen: pointers kosten maar 3 byte i.p.v. 4, zodat instructies kleiner zijn en er dus meer in de cache past.

3 bytes? 24 bits?
Pointers zijn gewoon 8 bytes / 64 bits.

Het voordeel is dat een aantal adres-registers en adres-lijnen een stuk minder breed hoeven te zijn.

Je hebt gelijk, dat moet 6 byte zijn. En 48 bit wordt wel degelijk gebruikt om ook het cache gebruik te verkleinen.

ik mis nog een systeem, zet er eens een Sun FIRE server naast met quad 1gz . dan wil ik wel eens weten wie er wint.

Bij de DIEP 2.01 bench hebben ze er een SGI Origin 3800 met 128 500 MHz SGI MIPS R14000 CPUs met 8 MB L2, and is able to deliver 1681 Knodes/s.

Ik weet het is geen sun maar toch een mooi vergelijking omdat de quad optron 848 combinatie 485 Knodes/s bereikt.

die zit er niet bij om de zelfde reden dat er geen alpha,of itanic in zit.
die kosten per stuk meer als alle systemen bij elkaar in de test gebruikt.
dat is dus een hele andere classe, (en prijs/prestatie gezien zal die classe er niet erg goed uit komen trouwens)

Itanic?

Je weet wel het zinkende schip van Intel :Y) :z

Itanium
Titanic
Itanic..

Neee, itanic is een typo hoor :+

De quad opteron. Met een hele grote marge. Sun is tegenwoordig neoit meer in staat om snelle processoren te bakken. Dus maken ze machines met heel veel processoren.
Als je bijvoorbeeld kijkt naar de SPEC_JBB2000 benchmark dan zie je dat een 12-proc ultrasparc machine maar net iets sneller is dan een 4-proc Opteron 246.
Maar ook in SPEC-int scoort de ultrasparc beduidend slechter dan x86-procs, alleen met SPEC_FP kan hij in de buurt komen.
Sun moet het hebben van de goede naam, de goede software en de (redelijke) schaling

Sun brengt heel uitgebreide opteron series uit in 2004, dus SUN die overleeft het wel. Nu ja overleven. Ze domineren de server markt, dus blijven dat doen.

Soort van microsoft in de server markt :)

Hier wil ik nog wel even op reageren:

1. Aceshardware is voor zover ik er zicht op heb een respectabele site geleid door mensen die weten waar ze mee bezig zijn, die ZEER degelijk werk aflevert, resultaten in perspectief plaatst, en niet te beroerd is om de testwijze in vraag te stellen en eventuele missingen toe te geven. Dus stop even met moord en brand te schreeuwen als de resultaten niet overeenkomen met jou "idee".
2. Om iets te testen moet je het ter beschikking hebben.

'nough said.

Maar, toch een klein minpuntje: sommige grafieken worden afgebeeld zonder indicatie of een hoge score snel of juist traag betekent. Ik heb geen idee wat Cinebench is, en of de gegeven getallen "tijd in seconden", "komkommers per uur", of nog iets anders inhouden.

Maar, laat ik er gelijk bijzeggen dat zij niet de enige zijn die zich hieraan bezondigen...

Toch even beter lezen, staat idd niet in onderschriften maar wel gewoon in de tekst.

Sorry hoor,maar deze zeer uitgebreide in-depth test van aceshardware word wel erg summier omschreven. Diegenen die de moeite niet nemen om het originele artikel te lezen, kunnen wel eens de verkeerde indruk krijgen (aan een aantal reacties te zien hierboven, is dat precies wat er gebeurd).
Waarom zeg ik dit ? Omdat een uitermate trieste test als deze helemaal ontleed word op de frontpage, en dit hier net zo goed een linkje had kunnen zijn tussen de nieuwslinks.
Graag een beetje lijn houden in die "reviews" van de reviews luitjes.
«  1  2  »

Op dit item kan niet meer gereageerd worden.

Volgende 15:51 IDC voorspelt verhoogde technologie-uitgaven in 2004
Vorige 14:31 Canon XNU i255 inkjetprinter beproefd
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011