Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 47 reacties
Bron: GamePC

Tux rustende op athlonGamePC heeft de Linux 2.4.x kernel's performance getest op een dual AMD Athlon systeem met AMD 760MP chipset. De test omvat een iewat ongebruikelijke set benchmarks, waaronder MySQL benchmarks, en is ruim opgezet door naast het dual Athlon systeem ook een Intel Pentium 4 (1.7GHz) systeem en een dual Intel Pentium III (1.0GHz) systeem in de test te betrekken. Als Linux distributie werd Redhat v7.1 met de 2.4.2 kernel gebruikt.

Alle benchmarks zijn op de dual systemen zowel met n als met twee CPU's gedraaid, waarbij bij de dual configuraties uiteraard gebruik is gemaakt van een kernel-build met SMP support.Het artikel begeleidt de lezer met de benodige informatie omtrent SMP en de verschillende implementaties voor Intel- en AMD-systemen alsmede de voor- en nadelen van die implementaties.

De benchmarks zijn op gamegebied weinig verrassend, Quake3Arena heeft toch te weinig voordeel van de dual processor architectuur en de Pentium 4 wint deze test grandioos. Echter de benchmarks die de SMP configuratie goed benutten laten een heel ander beeld zien: de dual Athlon configuratie laat de andere systemen ver achter zich, zeker wanneer het aankomt op 'heavy load', zoals een kernel compile met 5 processen, waarbij er telkens geswitched moet worden tussen de zware compile-processen op de CPU's.

compile linux

2.4.2 Kernel compile, 5 processes. (lower times are better)

De MySQL benchmarks gaven een interessant beeld:

A real surprise occurred when the single processors faced off. The Athlon not only soundly beat the P3, but actually also managed to beat the dual Athlon by a little over a minute. This does seem a bit odd because going from a single P3 system to a dual P3 system decreased the time buy a good 10 minutes. This could be another example of the maturity of Intel's SMP solution versus AMD's. You'll also notice that the single Athlon also finished all 8 SQL bench tests a good 7 minutes ahead of the P4. It managed a fast 38.15 minutes to complete all tests compared with 59.25 minutes for the P3 and a derisive 45.98 minutes for the P4.
In the end, you have to give it to the folks at AMD, their Athlons can really smoke when it comes to number crunching. Although, their SMP platform still seems to have its issues.

De conclusie is zoals verwacht: Intel's P4 verslaat alle systemen in de gamebenchmarks, de AMD Athlon SMP configuratie neemt het voortouw in alle andere benchmarks.

Moderatie-faq Wijzig weergave

Reacties (47)

ik vraag mij af of ze quake 3 smp aangezet hebben want het kan gewoon niet dat een dual systeem langzamer is dan een single proc...... zeker niet als het spel smp ondersteund!!! volgens mij zijn ze gewoon vergeten smp aan te zetten!


/edit.... yup smp stond uit vandaar dat hij langzamer was!!
/edit
hoeft niet. SMP support in Q3a is niet effectief, daar de ene cpu de ander 'choaked' met data. Carmack heeft verschillende manieren geprobeerd om met 2 cpu's de te behandelen data/code efficient uit te voeren, maar geen van allen bleek effectief. Dit is uitgebreid te lezen geweest in zn .plans op bluesnews.com.

Het komt er op neer dat de gang van BSP leaf -> renderable primitives -> serie OpenGL primitives een serie acties oplevert die je niet 1 2 3 opbreekt over meerdere CPU's zonder grote bakken met data te moeten verschepen tussen de cpu's. En de bottom line was dat de ene cpu op de andere staat te wachten voor data die hij kan processen, ipv dat alles in parallel gebeurt. Vandaar dat je nauwelijks tot niet voordeel ziet bij q3a en smp. HET voordeel dat je eventueel ziet is de videodriver die meerdere threads gebruikt.

edit: zie ook deze slashdot posting met iD's comment dat linux' Q3A geen SMP code heeft: http://slashdot.org/comments.pl?sid=01/07/12/1838238 &cid=118
in een update in het artikel staat dus ook dat id-software de SMP-libs voor Linux Q3 nog niet heeft uitgegeven
Ook al ondersteund het spel geen SMP, toch heb je er voordeel van als je een SMP machine hebt.
XFree86 en Q3 lopen dan b.v. op andere CPU's, verder draaien er op een linux bak altijd nog andere processen (daemons etc.) die ook over de CPU's verdeeld worden, dus de CPU waar Q3 op draait word minder belast door 'bijzaken'
Ik zet wel vraagtekens bij de conclusies n.a.v. de MySQL benchmark. Ook bij de PIII zijn de verschillen erg klein, maar dan in het voordeel van de dual setup. Het lijkt er nog het meest op dat MySQL niet zo goed met SMP omgaat.
[speculatiemode]
Ik ken de code niet, maar het lijkt er op dat SMP wordt gehinderd door resource locking. Logisch als je het over een databeest hebt natuurlijk. Dan zou er nog heel wat geoptimaliseerd kunnen worden om de performance van MySQL op SMP systemen fors op te voeren.
[/speculatiemode]
Het gaat in ieder geval te ver om aan de resultaten van deze benchmark de conclusie te koppelen die suggereert dat als het Athlon platform 'volwassener' is, het resultaat er anders uit zou zien. Het kan ook gewoon aan de CPU liggen - als een single CPU systeem tegen een beperking aanloopt, is een dual CPU systeem per definitie trager. Dus kan je net zo goed concluderen dat de PIII in z'n eentje niet in staat is een systeem tot het bot uit te melken waar dat met twee PIII's wel lukt. Of 1 Athlon :)
nee, het schijnt dat het benchmark programma een perlscript is die queries uitvoert mbv de mysql daemon. Die forkt per connectie een process af. je hebt dus in feite: mysql processop proc 1, benchmarker op proc 2.
Benchmark is inderdaad perl (hi Luuk :)), ik vraag me alleen af of perl wel de juiste taal is om mee te benchmarken -> overhead
Ok. Dus het perlscript start via de mysql daemon 1 tot 5 processen. Maar staat grootste deel van de tijd dus te wachten. Dan worden die processen toch over de twee CPU's verdeeld door de OS scheduler? Als je dan het resultaat van de benchmarks bekijkt is er effectief maar een van die processen actief. Dan is het toch heel aannemelijk dat een mutex gebruikt wordt (voor de database bijv.) waardoor de queries sequentieel op slechts een CPU worden uitgevoerd. Nogmaals, ik ken de code niet - en als mijn analyse niet klopt ben ik toch wel heel erg nieuwsgierig wat dit dan wel veroorzaakt. Dat het aan de CPU ligt gaat er gewoon niet in...
Als het Athlon SMP platform net zo ver is uitgekristaliseerd als die van Intel dan zullen die verschillen zich alleen nog maar uitten en pure processor snelheid. De dual snelste processor combo zal dan sneller zijn. Meestal is het moederbord wel van invloed op de snelheis van je pc, maar bij pure "number crunching" zijn de processoren eigenlijk "de baas".

Wel apart dat de P4 eindelijk het snelste is in iets, dat zal Intel goed doen. Ik denk dat de massa nog steeds wel voor de P4 gaat en dat wij tweakertjes de overweging naar P3T misschien nog wel overwegen. Officieel zal de P3T toch niet erg leverbaar zijn, al denk ik dat ze vroeg of laat wel opduiken hier en daar. Althans, laten we het hopen. :P

Edit: Offtopic? Gemodereerd? Het gaat hier toch de performance van dual Ath. mp tov p3/p4 combo's? Of is dit het verkeerde topic? n00b's ook altijd ;)
Het was al vanaf het begin bekend dat p4 bijna alleen sneller is in quake 3 dit komt vermoedelijk omdat de p4 een enorme bandbreedte naar het geheugen heeft en quake 3 daar veel gebruik van maakt. Ik vraag mij alleen af hoe het zich straks verhoud met nforce aangezien die dual channel ddr gebruikt wat nog meer bandbreedte heeft dan dual channel rambus.
Ja inderdaad daar ben ik ook wel benieuwd naar.

Maar ik vind een Quake III test helemaal niet zo spannend als je de processorsnelheid wil testen. Een processor is toch de bottleneck niet, eerder de videokaart. Dus je hoeft echt geen P4 te kopen omdat je denk dat ie sneller in spellen is, want tsja wie speelt nou op resuloties wanneer de videokaart de geen bottlenenk vormd? En dan nog, als je wel op lage resoluties speelt, wat heb je aan 200 fps????
Een simpele duron is genoeg voor gaming dacht ik. :)
Daarom worden dit soort benchmarks op lage resolutie's gedraaid; liefst op 640x480 bij 16bit kleuren om zeker te weten dat de videokaart niet de bottleneck is.

Opmerkelijk is ook dat de P4 in T&L software gewoon goed blijft presteren, of dit door 't RIMM komt is pas te merken als de Dual channel DDR borden komen zoals de Nforce. Zoals de heer Vastloper al mooi wist te vertellen.
Als de AMD dan niet sneller is of dicht bij de snelheid van de P4 komt dan heeft Intel IMHO iets moois in elkaar gezet dat er gewoon voor zorgt dat er goed softwarematig geT&L'ed kan worden. Iets wat heel gunstig is voor de aanschaf van een videokaart omdat je daar dan relatief minder naar hoeft te kijken.
Beetje raar, performance testen met als insteek "hoe goed ondersteunt je compiler de CPU", en dan daar maar een universele Linux performance chart van maken....
Vooral als je bedenkt dat niet de CPU, maar het geheugen het belangrijkste is bij compilen van willekeurig wat. Hoe meer hoe beter.
't Enige verschil dat je hier kan zien is hoe goed de parallellisatie van het compilen gaat... en dat die geen 100% kan halen kan iedereen met een beetje parallel programmeren achtergrond je wel uitleggen.

edit:
gemodereerd? 't is toevallig wel ter ondersteuning van de post hierboven en die krijgt een +4 inzichtvol... ach ja, heb toch karma te over
Voor servers is m.i. de processor belangrijk, maar nog belangrijker is veel geheugen, liefst maximaal.
Toch mooi om te zien dat de Dual Athlon nu echt geschikt lijkt voor servers. Bijna een verdubbeling.

Valt me wel op dat de P4 het zo slecht doet want die is toch ook voor servers gemaakt.
Ze hebben geen Xeon 1,7GHz gebruikt. Dat zou op zich weinig verschil moeten maken op dit moment, maar daardoor ontbreekt nu ook een dual-Pentium 4 Xeon configuratie. Helaas kwam deze test ook te vroeg voor een dual-Pentium III-S (Tualatin) systeem. Die laatste zou geen moeite hoeven te hebben met een Athlon MP.
Hoevaak moet het nog verteld worden.. de P4 is niet voor servers. De p4 xeon is voor servers gemaakt.
en hoe vaak moet nog gezegd worden, de p4 xeon = p4 , maar dan met SMP en duurder en noggis nen anderen socket :p
Niet te vergeten de grotere cache, en dat merk je wl in de snelheid.
De test omvat een iewat ongebruikelijke set benchmarks, waaronder MySQL benchmarks
Dit is toch niet echt gek dat ze dit testen, aangezien heel veel linux servers hier toch voor bedoeld zijn niet dan?! Zo ongebruikelijk is dit dus niet. Ik vind het zelfs wel interessant
als je het standaard rijtje neemt van ziffdavis, sandra etc dan zijn m.u.v. q3a de benchmarks 'ongebruikelijk', maar er staat niet dat dat niet interessant is :)
ik zou wel eens wat cluster benchmarks willen zien, een 64x Athlon tegen een 64x P3T of P4. Voorals nog draait on 64x Alpha DS10 rackje prima.
Het heeft geen zin om zulke dingen te testen. 64 Athlons tegen 64 Pentium3's zal de zelfde verhouding geven als single processor, dus ik zie het nut er niet van.
Zet dan 64 Athlons tegenover 64 Alpha's ofzo, nou ja das ook niet helemaal eerlijk, maar goed, altijd nog interresanter dan wat jij voorsteld ;)
cluster is iets anders dan een dual proc moederbord
Daarnaast ben je meer aan het meten hoe goed de processen met elkaar comuniseren dan de brute rekenkracht. Je Bottleneck zit een aardig eind in de verbindingen tussen de verschillende onderdelen van je cluster. Een ietswat geoptimaliseerde driver voor een netwerkkaart kan dan een benchmark al helemaal scheef trekken, terwijl met elke andere kaart het beeld al totaal anders zou zijn.

* 786562 TheGhostInc
check www.top500.org eens. Er is kort geleden voor het eerst een AMD systeem in terecht gekomen. Intel bakken zijn er ook te vinden. Helaas voor beiden laat het lijstje ook zien dat de oplossingen met een PowerPC van IBM, een Sparc van Sun of een SGI het een stukje beter doen...

Neemt niet weg, dat een AMD of een Intel cluster voor de kleine portemonee best interessant kan zijn. Zal alleen niet zoveel te vinden zijn onder degenen die veel met cluster computing werken; univs zijn denk ik de enigen die 't echt zullen overwegen en gebruiken.
Had de UvA niet bij SARA een cluster staan van 96 Athlons ofzo?

Zal ff kijken of ik het ergens kan vinden, misschien zo ff linkje plaatsen...

edit:


Hmm, er is zo te zien inmiddels alweer vanalles veranderd, maar hier kan je alle informatie vinden die je er over wil weten :)
(petty obvious url misschien, maar toch)

http://www.sara.nl/beowulf/

Bedoel je niet toevallig dat cluster met 24 PPros dat onderdeel is van de Distributed ASCI Supercompu? Zie www.cs.vu.nl/das voor meer info en pics

SARA komt idd in die top500 voor, maar liefst 3 keer. Zijn echter 2x Origin en 1x Cray en die gebruiken (nog) geen Intel/AMD
De conclusie is zoals verwacht: Intel's P4 verslaat alle systemen in de gamebenchmarks, de AMD Athlon SMP configuratie neemt het voortouw in alle andere benchmarks.
en niet te vergeten: AMD's SMP platform lijkt nog niet perfect te zijn, heeft nog enkele problemen.
Als ik dit zo lees weet ik zeker dat ik de komende maanden nog geen dual athlon in een server zou gooien, als een single cpu ineens sneller is dan een dual (terwijl dat bij intel niet zo is, dus ligt het niet aan de software), dan vraag ik me toch af waarom je betaald voor een dual config...
jij beperkt je dus tot de Q3-scores ??
mij niet gelaten, maar als je zo mensen op ideen gaat brenge die eigelijk meer nut hebben aan al die andere scores heb je serieus stampe nodig

my2cents
<off-topic>
Aan mister X, dat wat jij opert wordt momenteel door IBM ontwikkeld in de Power4 CPU.
</off-topic>

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True