Hoofdcategorieën
Device Settings

Athlon 64 3200+ en Athlon 64 FX 51 versus P4 3,2GHz EE

Door Ralph Smeets, zondag 21 september 2003 23:31
Bron: x86-secret, submitter: EaS, views: 3.814

Aanstaande dinsdag zal AMD de Athlon 64 introduceren. Van deze processor komen er twee smaken, de Athlon 64 en de Athlon 64 FX. De eerste is uitgerust met een single-channel-geheugencontroller en de verschillende modellen worden met de inmiddels bekende PR-rating uit elkaar gehouden. De Athlon 64 FX daarentegen, is uitgerust met een dual-channel-geheugencontroller en om de verschillende modellen uit elkaar te houden, gebruikt AMD geen rating-systeem, maar gewoon een getal.

x86-secrets wist zich een Athlon 64 3200+ (2GHz), een Athlon 64 FX 51 (2,2Ghz) en een Intel Pentium 4 Extreme Edition (3,2GHz) te bemachtigen en vergeleek deze met verschillende andere processors. Alle processors werden getest op een moederbord dat dual-channel-geheugen ondersteunt, met als enige uitzondering de Athlon 64 die alleen maar single-channel-geheugen ondersteunt. Als geheugen werd er DDR400 geheugen gebruikt, maar ook hier waren er weer enkele uitzonderingen. De Athlon 64 FX en de Opteron maakten namelijk gebruik van DDR333-geheugen. Wees dus voorzichtig met het interpreteren van de resultaten, want zoals we op het forum van Real World Technologies kunnen lezen, presteert de Athlon 64 FX en de Opteron beduidend beter met DDR400-geheugen.

In de meeste synthetische tests weten de Pentium 4-processors het te winnen van die van AMD, met enkele uitzonderingen zoals Super Pi 1M waar de Athlon 64 FX de Pentium 4 EE nipt weet te verslaan. Hierna komen er enkele benchmarks aan bod die gebaseerd zijn op echte applicaties. Sommige, zoals bijvoorbeeld 3DStudio Max 5,1, zijn geoptimaliseerd voor de Pentium 4-processor en het is dan ook niet meer dan logisch dat deze benchmarks door de Pentium 4-processors worden gewonnen, met de Extreme Edition voorop. Maar in andere tests die niet geoptimaliseerd zijn voor de Pentium 4, zoals Pov-Ray 3.5, weten de AMD-processors, met de Athlon 64 FX 51 voorop, met gemak te winnen van hun Intel-tegenhangers.

Athlon 64 FX: 3D Studio Max

Om de 64-bits-functionaliteit van de AMD64-processors te testen, wordt er gebruik gemaakt van Minigzip en de 64-bits editie van Windows XP. Deze voor de Athlon 64 geoptimaliseerde benchmark wordt uiteraard met ruime voorsprong door beide Athlon 64-processors gewonnen. Als er echter alleen gekeken wordt naar de 32-bits resultaten, dan zijn de Intel-processors beduidend sneller dan die van AMD.

Als laatste worden er een aantal benchmarks van spelletjes gedraaid. Wat hier meteen opvalt zijn de goede prestaties van de Pentium 4 Extreme Edition. Het extra L3-cache blijkt dus zijn vruchten af te werpen. De Athlon 64 FX doet het ook niet slecht en blijft dicht in de buurt van de 3,2GHz Pentium 4.

Athlon 64 FX: Unreal Tournament 2003

Er wordt ook een poging gewaagd om de drie nieuwe processors over te klokken. De Athlon 64 3200+ komt niet verder dan 2,2GHz, een magere overklok van maar 10%. De Athlon 64 FX doet het niet beter, de CPU die normaal op 2,2GHz zijn werk doen, bleek niet verder te komen dan 2,4GHz. De 3,2GHz Pentium 4 Extreme Edition bleek maar tot 3,6GHz over te klokken. Hierbij verstookt het beestje maar liefst 150W, wat geen enkel probleem was voor het Asus P4C800 moederbord. De uiteindelijke conclusie is dat je tegenwoordig het beste een processor kunt kiezen aan de hand van de applicaties die je gaat draaien. Sommige doen het beter op een Intel en andere op een AMD:

Au final, bien que l'Athlon 64 3200+ soit plus une évolution qu'une révolution, il inaugure une nouvelle génération de processeur et surtout, un nouveau mode d'achat pour le consommateur. Révolu en effet le temps ou on choisissait un processeur pour ses performances. Bientôt, on choisira un processeur en fonction des applications qu'on désirera faire tourner dessus. Vous êtes joueur ? l'Athlon 64 3200+ peut vous convenir. Vous faite du rendu, de l'image ou de la 3D ? Tournez-vous vers un Pentium 4. La lecture des benchmarks sera donc très importantes pour comprendre l'Athlon 64. C'est pour cette raison que nous avons choisi une sélection de tests qui nous ont paru les plus appropriés à juger globalement du processeur. Nous en avons omis certains et gardé d'autre afin de maintenir une cohérence dans les résultats. A double tranchant, il est très facile d'écrire un test pro-AMD ou pro-Intel selon les benchmarks employés. La méfiance s'impose donc et c'est pour cette raison que nous ne noterons pas l'Athlon 64. La note, c'est vous même qui la déterminerez en fonction des résultats que vous venez de voir. Le but d'un média étant de fournir les éléments au lecteur lui permettant de prendre sa décision et non pas de prendre la décision à sa place.
Volgende 09:25 Luchtkastelen bouwen met nieuwe beeldprojectietechnieken
Vorige 22:49 Microsoft Broadband Networking Wireless-G review
Advertentie

Reacties

«  1  2  3  »

De uiteindelijke conclusie is dat je tegenwoordig het beste een processor kunt kiezen aan de hand van de applicaties die je gaat draaien. Sommige doen het beter op een Intel en andere op een AMD:
Niks nieuws onder de zon, das al jaren zo. En nu maar wachten totdat de xp 3000 in prijs gaat zakken die gaat mijn huidige 1400 :Y) :Y) vervangen.

En natuurlijk is het leuk om te weten dat de Athlons veel minder energie verbruiken bij dezelfde performance.

Die P4EE verbruikt op 3.6Ghz 150Watt, dat is toch niet meer mormaal?

Er wordt ook een poging gewaagd om de drie nieuwe processors over te klokken. De Athlon 64 3200+ komt niet verder dan 2,2GHz, een magere overklok van maar 10%. De Athlon 64 FX doet het niet beter, de CPU die normaal op 2,2GHz zijn werk doen, bleek niet verder te komen dan 2,4GHz. De 3,2GHz Pentium 4 Extreme Edition bleek maar liefst tot 3,6GHz over te klokken. Hierbij verstookt het beestje maar liefst 150W, wat geen enkel probleem was voor het Asus P4C800 moederbord.
A64 3200 2.0 => 2.2 = 10%
A64 FX51 2.2 => 2.4 = 9%
P43.2 EE 3.2 => 3.6 = 12.5%

Omdat nou een extreem verschil in overclocking te noemen?

tja, tegenwoordig zijn ze snel tevreden he
vroeger oc men soms 50% of meer, dan snap ik het nut ervan, maar met een oc van 10-15% is het zelfs niet de moeite om te beginnen vind ik

Als de overklok van de a64 3200 als basis genomen word dan is de overklok van de P4 EE 25% hoger.
In percentages hoog, in pratijk met de huidige modellen niet noemenswaardig :Y)

offtopic:
Je hebt wel een grote kans dat de xp3000+ niet op je moederbord werkt. Althans, mijn moederbord, waar nu een xp1600+ zit, gaat niet verder dan 2100+, ondanks de onveranderde socket A.

Zo te zien kan Intel nog steeds profiteren van de optimalisaties in professionele software terwijl in alles wat all-round is zoals games de Athlon 64 evenals de Opteron geduchte concurrentie is.
Als Intel en AMD nu geen prijsafspraken gaan maken kunnen we binnekort goedkoper kopen dan nu het geval is.

Als geheugen werd er DDR400 geheugen gebruikt, maar ook hier waren er weer enkele uitzonderingen. De Athlon 64 FX en de Opteron maakten namelijk gebruik van DDR333-geheugen. Wees dus voorzichtig met het interpreteren van de resultaten, want zoals we op het forum van Real World Technologies kunnen lezen, presteert de Athlon 64 FX en de Opteron beduidend beter met DDR400-geheugen.
mja daar gaan we alweer.

verschillend geheugen.

WAAROM!!!!!!!!!!!!.

als je een benchmark draait. doe het dan eerlijk.

aangezien benches al niet te vertrouwen zijn. en dan scheppen ze hier al helemaa geen vertrouwens band mee.
ik snap het niet hoor. ik vind dat ALS je zoiets wilt doen. houd dan wel rekening met het feit dat je moet VERGELIJKEN. en NIET VOORTREKKEN. want daar komt het simpelweg op neer. je gaat een formule 1 race toch ook niet van het ene team eerst low quality banden laten aanmeten. en er dan zelf met goeie vertrekken.

bevestigt het weer. je heb statistieken leugens en je hebt benchmarks ;)

De Athlon 64 FX heeft helaas registered geheugen nodig (registered is duurder en trager). Kennelijk kon x86-secret kon geen registered DDR400-geheugen bemachtigen. Het bestaat wel maar is nog moeilijk verkrijgbaar.

Het is nog even wachten tot dinsdag voortdat we benchmarks zullen zien van beter betrouwbare sites zoals Ace's Hardware, AnandTech, GamePC en dergelijke.

De Athlon 64 FX heeft helaas registered geheugen nodig (registered is duurder en trager)
ik hoop dat ze snel die echte athlon 64 FX lancheren, die waar je geen registerd geheugen nodig hebt, dat het is niet alleen stukken moeilijker te krijgen als unregisted maar het vertraagt ook nog een hoop.

ik vind dat nog steeds geen reden om niet hetzelfde geheugen te gebruiken, dan maar allemaal aan de ddr333 reg geheugen.

we gaat er now een p4 EE kopen en er dan ddr 333 geheugen naast zetten? dat zou dus ook geen eerlijke test zijn, + dan zouden veel tests geheugen limited zijn. wat natuurlijk ook niet de bedoeling is.

ik watch wel fff op de tests van anand tech (temiste ik geloof dat het anadtech was). die hadden het groots aangepakt met alles erop en eraan.
maarja die mag niet voor dinsdags gepulisheerd worden

Jah , en wie gaat er dan zo'n Athlon FX kopen met slechts ddr333, die kant van het mes snijdt even goed hoor.

registered is NIET trager.
het houdt in dat er een extra bitje mee wordt verzonden voor parity check: minder fouten bij data overdracht.
en dus minder crashes.

Registered is heel wat anders hoor! Jij hebt t nu over ECC.

Registered wil zeggen dat de addressering niet door de geheugencontroller wordt gedaan, maar door een chipje op de dimm zelf.

Sorry, maar ECC is voor Error checking.

Nope, dit staat voor:
Error-Correcting Code memory

Volgens Digit Life heeft de Opteron 1,4GHz een 20 procent hogere geheugenlatency dan de Athlon 64. Dit verschil zou veroorzaakt worden door het gebruik van registered geheugen.

(ook @rjvromans)

Het is wel zo dat "registred memory" vaak van ECC is voorzien, wat hier ook het geval is:
Requirant exclusivement de la mémoire DDR de type Registered ECC, l'Athlon FX 51 se comporte comme un hypothétique Opteron 148 auquel il reprend le Socket 940.
Het geheugen is dus wel degelijk trager dan gewone DDR333, en dus zeker stukken trager dan DDR400...

Als ik het goed heb is registered RAM niet trager maar juist sneller. Registered RAM hoeft als het ware maar één keer hadjeklap met de processor te doen (namelijk als de PC opstart), terwijl gewoon RAM dat iedere keer doet dat de processor contact heeft met het geheugen moet doen.

ECC geheugen is wel trager, vanwege de Erroc Checking.

edit: Dope -e wist het precies

Error checking is niet langzamer dan gewoon mem, het is even snel, alleen als er corectie toegepast wordt is er een kleine dip, maar goed, dat is beter dan een crash

http://gathering.tweakers.net/forum/list_message/17984625#ecc

/edit
faq erbij gezocht, of er moet inmiddels iets veranderd zijn...
/edit

mmm ik las laasts juist dat het de boel met 10% of meer vertraagde.

EN als je daar alllemaal rekening mee houdt.
Zie je dat er nog een behooorlijk % winst nog tebehalen met beter samegestelt systeem.

AMD IS eigelijk gewoon de winnaar of zal dat zeker worden.

Hou er ook rekening mee dat die P4 EE eigenlijk een theoretische CPU is. Ze zullen er nooit erg veel van (kunnen) produceren, terwijl de Athlon FX wel in de massaproductie zit...
Die P4 3,2GHz EE kan mss wel een indicatie zijn voor de prestaties van een 3,4GHz prescott, dus in die zin is deze bench wel interessant

Eigenlijk moet je de Athlon FX dan gaan vergelijken met de gewone P4 en dan merken we dat de Athlon FX heer en meester is over gameland (de verouderde benchmark Quake3 uitgezonderd).

Verder zal er ook meer en meer ondersteuning voor 64bit komen, waardoor de prestaties van de Athlon 64 alleen maar kunnen verbeteren... :Y)

* 786562 Durona

Hou er ook rekening mee dat die P4 EE eigenlijk een theoretische CPU is. Ze zullen er nooit erg veel van (kunnen) produceren
Erg leuke informatie, maar heb je hier ook een bron voor? :Z

De P4 EE is gebaseerd op de P4-Xeon core en die wordt gewoon an masse geproduceerd. Sterker nog het is eigenlijk gewoon een P4 met extra L3 cache. Er is dus wat mij betreft totaal niets wat Intel zou tegenhouden de EE in grote aantallen op de markt te brengen.

Totdat je met een betrouwbare bron komt denk ik zodoende dat we deze informatie kunnen afdoen als een broodje aap verhaal ;)

<Edit>Overbodig!? :(

@Cheetah

De bron is mijn hersenen...
Denk nou eens logisch met mij na:
Sterker nog het is eigenlijk gewoon een P4 met extra L3 cache
Je slaat de nagel op de kop... Extra L3 cache betekent immers meer kans op productiefouten, waardoor de yields erg laag gaan liggen. Die Cache moet dan ook nog op een hoge snelheid (3,2GHz/3,4GHz) draaien. :+
Hoogstwaarschijnlijk zouden enkel de chips die uit de kern van het Si gehaald worden voldoen...

Je vergelijkt verder de P4 EE ook met een Xeon. Ok, de cores zijn erg gelijkend maar het grote verschil tss de 2 CPUs is dat de Xeon met 2MB cache slechts een FSB heeft van 400MHz (4*100) terwijl deze bij de P4 EE tot 800MHz (4*200) opgedreven is.
Dus van de Xeons waarbij de cache al gelukt is, vallen er nog een hoop af omdat ze de FSB niet aankunnen. ;(

tomshardware@Xeonreview

Verder wil ik het ook nog hebben over de prijs van dit beestje met een quote van oom Tom over de Xeons: :'(
The version with the L3 cache costs $690 and is comparatively inexpensive, as the top-model Xeon MP with a 2-MB L3 cache and 2.8 GHz costs $3692.
Aannemend dat een Xeon MP wel meer zal kosten dan een P4 EE en dat hun productietechnieken intss verbeterd zijn, zal deze mss $1000 minder kosten. Dan zou die nog $2690 kosten!

Ik hoop dat ik met de hierboven neergeschreven hersenspinsels heb duidelijk gemaakt dat het wel degelijk om een "paperlaunch" gaat. Wie wil nu duizenden $s leggen voor een CPU :?

Again @Durona:
Extra L3 cache betekent immers meer kans op productiefouten, waardoor de yields erg laag gaan liggen. Die Cache moet dan ook nog op een hoge snelheid (3,2GHz/3,4GHz) draaien.
Ik stel voor dat je je feitelijke informatie gaat checken voor je opnieuw niet kloppende beweringen loopt te doen... L3 cache loopt helemaal niet op dezelfde snelheid als de CPU. L1 cache loopt op dezelfde snelheid als de CPU, L2 cache loopt op de helft van de snelheid, en als ik me niet vergis loopt L3 cache slechts op 1/4 van de snelheid van de CPU.
Geen enkel probleem dus...

Verder gelden deze yield "problemen" vanwege de cache even hard voor de Athlon FX die bijna even veel cache heeft, dus dit hele argument is niet van toepassing! :Z
Aannemend dat een Xeon MP wel meer zal kosten dan een P4 EE en dat hun productietechnieken intss verbeterd zijn, zal deze mss $1000 minder kosten. Dan zou die nog $2690 kosten!
Ik hoop dat ik met de hierboven neergeschreven hersenspinsels heb duidelijk gemaakt dat het wel degelijk om een "paperlaunch" gaat. Wie wil nu duizenden $s leggen voor een CPU
Weeeeeeer een broodje aap verhaal. Ga a.j.b. feiten checken voor je dit soort onzin loopt te posten.
Het idee dat een consumentenprocessor $2690 moet opbrengen sowieso al bespottelijk. Vooral als die moet concurreren met een processor van rond de $650.

Als je de boel een beetje had bijgehouden was je het volgende al lang tegengekomen (betreffende de 3.2Ghz EE:
De prijs wordt volgens AnandTech ongeveer 740 dollar
Feitelijke Bron, in tegenstelling tot de "bron" in jouw "hersenen".

Om kort te gaan: Ik hoop dat ik hierboven duidelijk gemaakt heb dat het handig is te weten waar je het over hebt voor je sterke beweringen loopt te doen! ;)

L1 cache loopt op dezelfde snelheid als de CPU, L2 cache loopt op de helft van de snelheid, en als ik me niet vergis loopt L3 cache slechts op 1/4 van de snelheid van de CPU.
-> Volgens Tomshardware is dit echter anders:
het verschil tss L1-, L2- en L3-cache zit hem in het verschil tss. de latencies.
http://www6.tomshardware.com/cpu/20030811/dual_xeon-02.html

Ofwel gaat het hier om een verschil van interpretatie, maar Tom lijkt het te hebben over 3 cache levels die op processorsnelheid werken... :?
In order to avoid dropping behind, Intel reacted by pumping the current Xeon up with an additional L3 cache. The result is three cache levels that all work at full processing speed.
http://www6.tomshardware.com/cpu/20030811/index.html

-> Verder vond ik ook nog ergens op google (site was helaas niet toegankelijk, dus geen bron :+) dat de L3-cache meestal op de dubbele snelheid van de FSB werkt...
Nou, ik weet het niet meer.. :?

* 786562 Durona
-> edit: iets vergeten |:(
de Athlon FX die bijna even veel cache heeft
Heeft de Athlon 64 wel L3-cache? Volgens mij beschikt die maar over 1MB L2- en dan nog 128KB L1-cache. Dat is toch een verschil van meer dan 1MB en dat scheelt veel in yields.
Het idee dat een consumentenprocessor $2690 moet opbrengen sowieso al bespottelijk.
Jip, daarom leek het me juist een paper launch te zijn. Dit is dan wel een mooie aanduiding van de winstmarge die Intel heeft op de Xeon en op de P4 EE.

De Athlon 64 3200+ komt niet verder dan 2,2GHz, een magere overklok van maar 10%.
De 3,2GHz Pentium 4 Extreme Edition bleek maar liefst tot 3,6GHz over te klokken.
Mag ik je erop wijzen dat 3,2GHz --> 3,6GHz ook maar een 'magere' 12,5% is :)
Niet blindstaren op de MHz'en! :P

Overigens haalt men op het Tbreak.com forum een aanmerkelijk betere overklok. Namelijk: 2,4GHz op lucht.

Zie op tbreak ook de 3dmark 2001 score van de Athlon64 i.c.m. phase-change en een Radeon 9800pro: 26336 (hoogste 3dmark 2001 score ooit) :)

De AMD's hebben wel een beetje voordeel in dit vergelijk doordat de '3,2GHz Pentium 4 Extreme Edition' niet fsb en mem wordt overklokt:

Pentium 4 3.2 Ghz 'Extreme Edition'
Maximum : 3600 Mhz (18x200)

Athlon 64 FX-51 (2.2 Ghz)
Maximum : 2400 Mhz (11x218)

Overclocking de l'Athlon 64 3200+ (2.0 Ghz) Maximum : 2200 Mhz (10x220)

Ikzelf vraag me af wat een die p4 zou doen op met 13x 275fsb= 3575Mhz en dan 220mem met 5:4... :9

//
@-EaS-:
Ik wist dat niet maar hoe dan ook het maakt het vergelijk niet eerlijker.

@blade181
Ik denk idd dat enkel processoren vergelijken niet zo veel zin heeft. Eerder een vergelijk van een Intelset tegen een Amdset, beiden samengesteld van goed verkrijgbare onderdelen.

De AMD's hebben wel een beetje voordeel in dit vergelijk doordat de '3,2GHz Pentium 4 Extreme Edition' niet fsb en mem wordt overklokt
Het geheugen op de Hammer heeft een eigen multiplier. Kijk maar eens in deze techdoc van AMD op pagina 17.

Daar zul je zien dat DDR-333 bij 2,2 GHz Athlon FX standaard op 157,14 MHz draait i.p.v. 166 MHz.

Bij die overklok naar 2400 MHz word het geheugen dus maar overgeklokt naar 171,4 MHz..... bij lange na geen 218 MHz......zelfs niet eens in de buurt van de standaard 200 MHz van de P4 !!!

Over invloed van de FSB gesproken !

Tja en dan wat nog, processors vergelijken op gebied van overclokken heeft geen zin, de ene kan misschien hoger geklokt worden maar dat hoeft verder nog niet zoveel invloed op de prestatie van de onderlingen vergeleken processors..!

en dan 220mem met 5:4...
geheugen ongelijk laten lopen tenopzichte van de frontbus werkt zeer vertragend, en is dus sterk af te raden.

dat geld voor amd's ,bij intel's moet je wel als je zeg 260 fsb wil draaien :)

Ik hoop voor AMD dat ze eindelijk met deze CPU een beetje uit de rode kunnen komen, dan blijft er in ieder geval concurrentie. IMO lijkt AMD aardig goed op weg, welliswaar CPU's met jaar vertraging maar hun achterstand zijn ze ingelopen

Dit is eindelijk info waar ik wat mee kan :D

Intel is gewoon beter op 32 bit applicaties en omdat de spellen nog zeker 3 jaar op 32 bit gemaakt zullen worden word me volgende proc waarschijnlijk de p4 3,2 EE.

Ik denk ook niet dat mensen snel over zullen stappen op win xp 64 of longhorn als ze geen 64 bit proc hebben. Dus ik vraag me af of het een succes word (lees een succes is het als mensen het gaan kopen en dan niet omdat er niks anders is zoals het te verwachten is over 4 jaar).

hebben wij de zelfde review gelezen?
wat ik er uit op maak is dat de p4 alleen beter presteert in 3d studio max en dan alleen in 1 benchmark daarvan, zelfs bij media encoding heeft loopt de FX flink in.
voor de rest ontloopt het elkaar niet zo veel of doet de FX het beter (ondanks het 333mhz geheugen)

word me volgende proc waarschijnlijk de p4 3,2 EE.]
1) hij
word
is nog altijd met dt

2) De P4 EE zal hoogstwaarschijnlijk nooit echt verkrijgbaar zijn. Noem het een papieren launch. Ze zullen er immers nooit hoge yields mee halen. Als je toch aan 1 geraakt, zal je waarschijnlijk voor dezelfste prijs een Opteron 248 te pakken kunnen krijgen |:(.

3) In games wordt de P4 EE toch nog voorbijgestreefd door de Athlon FX, synthetische benchmarks hebben geen waarde en qua software hebben beide CPUs hun eigen optimalisaties.

:) hm... volgend jaar meschien maar (weer) upgraden dan? Weer rapper game-systeempje in elkaar bakken. Als die gpu-bakkers nou ok ns wat meer peper langs dr kringspier wrijven, dan wordt het misschien nog wel een keer leuk.

de athlon 64 fx 51 blijkt in elk geval nog registered DDR nodig te hebben. dit zal ddr 400 geheugen aanzienlijk duurder maken dan ddr 400 geheugen voor de Intel Pentium 4 3,2 Extreme Edition.
Sommige, zoals bijvoorbeeld 3DStudio Max 5,1, zijn geoptimaliseerd voor de Pentium 4-processor en het is dan ook niet meer dan logisch dat deze benchmarks door de Pentium 4-processors worden gewonnen, met de Extreme Edition voorop.
dit lijkt me onzin want zowel de Intel Pentium 4 3.2 Extreme Edition als de amd athlon 64 fx zijn SSE2/SSE/MMX capabele processoren.
edit:
@carnman
ik denk dat dat wishfull thinking is. de SSE2 implementatie van AMD is precies gelijk aan de SSE2 implementatie van Intel. het is onder licentie van Intel door amd ontwikkeld.

verder is er ook geen rekening gehouden in de "P4 geoptimaliseerde" binaries met de grote L3 cache van de Pentium 4 3,2 Extreme Edition. dus ik denk dat de bestaande ia32 codebase nog niet optimaal is voor de P4EE. de P4EE kan dus nog winst boeken in dit opzicht.
edit:
@agignor
als jij mij kunt overtuigen van verschillen in het programmeermodel tussen twee identieke instructiesets (namelijk SSE2) dan ben jij de man! :)

het kan natuurlijk zijn dat de silicon SSE2 implementatie van Intel performanter is dan die van amd. maar dat trek je niet recht met assembler/compiler truuks helaas.

verder maakt de grote L3 cache wel degelijk heel veel uit als je grote blokken data aan het processen bent. dus de P4EE kan hier dankzij optimalisaties op algorithme nivo zeker nog winst halen.
edit:
"geoptimaliseerd voor de pentium 4 processor" betekent gewoon dat de compiler gebruik maakt van sse2 instructies. dus amd64 processoren profiteren ook van deze optimalisatie. ik denk dat er met specifieke (nogal mysterieuze!) optimalisaties voor de "sse2 smaak" voor amd64 processoren geen voordeel te halen is tov van de intel standaard sse2 optimalisaties.

code gecompiled voor een bepaalde processor zal altijd sneller zijn op die processor dan op een vergelijkbare concurerende processor, dat is gewoon zo, zelfs al ondersteunen te twee processors SSE2 enz

juist.
1 van de reden hiervoor is omdat de SSE2 van AMD anders is als die van Intel, dat moet ok wel omdat die van AMD even veel werk moet doen met zo'n 33% minder mhz.
gebruik maken van SSE2 is niet het zelfde als optimalizeren voor SSE2 op de p4.
vooral in 3dmax is dat laaste veel gebeurt, nu maar hopen dat ze in hun volgende versies ook AMD optimalizaties in zetten.

Camnan heeft wel een punt. Het gaat nml. niet alleen welke/of een cpu features ondersteunt. Die compilers zorgen ervoor dat de "workload" zo efficient mogelijk word verdeeld over de pipelines en processen. De architectuur van de chip speelt hier een belangrijke rol....
3D Studio Max is al zwaar geoptimaliseert voor de P-IV's , juist daar verwacht ik minder winst dan bij andere software. Omdat het al zo efficient gebeurt nml.
L3-cache helpt dan wel, maar dan maar een beetje.

he, vergeet ik weer es punten uit te delen :+
bij deze, bierbuik -1 , carman +1

Bierbuik; het gaat niet om het programmeermodel, maar hoe het verwerkt word op de core...
zoals jij het stelt zou een door Intel gemaakte compiler het net zo goed doen met de Athlon's als met de P-IV's . Ze ondersteunen toch beide SSE2 :?
Lijkt me niet juist. Wat je zegt
P4EE kan hier dankzij optimalisaties op algorithme nivo
; is dit niet precies wat compilers ook doen ?

Verder zeg je
verder maakt de grote L3 cache wel degelijk heel veel uit als je grote blokken data aan het processen bent. dus de P4EE kan hier dankzij optimalisaties op algorithme nivo zeker nog winst halen.
Wel, ze zitten nu onder de 1% als je naar deze 3D-studio test kijkt. Dus het L3-cache lijkt wel werkloos aanwezig, het had netzogoed binnen de marge van de bench hetzelfde kunnen zijn. Dat er winst te halen is zou je idd. denken , maar hoeveel dan wel ?

[countess & bierbuik]
SSE2 = SSE2. De instructiesets zijn hetzelfde, voor AMD en Intel. Alleen de architectuur van de core verschillen wezenlijk, waar de Intel Diepe, lange pipe-lines heeft en de AMD kortere. Er zijn nog veel meer veschillen, zoals het aantal Integer en FPU-units, prediction-cache etc.etc.

Een compiler speciaal geschreven voor de ene cpu(zoals die van intel) zal beter presteren met die CPU dan met een ander ontwerp. Juist omdat de compiler ervoor zorgt dat er per kloktik zoveel mogelijk van de processor-kracht benut word. Dit gaat dus verder dan alleen SSE2. Niet voor niets heeft Intel bijv. van de P-IV een "semi-dual" chip gemaakt, omdat er nog steeds per kloktik "processor-kracht" verloren ging. Zo kan je met een uitgekiende compiler (en andere cpu-optimalisaties) nog meer winst halen uit je ontwerp.

dit lijkt me onzin want zowel de Intel Pentium 4 3.2 Extreme Edition als de amd athlon 64 fx zijn SSE2/SSE/MMX capabele processoren.

Een tijd geleden toen de eerste Athlon MP op de markt verscheen bleken sommige programma's de aanwezige SSE instructies van deze processor gewoonweg te negeren. Deze programma's keken niet of het "SSE bitje" true was, maar keken gewoon of het een Intel processor was of niet. Het heeft op Tweakers.net gestaan, maar ik kan het artikel zo snel niet meer vinden.

Wat ik hier mee wil zeggen is dat al ondersteunt een processor een bepaalde techniek en het programma heeft de mogelijkheid om deze techniek te gebruiken, dan nog zegt het niets over of het ook écht gebruikt wordt! Helaas is dan niet zo makkelijk te controleren.

Dus het kan best zijn dat SSE2 gewoonweg niet gebruikt wordt als je een AMD64 CPU hebt.

Hmm... toch wel boeiend die Athlon 64... hoop dat AMD nu eindelijk eens een beetje doorkomt... kzit net zelf te denken om eens te investeren in een Dual Xeon, Dual Opteron of misschien een Athlon 64.... vraag me af wat het snelste is met mijn CAD, beeld/geluidbewerking en software-ontwikkelen...
En welke chipset is nu eigenlijk het snelst voor de Athlons? nVidia heeft al een nForce, via de nodige K8T's (400M, 800, en wat was er nog meer?), en dan houden we nog de AMD 8131 over.. kon daar nergens goeie benchmarks van vinden!


Maar volgens mij werkt het feit dat AMD langere branches heeft (en dus per definitie een slechtere branchprediction) die snelheidswinst aardig tegen.
En daarbij zijn de grote CAD pakketten geoptimaliseerd voor Intel (jaja, SolidEdge/Works gaan een voor AMD optimalisatie...maar dat zijn niet echt goede pakketten).

intel heeft juist die langere branches. en daarom is een branchpredictor waar je u tegen zegt nodig, met de daarbij behorende grote honger naar geheugen bandbreedte.

De branch penalty op de P4 is minimaal 20 cycles, maar gemiddeld iets van 40 cycles.

Op de opteron is het geheim, maar ik gok dat de branch predictie minimaal zo'n 12 cycles is en maximaal zo'n 20.

De opteron heeft een massief groot aantal branch predictors. Ongeveer 16384. Dat is *enorm* veel. Nog maar een paar jaar geleden had de P2/klamath er 512. De K7 kwam daar ruim overheen met 2048 entries. Dat nu op te trekken naar 16384 in de opteron is geniaal.

Echter de opteron heeft dus ook nog geniale branchpredictie. Dat demonstreert het volgende testje wel:

Het genereren van 64 bits random nummers, iets wat in bijna alle wetenschappelijke programma's gedaan wordt. Gebruik wordt gemaakt van een speciaal geoptimaliseerde versie van Agner Fog's ranrot:

De snelheid ervan op de opteron 1.8Ghz is:
So 1 RNG call takes 3.348389 nanoseconds

De snelheid ervan op itanium2 1.3Ghz is:
So 1 RNG call takes 9.279785 nanoseconds

De snelheid ervan op de K7 2.127Ghz is:
So 1 RNG call takes 13.237305 nanoseconds

Als je kijkt naar de generator zelf, dan zie je dat er eigenlijk maar 2 branches zijn en die werden met de betreffende compiler (gcc) NIET naar P6 code geoptimaliseerd op de K7, laat staan 64 bits gcc op de opteron of itanium:

FORCEINLINE BITBOARD rotl(BITBOARD x,int r) {return(x<<r)|(x>&gt ;(64-r));}

/* returns a random number of 64 bits unsigned */
FORCEINLINE BITBOARD RanrotA(void) {
/* generate next random number */
BITBOARD x = randbuffer[r_p1] = rotl(randbuffer[r_p2],R1) + rotl(randbuffer[r_p1], R2);
/* rotate list pointers */
if( --r_p1 < 0)
r_p1 = KK - 1;
if( --r_p2 < 0 )
r_p2 = KK - 1;
return x;
}

MVG

Het feit dat de Athlon64 FX registered geheugen nodig heeft legt wel weer een smet op de cpu. Met ddr400 zou ten eerste veel sneller zijn, en registered geheugen is harstikke duur. Ik was vastgebrand een athlon64fx te gaan kopen, maar dit word me wel erg duur zo hoor...

en ik denk dat meer mensen het zo zullen ervaren. AMD doet hier dus niet goed aan. Het feit dat er dadelijk ook nog andere Athlon64fx's komen op een 939 socket is niet fijn. Kan je dus niet je mobo houden :(

Die socket 939 versie is volgens mij wel weer gewoon normal non-registered geheugen, dus dat is wel goed, maar daar moeten we weer tot januari ofzo op wachten.

Ik vind het dus niet zo'n slimme zet van AMD om dit zo te doen, maar ze zullen wel niet genoeg tijd hebben gehad ofzo :(

later komt er een FX versie die geen registed DDR nodig heeft, maar die had AMD later geplaned,
ze kwamen er te laat achter dat de wereld een dual channel CPU wilden, en wel NU! (dit natuurlijk na het net uitkomen van de eerst dual channel ddr chipset voor de p4)
dus hebben ze de optron cores gebruikt en ze ge-repackaged.

ja ik zit in het zelfde schuitje, ik wil graag een fx, maar ddr400 rigst. is amper te vinden, in NL volgens mij helemaal (nog) niet.

De 64fx is precies wat ik wil, pure performance in 3d games, door zijn superieure fl.point, wanneer je het het hardst nodig heb in heavy momenten, die dus cpu-limited zijn.

Waarom nou niet gelijk die 939 met Dual DDR400 ;(

omdat ze niet wisten dat de vraag ernaar meteen al zo groot zou zijn.
«  1  2  3  »

Op dit item kan niet meer gereageerd worden.

Volgende 09:25 Luchtkastelen bouwen met nieuwe beeldprojectietechnieken
Vorige 22:49 Microsoft Broadband Networking Wireless-G review
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011