Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 49 reacties
Bron: Tom's Hardware

Tom heeft voor de derde keer in een week een stuk over de Pentium 4 gepost. De eerste review had een vrij neutrale conclusie, maar in een update veranderde Tom's mening ineens drastisch omdat bleek dat de FPU van de processor veel te wensen overliet. In deze tweede update stelt hij echter zijn mening weer bij. Tom heeft namelijk van Intel een speciaal voor de Pentium 4 geoptimaliseerde versie van FlaskMPEG gekregen, die naast een enorme boost voor de P4 ook voor Pentium 3 en zelfs voor de Althon een zeer positief effect had op de performance. Een nieuwe versie van de Intel compiler en een paar SSE2 optimalizaties zorgen voor dit effect:

Tom\'s Hardware MPEG4 (na recompile)


FlaskMPEG Pentium 4 benchmarks (SSE2 optimalisaties)


If the situation with FlasK MPEG should be exemplary for Pentium 4's performance - and why shouldn't it? - then it really counts on the software industry to at least re-compile their applications to make Pentium 4 look a whole lot better. Once that's done Pentium 4 has a good chance to become a success even at its current clock speeds.

Of course this is easier said than done. Which software maker would supply its customers with a new and free version of its product, although it only took a re-compilation? Which software maker will even bother to do that for the time being? After all Pentium 4 systems are very expensive and thus not exactly widely spread. We know that Intel has a very forceful way of 'convincing' other industries to follow them. We will see how much power Intel has right now. For the time being Intel is in the same situation AMD used to be with K6-2 and 3D Now! Without proper support of the software industry it will be hard to make a product such as Pentium 4 successful. Let's not feel too sorry for Intel however. It is in a lot better situation than AMD used to be.

Johan Van de Wauw, tnx voor je tip.

Moderatie-faq Wijzig weergave

Reacties (49)

Ik vind dat hele gedoe zinloos en oneerlijk. Waarom SSE2 niet tegen over 3DNow Testen ??? Dat is pas eerlijk, in sisoft sandra zie je dat SSE2 3DNow op gelijke Mhz niet kan verslaan.

Eerlijker zou zijn om FPU vs FPU te testen en 3DNow! enhanced vs SSE2. Zonder SSE2 is de P4 nergens, zonder 3DNow! enhanced blijft de Athlon goed presteren met 300Mhz minder.

Gelijke optimalisaties vind je nooit, voor intel wordt alles gunstig geoptimaliseert, (noemen ze "cheaten") voor anderen zie je zelden optimalisaties.

Waarom cheaten ? zo'n benchmark laat alleen maar zien dat je persee dat moet gebruiken want een andere programma (zonder optimalisaties) presteert niet goed. Dus wordt je beperkt tot alleen de software met SSE2 ondersteuning.( zullen wel meer worden later, maar toch.)

Realworld apps, hebben niet altijd of allemaal optimale SSE ondersteuning. Ik ken alleen photoshop en een of andere intel mpeg gedoe die volledig SSE(2) geoptimaliseert zijn de rest is minder optimized. Dus pas als ze ook 3DNow! enhanced mee gaan tellen in de scores vind ik het eerlijk, anders is het gewoon cheaten. Misleiden. beter uit laten zien dat het werkelijk is, want er zijn meer software zonder zware optimalisaties dan software met optimalisaties.

ja sorry zo denk ik erover, SSE dit SSE dat terwijl er ook andere dingen zijn die mee tellen.
De P4 heeft nu eenmaal SSE2, speciaal voor dit soort situaties. De SSE2 instructieset IS juist een voordeel voor de P4. Pure x86 instructieset executie is niet interessant, daar de extra instructiesets (MMX, 3Dnow, SSE(2)) juist dat beetje extra geven wat een processor boven de concurrentie uit laat stijgen.

Ik geloof trouwens niet dat 3D now veel bijdraagt aan MPEG4.
3DNow! enhanced is zoals de naam suggereert niet alleen puur voor 3D bedoeld.

SSE2 is zoals ik begrepen heb een vervanger voor x87FPU 3DNow net zo, bijde zijn SIMD behalve dat Athlons nog steeds een sterke FPU hebben voor waar het nodig is. (unoptimized software)
Pure x86 instructieset executie is niet interessant, daar de extra instructiesets (MMX, 3Dnow, SSE(2)) juist dat beetje extra geven wat een processor boven de concurrentie uit laat stijgen
En juist hier gaat het om, is FlasK optimized voor de Athlon of 3DNow ? Nee, dus is de benchmark ongeldig in mijn ogen. Als je vindt dat x86 instructies niet interessant zijn dan moet je ook voor andere cpu's optimalisaties aanbrengen anders heb je ook geen eerlijke concurentie en is je benchmark biassed. 3DMark met SSE en 3DNow laat ook een heel ander beeld zien. Sisoft Sandra net zo.

RC5.. optimized voor Athlon ook een heel ander beeld. Daar gaat het om, het gaat om het feit dat je een "optimized" software test voor de P4 en dus oneerlijk omdat ie niet optimized is voor de andere cpu's. Als je per cpu de boel gaat optimaliseren dan zou het eerlijker zijn. Dan maakt het mij ook niet uit wie sneller is. Dat is alles.. dat andere verhaal is wel leuk en markt technisch ook perfect, maar is en blijft biassed.

Kijk es op aceshardware forum en lees je beter waar het om gaat. In de zin van SSE2 ondersteuning moet nog komen, dus het is niet vanzelf sprekend dat straks alle programma's SSE2 gaan ondersteunen. Men gaan hier van uit, en daardoor schep je een verkeerd beeld. m.a.w. koop nu en wacht op later, of het komt weten we niet maar waarschijnlijk wel.

Mijn vorige reactie ging puur om het feit dat je de een wel optimaliseert en de ander niet, zo win je toch altijd ? Of zie ik het verkeerd?

Volgens een artikel die ik gelezen heb ( SSE vs 3DNow) is naar voren gekomen dat volledige 3DNow optimalisatie een vette performace boost zou betekenen, beter dan SSE. Maar helaas, de kleine heeft minder support gekregen.

Update: lees reactie hieronder.
Ik geloof trouwens niet dat 3D now veel bijdraagt aan MPEG4.
Nou ik geloof het dus wel, sterker nog het is bewezen. Ooit es in 3DNow! enhanced verdiept ? Is wel minder bekend dan SSE2. Maar net zoals ik waren er meer mensen die het oneerlijk vonden. Dus hebben ze FlasK ook voor de Athlons geoptimaliseert.. Er zijn nog geen benchmarks van een Athlon 1,2Ghz 266 maar die komen eraan.

Maar dit moet een idee geven wat je dan kan verwachten :
original x87 3.10 fps
optimized x87 7.25 fps
3dNow! 8.13 fps
With the Athlon optimized version of FlasK the Athlon improved in performance by 262 %
Kijk dit vind ik nou 100% eerlijk en krijg je ook geen vertekend beeld :) Al is de P4 sneller dan wie dan ook, doet er niet toe. Het gaat erom dat voor beide cpu's optimized code wordt gebruikt. Ik ben benieuwd naar de 1,2Ghz/266 resultaten in vergelijking met de P4 1,4Ghz.

Ik hoop dat je mijn standpunt nu wat beter begrijpt.
Voor meer details en stand van zaken :

www.amdzone.com/flask.cfm
Wat mij opvalt is dat het re-compilen ook voor verbetering zorgt op de PIII en de Athlon. We halen dus ook nog steeds niet het uiterste uit de huidige processoren!
Maak van de huidige processoren maar gewoon Flask.
Een stukje software is herschreven, je krijgt nu echt geen hoger frame-rate bij je spellen :9


* 786562 TheGhostInc
Tja, het is natuurlijk niet meer dan normaal dat de div. applicaties eerst gerecompiled en geoptimaliseerd dienen te worden. Nu worden de nieuwe troeven in de P4 niet gebruikt en ziet de proc er uit als een veredelde P3. Eindelijk is er dus eens een representatieve test voor deze proc. Ik verwacht dat de P4 zelfs veel beter gaat scoren op het moment dat de mobo's er ook voor geoptimaliseerd zijn. (memory,bus etc.)
"Use the source Luke!"
Which software maker would supply its customers with a new and free version of its product, although it only took a re-compilation?
bij open source is dit standaard business, als jij Pentuim 4 optimisatie wil, dan krijg je dat! De klant is koning, hij kan immers kiezen uit veel leveranciers die het zelfde product supporten.

Het zou mij niks verbazen als Mandrake straks met een P4 geoptimaliseerde Linux distro komt.
Bij open source is dit standaard business, als jij Pentuim 4 optimisatie wil, dan krijg je dat! De klant is koning, hij kan immers kiezen uit veel leveranciers die het zelfde product supporten.
In theorie wel ja, maar de praktijk is anders. Er is maar een echte open source compiler en dat is gcc. Die is niet geoptimaliseerd op performance, maar op compatibiliteit en portabiliteit (daarmee is het geen `slechte' compiler!).
Het zou mij niks verbazen als Mandrake straks met een P4 geoptimaliseerde Linux distro komt.
En daar merk je niks komma nul van. Je FPU wordt nauwelijks aangesproken door de systeemfuncties van je OS.
Zijn we nu eindelijk van alle (of alvast een gedeelte) PRO AMD af?
Ik vind het heel leuk dat iemand een goed produkt levert, maar ga dan niet meteen al het andere als slecht bestempelen.


* 786562 TheGhostInc
Which software maker will even bother to do that for the time being?
Ik denk iedere 'software maker' die de rest van de wereld wil laten zien hoe snel zijn software kan zijn en al klaar is voor de toekomst. Dit soort performance-boosts in benchmarks zijn natuurlijk een enorme reclame voor de nieuwste software-versies.
Dus die nieuwe software-versies, P4 en SSE2 kunnen elkaar bevorderen c.q. promoten. Dat heet ook wel synergie.

Bovenstaande grafiek laat nog niet de SSE2 implementatie zien, dit grafiekje wel:
www.tomshardware.com/cpu/00q4/001125/p4-07.html
En dan is deze implementatie nog niet eens ver doorgevoerd, maar door een paar Intel-engineers ff snel in een paar avondjes overwerken geschreven om Tom te laten zien hoe goed en gemakkelijk dit gedaan kan worden. Tom slaat nu dan ook een iets andere toon aan ;). Zelfs de Athlon en de PIII gingen door deze aanpassing wat sneller lopen
You can say what you want about Intel, but you've got to envy them for having employees of this caliber. I certainly do. You also have to give them the highest respect for reacting quickly and wisely at the same time. I personally stand in awe and have to admit that Intel really caught me on the wrong foot here. Intel has a lot of mistakes and I am not forgetting this, but the above reaction deserves a huge amount of credit.

There's another thing I might add. MPEG4 encoding and DVD-ripping in general, as well as FlasK MPEG and similar software in particular is seen by some groups (especially the self-important and money-thirsty movie industry) as pure piracy stuff. This is another reason why Intel could have dismissed the whole MPEG4-issue. Still Intel decided to get involved and make 'its hands dirty' with the coding of a possible 'video piracy application'. I very much respect this as well.
Lees ook dit artikel eens voor nog een voorbeeld van de impact die SSE2 heeft op performance:
www.theregister.co.uk/content/3/14982.html

Tom en velen met hem zijn, zoals al eerder is gezegd, te vlug en te hard in hun oordeel/veroordeling geweest. Aangezien ook AMD in hun Hammer serie SSE2 wil gaan implementeren (wat erg slim is van AMD, omdat Intel daarvoor dan al het voorwerk heeft verricht en erop wijst dat ook AMD verwacht dat dit door zal zetten), zal de kans op acceptatie en doorvoering ervan zeer groot zijn lijkt me.

Ben alleen wel benieuwd of volgende generaties AMD cpu's (Sledgehammer/Clawhammer) net zo hard zullen profiteren qua performance als de P4's, omdat die laatste en SSE2 wel voor elkaar geboren lijken te zijn.
De Intel compiler is een van de beste compilers voor het x86 platform (het genereert in veel gevallen de snelste code). Niet raar dus dat een recompile van een stukje software met die compiler snelheidswinst oplevert.

In dit speciale geval van MPEG4 is het van belang dat de speciale instructieset van de betreffende processoren wordt aangesproken. Het is dus niet meer dan normaal dat de P4 via de SSE2 instructieset veel sneller blijkt te zijn.

Overigens is 'een recompile' van software niet de manier om 'even je app veel sneller te laten draaien op een P4'. Mensen die in asm MMX routines hebben lopen bakken in C/C++ code weten wel waarom. Tegenwoordig heeft de Intel compiler C/C++ extensies waarmee je inline functies aanroept ipv dat je assembler moet gaan programmeren in je C/C++ code, om maar de SSE2 specifieke instructies aan te roepen.

Dat dat meerdere codepaths oplevert is duidelijk. Al met al niet 1 2 3 gedaan dus. Tuurlijk zal het aanvinken van 'SSE2 optimize' resulteren in het omzetten van sommige C/C++ code in SSE2 gebruikende assembler echter wil je echt snelheid halen uit de SSE(2),MMX of 3DNow! instructieset, dan moet je stukken code herschrijven, gebruikmakend van de nieuwe instructies.

En ik vrees dat intel dat heeft gedaan in deze versie van flask. In de toekomst zullen meer en meer applicaties (denk vooral aan games en multimedia apps) op de markt komen met codepaths speciaal gericht op een type processor met een extended instructieset (MMX(2), SSE(2), 3DNow). Het kost echter wel veel extra tijd dus niet alle apps waar je het van zult verwachten zullen dat soort codepaths in zich hebben.
dat is strak...
een 'virtuele' athlon 1,5 zou dus een score van 14,56 halen en dus beter scoren!
reken hier de pc266 'bonus' bij en klaar is AMD :7

ps,heeft tom dat soms in florida gebencht? }>
Leuk zo'n virtuele athlon 1,5Ghz maar helaas duurt dat nog wel even (nog zeker een half jaar)
Rond die tijd was geloof ik de 2Ghz van Intel ook geplanned, dus op dit moment is Intel niet sneller per Mhz, maar misschien hebben ze wel wat extra Mhz om dit te compenseren.


* 786562 TheGhostInc
Eeuh, er zitten een paar denk en rekenfouten in je conclusie.

Als we even gewoon dom doen en de 1.2 GHz Athlon score omhoog krikken met het verschil in kloksnelheid dan kom ik op een score van 11.14 * (1.5 / 1.2) = 13.925 en dus niet jouw 14.56.

Dan moeten we er nog eens rekening mee houden dat de performance altijd minder omhoog gaat met de kloksnelheid, en zelfs steeds minder wordt. In dat geval zou de score van de 1.5 GHz Athlon zelfs lager uitvallen.
een 'virtuele' athlon 1,5 zou dus een score van 14,56 halen en dus beter scoren!
Bovenstaande grafiek laat nog niet de SSE2 implementatie zien, dit grafiekje wel:
www.tomshardware.com/cpu/00q4/001125/p4-07.html
De 1.5Ghz P4 haalt dan resp. 18,96/20,72/22,85 FPS bij HighQ/MedQ/LowQuality.
Overigens, Tom heeft die 1.5Ghz P4 al moeiteloos en 100% stabiel op 1.7Ghz laten draaien.
Persoonlijk wordt ik door dit artikel alleen maar voor de zoveelste keer bevestigd in mijn mening dat je aan die artikelen op Tom's site niet veel waarde moet hechten.

Je gaat je mening over een nieuwe CPU toch niet laten afhangen van de geoptimaliseerde tooltjes die een fabrikant je toestuurt???
Ik wed dat bijvoorbeeld AMD FlaskMPEG ook wel voor 3DNow! zou kunnen optimaliseren en er een vette winst uithalen, maar daar draait de rest van je software dan niet beter door. Ik zou mijn mening pas aanpassen, als een groot gedeelte van de door mij gebruikte software baat bij een processor zou hebben.

Iedereen weet uit de gepubliceerde benchmarks allang dat de P4 gewoon (relatief) beroerd is voor het draaien van de huidige software, en dat de processor het echt moet hebben van hercompilaties, gespecialiseerde aanpassingen en optimalisaties. Ik moet weer terugdenken aan de tijd dat AMD 3DNow! introduceerde, en ik dagelijks het web afstruinde op zoek naar optimalisaties voor de door mij gebruikte software. Die natuurlijk slechts mondjesmaat beschikbaar kwam. En ook toen al leverde een goede optimalisatie wel het een en ander op: Quake2 draaide na een zware aanpassing door AMD-medewerkers ineens 2x zo snel op mijn K6-2, en later zagen we bijvoorbeeld ook de NVIDIA Detonator-drivers ineens weer een grote achterstand van de K6-2 op de Intel-processors inlopen toen NVIDIA doorkreeg dat het marktaandeel van AMD-gebruikers toch wel interessant groot begon te worden.

Niets nieuws dus, maar bij Tom's doen ze het steeds voorkomen of ze baanbrekend bezig zijn en unieke resultaten halen. :r

Ja, Tom heeft het overklokken bedacht, echt waar hoor, en dankzij Tom is AMD ook uit de rode cijfers gekomen, en hij heeft nu ook de tot nu toe verborgen krachten van de P4 ontsluierd! :r :r :r

't Is dat Al Gore hem al voor was met het claimen van de uitvinding van het Internet, anders had Tom dat ook nog op zijn naam willen schrijven... :+
Ben het toch niet helemaal met je eens Bunny. Ik denk dat het door Intel gestuurde (en geoptimaliseerde) tooltje wel degelijk als maatstaaf gebruikt zou mogen worden. Het toont immers de 'mogelijke' prestatie vanhet stuk hardware. Dat is wat de kopers ervan willen weten. Natuurlijk moet toekomstige software aangepast worden aan de P4, maar dat geldt ook voor andere hardware zoals grafische kaarten. Zou jij een grafische kaart met T&L mogelijkheden testen met software die geen T&L ondersteund, en daarop je conclusies vastpinnen? Ik niet. Dat zou erg incompleet zijn. Ik denk dat het juist goed is om beide stukjes software te testen op de nieuwe hardware. Zo krijg je immers een beter beeld van de prestaties van de hardware. Ik denk dat Tom wellicht wat voorbarig geweest in eerste instantie. Het siert hem echter dat hij ons van een update voorziet. ;)
Dat ziet er beter uit! de prestatie verbetering is zeer goed, ook de verbeteing bij de Athlon en P3 zijn opmerkelijk te noemen. Blijkbaar was flask niet goed geoptimaliseerd voor alle procs.

Ik denk dat het voor intel wat lastiger wordt SSE2 er goed 'in' te krijgen dan dat het was met MMX en SSE,
er is nu immers een veel sterkere concurentie van de kant van AMD. (als AMD ook sse2 gaat ondersteunen is het weer geen enkel probleem)
Die nieuwe Amd processoren gaan toch ook SSE2 ondersteunen, dat is iig wat ik gehoord en gelezen heb.
Mobo's voor P4 zijn volgens mij al geoptimaliseerd. Nieuwe socket plus nieuwe chipset!! ;)
We zitten nog wel bij de eerste generatie P4 moederborden, voor AMD zijn we al toe aan de tweede (of zijn we al verder?).
Niet voor de DDR-bordjes
Heh, intel breng een geoptimaliseerde versie uit die overal veel sneller op is... Zelfs de Athlon....

Ik geloof dat ik nu even de weg kwijt ben... :P

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True