Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 37 reacties
Bron: Ace's Hardware

Tijgerrr wees ons erop dat er bij Ace’s Hardware een bijzonder interessant artikel verschenen is over de FPU performance van de Pentium 4 met verschillende compilers. De Pentium 4 wordt door Ace’s Hardware getest met Microsoft’s Visual C++ 5.0, 6.0 en 7.0. De eerste twee versies zijn geoptimaliseerd voor de Pentium 3 waar Visual C++ 7.0 ook geoptimaliseerde executables kan afleveren voor de Pentium 4.

Veel blijkt dit echter niet uit te maken. De Pentium 4 geoptimaliseerde executable blijkt slechts 10 procent sneller te zijn dan de niet geoptimaliseerde versie. De Intel C++ compiler die simpelweg als plug-in te gebruiken is in Visual C++ blijkt gelukkig beter te presteren. Zodra de compiler het groene licht krijgt om sommige instructies automatisch om te laten zetten naar SSE-2 bewerkingen schiet de performance omhoog. In sommige benchmarks gaat de performance zelfs met meer dan een factor 2,2 omhoog! Een knap staaltje werk dus van de Intel mannen:

Intel has cut a corner too much while designing the Pentium 4 x87 FPU. However, Intel has a brilliant compiler team, which has developed the first IA-32 compiler that can optimize programs with SSE-2 instructions by simply recompiling the code. This makes the Pentium 4 much more attractive for many markets. Provided that a few bugs are resolved, the Pentium 4 will become an attractive option for the scientific world, where recompilation of code is very common and done on a regular basis. The Pentium 4 will most likely also become a powerful workhorse for the workstation world, as the Maya benchmark shows.

Thanks to this new compiler and higher clockspeeds, the fastest Pentium 4 should be able to decrease or even close the performance gap with the fastest Athlon in Pentium 4 optimized workstation applications. The Pentium 4 might even increase its performance advantage over the Athlon in some streaming applications (video encoding).
Pentium 4 FPU benchmarks
Moderatie-faq Wijzig weergave

Reacties (37)

Zeer goed artikel. Alleen mis ik nog 3dNow! geoptimaliseerde code. Niet dat ik denk dat dit erg veel uitmaakt.
We zien in de laatste graph dat de performance van de Athlon 1.2ghz ten opzichte van de 25% hoger geclockte P4 1.5ghz 35% minder presteert, wat clock voor clock neer komt op 8.3% verschil ongeveer. Ten nadele van de athlon 1.2. Dan zou een kleine performance boost door 3dnow dat gat noch wel eens kunnen dichten. En dit zijn synthethische benchmarks. Zoals al aangegeven in het artikel zullen de real world prestaties ergens tussen de supergeoptimaliseerde code en de gewone code liggen. In dat geval is de athlon op een lager clocksnelheid waarschijnlijk nog steeds sneller.
De enige manier, in mijn ogen, waarop Intel dit keer kan winnen is simpelweg door extreem veel hoger geclockte processoren te kunnen leveren. Als AMD de clocksnelheden competetief kan houden (nooit meer dan maximaal 25% verschil) dan wordt het heel moeilijk voor Intel de P4 als superieur te positioneren zonder dat daar aan getornd kan worden.
Afijn, erg spannend allemaal. Ik ben benieuwd hoever de Athlon core kan in ghz.
<font color=#786562>* xipetotec</font>
ik weet wel zeker dat 3dnow dat gat opdicht, ik heb zelf het performance verschil gezien tussen een stukje x87 code en een stukje 3dnow code (zelf in elkaar gezet overigens)

Ik vind het alleen jammer dat AMD niet ook met een compiler komt die 3dnow optimised... want dan kun je juist echt goed de verschillen meten, en dat is misschien ook de drempel voor bedrijven als Adobe om hun software ook amd optimised te leveren, want tot nu toe is het alleen maar intel optimised.

Je zit nog altijd met het kip en het ei probleem: Adobe wil niet amd optimizen omdat de meerderheid bestaat uit intel systemen, en bedrijven blijven bij intelsystemen omdat de software daarvoor geoptimalizeerd is.

En ik denk dat een goede manier om dit te doorbreken is dat er een compiler komt die ook 3DNOW kan optimizen.
Ik vind het alleen jammer dat AMD niet ook met een compiler komt die 3dnow optimised...
En dat is een zwak punt voor AMD. Ze bouwen zelf geen compiler in tegenstelling tot Intel. AMD kan niet meer doen dan Microsoft $$$ lief $$$ aankijken of de ontwikkeling van OSS projecten zoals GCC ondersteunen. Dat laatste gebeurd ook tbv x86-64.
Mooi dat ie het wel kan, maar dat zou inhouden dat alle software met aparte p4 optimalisaties gelevert zou moeten worden. Dus als je, zoals de meeste programma's, 'algemene' code gebruikt heb je geen winst. En alleen p4 geoptimaliseerde code zou natuurlijk niet werken op andere computers.. Ik ben bang dat er dus alleen enkele grote softwarepakketten gebruik van zullen maken, en de meeste programma's niet. De processor is dus eigenlijk alleen interessant voor applicaties waarbij deze ondersteuning geboden zal worden (photoshop ofzo).

Is er eigenlijk wel eens gekeken naar performance verschil van 3Dnow! i.t.t. SSE2?
Er zal wel een nieuwe versie van software installers komen (of mischien ondersteund wise dit al wel) die tijdens de installatie detecteren wat voor CPU je gebruikt en dan de juiste executable installeren (en DLL's) De hoeveelheid code die de snelheid voornamelijk bepaald is vaak heel weinig, dus zoveel zal het niet schelen qua distributie grootte.
Het kost de fabrikanten van software alleen een beetje extra werk, om die stukken apart te optimaliseren.
Ze hebben het hier ook over visual studio 7.

Als het bijbehorende .Net platform wordt gebruikt, hoef je het niet eens verschillende versies te distributeren. .Net gebruikt een 'Just-In-Time' Compiler (En die kijkt echt wel naar de aanwezige processor).

De executable wordt dus pas gecompileerd op de eigen machine...dus kan het automatisch op de beste manier geoptimaliseerd worden.
Bij meeste compilers is het toch mogelijk om bepaalde executables op te delen? Oftewel, als je een P3 hebt dan voert hij P3 geoptimaliseerde code uit en zodra je een p4 gebruikt, dat ie dan p4 code pakt.

Je krijgt meestal wel een iets grotere executable, maar zo worden dus meerdere processoren ondersteund (geoptimaliseerd).
.. Ik ben bang dat er dus alleen enkele grote softwarepakketten gebruik van zullen maken, en de meeste programma's niet.
Maar denk daar eens over na. Is het nodig dat kleine programma's er gebruik van maken? Programma's als paint, Outlook Express, IE, GetRight, etc. hebben helemaal niet zo'n snelle processor nodig. Die kun je ook prima met een PII 300 draaien. Juist de grote programma's hebben er wat aan!

Als je programma's als Photoshop, Maya, 3DSMax, games e.d. hiervoor gaat optimaliseren ben je goed bezig, want dat zijn de programma's die er wat aan hebben en waarvoor je een snelle proc nodig hebt! Dat kleine programmaatjes dan ietsje langzamer zijn maakt niet uit, want dat heb je toch niet nodig.
Ach ja.... er is bijna geen enkel groot software bedrijf die zowiezo al Intel compilers gebruikt, de meesten gebruiken microsoft compilers... en die leveren dus hooguit 5% performance voordeel als ze P4 optimized zijn.
while Intel says that "the new SSE/SSE2 instructions buy about 5% performance gain compared to an x87-only version"
Het is leuk dat Intel overal wat gratis engineers heen schopt, zodat je zo nu en dan ergens een geoptimaliseerd programmaatje ziet verschijnen....maar dit houdt niet in dat vanaf morgen elk programma 100% SSE-2 optimized is.

Dit is meer een showcase van wat SSE-2 kan... meer niet.

Intel zal eerst wat meer aan z'n compilers moeten doen, i.p.v. van ze te optimaliseren voor SPEC.
Ach ja.... er is bijna geen enkel groot software bedrijf die zowiezo al Intel compilers gebruikt, de meesten gebruiken microsoft compilers...
De Intel P4 "compiler" is een plug-in voor die Microsoft compilers, die, zoals in dit artikel gedemonstreerd wordt, makkelijk en goed z'n werk doet. Hij zet automatisch die code om. Je hebt dus zojuist vóór deze plug-in gepleit ;).
Je hebt dus zojuist vóór deze plug-in gepleit
Een pleit voor de Hammer. ;)

Maar met die plugin krijg je dus twee executables:

Two version are generated: a SSE-2 version and a generic version for CPUs which do not support SSE-2

Willen software bedrijven dit ??? [mij zou het geen reet uitmaken, kunnen ze ook mooi een x86-64 optimised version ernaast gooien, om gebruik te maken van de extra registers die x86-64 biedt]

Intel compilers generen (zal nog ff proberen te vinden waar ik dat las) niet in ALLE gevallen foutvrije code (of lees: Microsoft generated code op een Microsoft besturings-systeem = wat je wil). Wil je dan wel een plugin gebruiken ??
In sommige benchmarks gaat de performance zelfs met meer dan een factor 2,2 omhoog
Met factor 2.2 is hoog, dus bijna 2,5 keer zo snel.
Misschien is het voor microsoft dan wel een goed idee om een speciaal voor de pentium 4 geoptimaliseerde release van Windows XP te gaan leveren. Dan wordt het voor klanten (inc. tweakers) wel interessanter om een Pentium 4 te gaan kopen als alle software inderdaad een stuk sneller gaat lopen. Als Intel dit nou eens op tafel zou leggen bij Microsoft, misschien geen slecht idee.
Dat is alleen bij bepaalde synthetische code mixen. Die erg kleine memory footprint hebben en in de L1 L2 passen. over alle gevallen gemiddeld waar sommige codemixen zelden voorkomen is de performance rond 1,5.
Echte aps passen vaak niet in de L1/L2 of ferwerken grote brokken FPU intensive data dus is de performance ook afhankelijk van de L1/L2/geheugen bandbreedte maar ook hun Latency.
Dus 100+% verbetering haalt ie in 'n specificke synthetische bench maar als je in 3Dstudio 50% haalt mag je al blij zijn.
Zouden we dan nu toch eindelijk eens de ware kracht van de P4 gaan zien? Er wordt al tijden vertelt dat de P4 het pas goed gaat doen na optimalisatie, dit lijkt me een heel mooi voorbeeld.
vanwaar al die ophef? dit was al bekend, hetzelfde gebeurde toen de pentium uitkwam, zonder geoptimaliseerde compilers wordt er niet optimaal van een nieuwe processor gebruik gemaakt.
ik doe dan hierbij alvast een voorspelling dat de performance van de pentium5 flink tegen gaat vallen de eerste paar maanden :)
Hmm, ziet er heel erg veelbelovend uit voor die processor.

Zoals al aangegeven wordt hebben ze bij Intel goed hun best gedaan. Alleen is dit natuurlijk op dit moment een van de weinige programma's die geoptimaliseerd is voor SSE2, net zoals met MMX en dergelijke, is het altijd wachten totdat spellen en dergelijken er gebruik van maken.

Het is gewoon vergelijkbaar met een Geforce 3, die komt ook pas tot zijn recht als spellen gebruik maken van de InfineFX engine, anders presteert de kaart evengoed dan een Geforce 2 ultra, zoals ook al uit benchmarks gebleken is.

Kijken wat AMD op de stoep zet tegenover dit knap staaltje werk ! Ben heel erg benieuwd wat de palomino te brengen heeft.

Naar mijn mening dus nog even wachten totdat de instructies ook daadwerkelijk worden geimplementeerd en gebruikt in Games e.d.
Voor een lijst van daadwerkelijk geoptimaliseerde software voor de P4 kijk je hier:
http://www.intel.com/home/pentium4/software.htm
En dat zijn dan complete pakketten. Verder is er ook veel deels geoptimaliseerde software/hardware voor P4 en Intel SSE in het algemeen, d.m.v. plugins en drivers (Photoshop 6.01, Detonators 12.xx, Wildcat en FireGL videokaarten drivers, enz.). Is het niet zo dat die Microsoft compilers wijd en zijd verbreid zijn en dat het mooie dus is, dat die Intel P4 compiler simpelweg een plugin is voor die Microsoft Visual stuff? Lijkt nogal gemakkelijk te werken dus.
Tis natuurlijk weer wachten. Dit is echt voor het eerst in mijn leventje dat het aanvinken van een optimalisatie ook echt veel winst geeft.

Denk eens aan videodrivers. S3 schrijft ze in MS Visual C++, rijp voor aanpassing dus (helaas maakt S3 geen drivers meer voor videokaarten die ook op de P4 kunnen)
Ik weet niet in welke taal de Kyro, nvidia en ATi drivers geschreven worden, maar voor spellen maakt dit dus lekker wat uit. Dan alleen nog hopen dat het op een non-SSE2 CPU ook lekker doordraait.
AMD heeft nu als nadeel dat zij de SSE 2 instructies niet ondersteunen, dus de P4 kan hiermee voordeel uit halen. Maar hoe gaat het verder als de AMD Clawhammer uitkomt ?

Net als de voor P4 geoptimaliseerde software massaal begint door de breken Q1 2002 brengt AMD de clawhammer uit, die ook van SSE2 kan profiteren.

AMD slaat dus twee vliegen in een klap hiermee.

1. De release van een nieuwe core, die hopelijk wat hoger schaalt dan de athlon lijn.

2. Implementatie van SSE 2 als die net door begint te breken.
Vergeet niet dat de MMX performance van bijvoorbeeld een AMD K6 achterblijft op die van een Pentium 1.

Het wil dus niet zeggen, dat je bij AMD processoren dezelfde performance boost kan verwachten, als bij de P4 mogelijk is.
Het kan wel, maar het is afwachten.
De Hammer zou natuurlijk ook beter kunnen presteren dat is ook mogelijk
Heel veel mensen hebben het hier over het speciaal optimaliseren van code voor SSE2... Wat dit artikel echter uit probeerd te leggen is dat er _nix_ aan de code veranderd hoeft te worden en dat de compiler _zelf_ SIMD instructies genereerd waar dat kan (zo goed mogelijk uiteraard). Een bedrijf hoeft dus nix anders te doen dan alleen ff in Visual C op F9 (of welke shortcut is dat) te drukken.... :P
maar alleen met de intel compiler plugin
Gekke vraag is windows xp ook voor de pentium 4 geoptimaliseert?
Nee, hooguit DirectX
Euh...??? Leg 'es uit! :? Dat snap ik niet. Een OS kan toch niet echt voor software geoptimaliseerd worden op de manier als dat met hardware gebeurt. Je kunt het vast wel compatibel maken en dan ook nog wat optimaliseren...maar XP voor DirectX optimaliseren? Eerder andersom: DirectX 9.0 voor XP geoptimaliseerd.
Uitleg: XP is niet voor de P4 geoptimaliseerd. DirectX wel (SSE-2).

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True