Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 19 reacties
Bron: Ace's Hardware

Johan De Gelas heeft vandaag op Ace's Hardware het eerste artikel neergezet van een serie van drie waarin dieper wordt ingegaan op het design van de Pentium 4. Dit deel gaat over de geheugenstructuur van de Pentium 4 en er wordt uit de doeken gedaan hoe snel alle caches en geheugens zijn. Ook worden er wat vergelijkingen gemaakt tussen SDR, DDR en Rambus geheugen. Echt een stukje voor de liefhebber . Hieronder een hapje inleiding:

If you've already read our Pentium 4 review, you will agree that the performance of Intel's newest architecture can not be described in a few sentences. The 1.5 GHz Pentium 4 received a right hammering from both the Athlon 1100 and 1200 in raytracing, rendering, compiling, and several DirectX games. On the other hand, the Pentium 4 offered superior performance in Quake 3 and video encoding. Educated guesses were all we could offer you as explanation for the dubious behavior of Intel's "Netburst" architecture.

Nevertheless, this behavior sparked our interest. What bottleneck is keeping this unbelievably highly clocked monster from boasting stellar performance? After looking at all the benchmarks that we presented you, you might be tempted to think Intel's engineers have not done their homework. After all, a workstation processor should shine in rendering and compilation benchmarks. Simply assuming the Pentium 4 was designed for high clockrates, and that Intel has thrown all other considerations overboard, however, is a bit too simplistic. No, there must be more! Is it possible that the Pentium 4 will finally walk over the competition when the first optimized software arrives? When we unleashed some in-depth benchmarking on the best of AMD and Intel, we were surprised by many of our discoveries. We're sure you will be too.
Moderatie-faq Wijzig weergave

Reacties (19)

Nadat ik het hele artikel heb doorgelezen heb ik hetvolgende te zeggen...

-De L1 cache van de P4 is bloedsnel, de L2 cache daarintegen is bij de meeste aplicaties zelfs flink wat slechter dan die van de P3, dat verbeterd echter wel behoorlijk als er gebruik wordt gemaakt van SSE2 aangezien dit de L2 kan aanspreken met 128 bit wat een stuk beter gaat als de gebruikelijke 64 of 32 bit, de Athlon is hier veel beter in wat resulteerd in een betere real life performance.
Dit samen met het feit dat de P4 z´on kleine cache heeft laat mijn concluderen dat je de P4 niet snel in servers zult zien maar dat ie echt als een high end pc of als een workstation is bedoelt.
-De real-life maximum transfer van dual channel rambus ligt c.a. 25% hoger als die van een Athlon DDR platform, wiens bandwijdte in de praktijk weer ongeveer 25% hoger zit als die van het Athlon en P3 SDR platform.
-De latencie van de Rambus in de P4 valt heel erg mee, om precies te zijn is die zelf hetzelfde van een Athlon met een KT133, wat te verklaren is van het slim parallel aansturen van de 2 rambus channels, vreemd genoeg laat DDR verder lagere latancies zien als zijn SDR broertje...

Verder schijnen er nog een boel andere dingen te zijn waar aan de P4 en in mindere mate de Athlon geschroef kan worden, ik zou dus als je een Athlon gaat kopen in ieder geval wachten tot de Palonimo komt, of als je een P4 wilt gaan kopen, je beter kan wachten op de volgende socket versie van de P4 die ze gezien alle mogelijke tweaks maar beter P5 kunnen gaan noemen...
dat de latencys bij DDR lager zijn is niet zo vreemd als de bedenkt dat de frequentie ook 2x zo hoog is.
als het waar is dat de p4 een 128bit brede L2 cache heeft is dat een achteruitgang t.o.v. de P3, die had een 256bit brede L2-bus, de opvolger van de Thunderbird (Palmino) zal btw ook een 128bit brede L2 cache hebben.

De supersnelle L1 cache van de P4 heeft niet bijster veel nut omdat de processor de bandbreedte van haar eigen cache niet goed aankan, de omzetter van instructies naar microOps is niet snel genoeg,

de kleine L1 cache heeft als gevolg dat als er ingewikkelde berekeningen uitgevoerd moeten worden de data weer uit L2 moet komen, en dat geeft weer extra latencies omdat in de L2 geen microOps maar gewone instructies staan, en zo kan ik nog wel een tijdje doorlullen. (maar daar heb ik geen zin in)
dat de latencys bij DDR lager zijn is niet zo vreemd als de bedenkt dat de frequentie ook 2x zo hoog is
Feitelijk onjuist. De frequentie is precies gelijk: PC2100 heeft een frequentie van 133 MHz. Door het DDR-principe word er 2 x per cyclus data verzonden. De latency word echter nog steeds gemeten in clock cycles. CAS 2,5 bij PC2100 is dus 3,75 ns LANGZAMER dan CAS2 bij PC133. Het snelste DDR-SDRAM geheugen, het nog niet commerciëel verkrijgbare PC2100 CAS2 geheugen, heeft dezelfde latency als dat snelle PC133 - en geen tiende van een nanoseconde sneller.
Ach, deze jongen beweert ook al tijden stellig dat de Pentium 4 geen x86 processor is }>

;) ;)
Klopt, het zal er wel aan liggen dat de maximum belasting van DDR minder is als die van SDR...
Wouter Tinus: en jij al tijden van niets, ik dacht dat we er nu uit waren, dat het qua instructies nog wel compatible was maar de opbouw is heel anders als x86, weet je nog, of ben je dat alweer vergeten?

xeldiablo: ONZIN

Saruman: idd, de externe frequentie is precies gelijk,
maar hoe wou je anders verklaren dat de latencies lager zijn? explain please.


(irrelevant zou nu allang een tread op het moddereter forum begonnen zijn met daarin een bericht als: "deze jongen post weer veel te veel, naar de 0 ermee")
LEZEN! Het staat gewoon in het artikel:
Notice how PC133 and DDR SDRAM offer the same latency initially, but as we increase the size of the dataset, we become bandwidth constrained by the PC133 SDRAM interface, increasing the latency that the CPU sees
Ofwel: er STAAT hier gewoon dat DDR geen lagere latency heeft - pas als bandbreedte een beperking gaat vormen heeft DDR een lagere latency VANUIT DE CPU gezien.

Nogmaals, het is beter een artikel eerst te LEZEN voor je er commentaar op gaat geven.
Stefana:
irrelevant zou nu allang...
Dat is een behoorlijk ongenuanceerde opmerking. Met andere woorden: STFU daarover, dat zijn geen leuke opmerkingen. En weet je wat? Hij zou nog gelijk hebben ook.
Je weet nooit wat je kunt verwachten van Intel, en ik vermoed dat zij er alles aan zullen doen om software geoptimaliseerd voor de P4 op de markt te laten komen. Dat Quake nog steeds beter draait op een Intel CPU dan op een AMD ligt gewoon aan de optimalisaties die gebruikt zijn door ID.
Wat ik dus nog steeds wel mis is het WOW :9 effect op PC gebied, hetzelfde WOW effect wat ontstond toen ik de eerste 3dfx Voodoo spelletjes zag (Motoracer, Quake 1).
Intel heeft altijd veel moeite gedaan om de CPU te promoten als het hart van de PC, terwijl dat voor spelletjes helemaal niet zo hoeft te zijn. Kijk maar naar de Amiga, en spelcomputers. Nu al is het zo dat je met een Nvidia Geforce, meer snelheidswinst kunt behalen dan met een snellere CPU...
invloed is ook afhankelijk van de game die je gebruikt
de ene is meer afhankelijk van de grafische kart dan van de cpu en anders om komt natuurlijk ook voor

zie het andere article op ace-hardware
upgrade guide 2001
er worden maar twee dingen genoemd waarin de pentium 4 heel goed in is nl. quake 3 en video encoding. Mij staat er iets bij dat door ome Tom geschreven was waarin stond dat de pentium 4 alleen echt goed was in video encoding als de software er helemaal voor geoptimaliseerd was, echter in een latere test bleek een thunderbird met hetzelfde progamma (geoptimaliseerd voor de athlon) het beter of net zo goed te doen. Dan blijft er eigenlijk alleen maar een goede quake performance over (volgens dit artikel dan).
Volgens mij wordt wel eens vergeten dat er ook nog een 3dnow instuctie set is bij de athlon, die ook niet altijd gebruikt wordt, je kan wel zeggen dat de pentium zo snel is als ie maar geoptimaliseerde software heeft, maar dan moet je die wel vergelijken met de concurrenten als je die ook gebruik laat maken van geoptimaliseerde instructiesets. zoals in het artikel bij toms hardware page over de pentium4 en de athlon.

dyslexie input verweiderd
Dat er maar 2 programma's genoemd worden waar de P4 goed in is, betekent niet dat de P4 alléén daar goed in is. Er zijn (en komen) nog 10-tallen, zoniet honderden programma's, die op een vergelijkbare wijze werken of dit deels doen.

Ook na het optimaliseren van FlaskMpeg voor de Athlon, bleek de P4 sneller bij gebruikmaking van alle optimalisaties voor beide. Bovendien liet de P4 een grotere snelheidstoename zien na optimalisering, wat aangeeft hoe belangrijk is hoe software geschreven is. De Athlon profiteert in verhouding minder van optimalisaties. Ik denk omdat er een samenhang bestaat tussen ontwerp van de cpu en instructiesets en dat de Intel cpu's ontworpen zijn met instructiesets in het achterhoofd (en andersom :)). Ik verwacht niet dat een volgende generatie Athlons zo hard profiteerd van SSE2 als de P4 's.
Wat je ook niet moet vergeten aan de P4 is het vermoeden dat hij gecrippled op de markt is gekomen, doordat een aantal onderdelen (L3 cache) eruit gesloopt zijn, om de chip kleiner te maken.
Volgens een artikel uit www.emulators.com de chip inderdaad gemankeerd. Hoewel dit artikel soms als flamebait wordt beschouwd, lijkt de auteur mij verstandig genoeg, om deze conclusies te trekken.

Dat een P4 in quake en mpeg encoding goed presteerd, is te verklaren door het gebruik van geoptimaliseerde code. Maar het is onrealistisch te zeggen wanneer alle code geoptimaliseerd is voor een bepaalde processor. Windows loopt standaard twee generaties CPU's achter (nog niet eens P3 geoptimaliseerd), en het zou een tijd gaan duren voordat een groot aandeel windows progs voor de P4 geoptimaliseerd wordt. De P4 heeft een groot aantal integer units, die SSE 2 nodig hebben om de FPU te "vervangen" intel gaat er dus vanuit dat zij met een P4 en SSE 2 de P4 goed kunnen laten performen.

Voor de huidige software is de AMD Athlon naar mijn mening de betere keuze, omdat die door de brute kracht en gebalanceerd ontwerp overal goed presteert. Als de optimalisaties voor SSE2 echt geimplementeerd worden is dat ongeveer rond 2001/2002, en dan de hammer familie uit die wel SSE 2 ondersteuning heeft.
Als er nu al eens MMX code in windows zou zitten, of nog maar gewone pentium optimized code...

Voordeel van linux, gewoon athlon patches voor gcc downloaden en hercompileren. Hoezo, geoptimaliseerde software?
Toen van de P1 de MMX versie uitkwam kon je nog merken dat deze op veel fronten beter presteerde doordat ze bij intel nog een paar kleine aanpassingen gedaan hadden. Bij de P3 met zijn SSE set merk je pas serieus wat als je bv gaat photoshoppen. Ik krijg het gevoel dat deze P4 een soort raceauto is geworden, Bloedsnel onder (nu nog) heeeeeeel specifieke omstandigheden. Het dus wel weer aanleiding zijn voor een stapel software upgrades (als die al komen) om die performance er echt uit te krijgen. En zo houden we een hele industrie aan het werk
Tja, wat valt hier nou weer over te zeggen.
Dit is eigenlijk wat ik 'oud nieuws' zou noemen,
voor de liefhebber is dit mischien wel leuk, zoveel reviews over de P4,
maar de gemiddelde tweaker (neem mezelf nu maar even als een daarvan) weet na 5 reviews ook wel dat de P4 in de huidige applicaties "sucks" (note de aanhalingstekensk, citaatje dus, voor de moddereters)
duzz, ik zal hier voor de rest geen woorden meer aan vuil maken.
Duh! Dit is geen review zoals jij schijnt te denken, stefana3a!

Ace's heeft een heel erg grondig artikel gemaakt met een gedetailleerde analyse van de grondslagen van de Pentium 4, INclusief verklaringen voor de diverse benchmark-uitkomsten. En dat is enorm handig voor het beoordelen van de vele nieuwtjes die de introductie van deze processor veroorzaakt.

Maar het was voor jou vast teveel moeite om het artikel daadwerkelijk te lezen.
ik heb ook al redelijk wat op ace hardware gelezen
die weten van wanten.
;) ;) ;) ;) ;) ;) ;) ;) ;) ;) ;) ;) ;) ;) ;) ;)
'n goede review met wat meer diepgang en voledigheid kan geen kwaad.
moet het eigenlijk nog lezen maar heb net 'n 1,2 G AMD gehaald dus ik heb al gekozen.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True