Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 10 reacties
Bron: Ace's Hardware

Johan de Gelas heeft op Ace's Hardware een interessante nieuwsposting geplaatst met wat meer info over de mogelijke bottlenecks van de Pentium 4 architectuur. Zoals je in de benchmarks hebt kunnen zien, heeft de Pentium 4 een erg indrukwekkende geheugen bandbreedte, maar is de integer en FPU performance nog niet op het niveau van de Pentium III en Athlon. Johan heeft een verklaring voor de wat tegenvallende performance van de 'double pumped' ALU (aka 'Rapid Execution Engine'), die integer instructies uitvoert op een dubbele kloksnelheid van de rest van de processor. De P4 blijkt weliswaar erg snel te zijn bij de meest voorkomende simpele instructies, maar heeft als nadeel dat integer instructies met een hogere latency worden verwerkt. Een tweede mogelijke bottleneck zit 'm in de trace cache, die per kloktik 3 microops (gemiddeld 1,5 instructie) naar de pipelines kan sturen. Hierdoor kan het voorkomen dat één van de twee ALU's zonder werk komt te staan:

The P4's double clocked ALU's, alias rapid execution engine. While it is quite fantastic that a 2 GHz P4, which was presented by Albert Yu on the IDF, has a 4 GHz ALU, there is something I should point out. Integer multiplication takes 12 clocks to execute, while this instruction takes only four clocks on the PIII. If you compare the PIII with the P4, the P3 executes the integer instructions with 50% less latency. In other words, the Rapid Execution Engine is only "Rapid" for the most common, most simple instructions (32 bit ADD). Intel's engineers haven taken the words "make the common thing faster" to the extreme...

The trace cache can send only 3 microops to the rest of the pipeline. Is that a bottleneck? I am not sure, but if one x86 instruction takes on average 2 microops, then the pentium 4 can only do a maximum of 1.5 x86 per clockcycle or 1.5 IPC. Now, benchmarks show us that it is hard to obtain higher IPC than 1-1.1, but it seems to me that you should have a bit more headroom. Especially when the CPU encounters a piece of code that has a high amount of ILP (Instruction Level Parrallelism). The Pentium 4 is a very interesting architecture, and the more we delve into it, the harder it gets to understand how it will perform in different applications and what trade-offs the engineers made.

Intel Pentium 4 processor (groot)
Moderatie-faq Wijzig weergave

Reacties (10)

Laten we eerst eens afwachten hoe de Willy presteert als hij daadwerkelijk gereleased wordt. Ik kan me herinneren dat ome Tom de Pentium II afkraakte nog voordat hij te koop was. Bleek om een enigineering-sample te gaan en de uiteindelijk versie was aanzienlijk sneller. Meer recent is er het voorbeeld van de Athlon, die in eerste instantie ook een beetje leek tegen te vallen. Korte tijd later bleek ook dit helemaal goed te komen ;) Met andere woorden; TWT (time will tell...)
Dus als ik het goed begrijp dan kan je dus alleen maar goed mp3's encoden met dit ding ? zal het vast heel goed doen. "Pentium4 enhanching your MP3 experience" of "Pentium4, the hottest DvD Player"

Maar effe serieus. Ik vindt het wel triest dat intel de p6 core zo zit uit te melken, na de ppro hebben ze niets nieuws bedacht. Het enige wat bij die p4 anders is dat ze truuks hebben uitgehaald om 'm hoger te kunnen klokken die een ramp zijn voor de perfomance dus hebben ze er ook wat mmx-sse2-double-pumped blubber tegenaan gegooid.

Eigemlijk moeten ze gewoon net als amd, een nieuwe core designen. Alhoewel de itanium wel koele dingen heeft. Daarbij hebben ze alle pc legacy crap weg gemikt. Dus geen irq-gekloot, geen gekloot met hd's. Ze hebben een extendable bios dat uitbreidbaar is via plugins. Maar helaas is de itanium nu nog voornamelijk een dure trage baksteen. Alhoewel je dan wel het probleem van de kleine cores hebt opgelost. Er is zat plek om een dijk van een koeler te bevestigen.
De Pentium 4 is een volledig nieuwe core en heeft _niets_ met de P6 te maken. Het is jammer dat de performance per clock wat laag is, maar daar staat tegenover de de processor voor erg hoge kloksnelheden geschikt is.
He Femme,

wat ik niet echt begrijp is dat jij als medewerker van tweakers.net die benchmarks van een pre-production sample nu al serieus neemt als bewijs van de slechtere per clock performance van de P4.

Een pre-production sample van de PII (niet zo lang voordat de echte uitkwam) bleek zwaar veel langzamer te zijn dan de K6 van AMD toendertijd (Tom's hardware). Echter de uiteindelijke processoren uit de productie wel degelijk veel sneller te zijn.

Het zelfde gold voor pre-production samples van de Athlon die ook zwaar slechte performance leverden tov. de uiteindelijke Athlon.

Misschien zal de uiteindelijke P4 wel misschien iets langzamer clock-voor-clock zijn, maar die verschillen op dit moment kunnen dus precies dezelfde zijn als toendertijd met de PII en de Athlon. Laten we de P4 pas echt gaan bekritiseren als ze van de productieband rollen. ;)
Intel zegt zelf al te verwachten dat de P4 10 tot 15% langzamer wordt dan de P3, dus Femme heeft wel gelijk hier.
Juist. Als Intel zelf al zegt dat de P4 een lagere performance-per-clock dan de PIII heeft, dan krijg ik toch de indruk dat die informatie juist, zeker als de technisch onderbouwde voorspellingen hetzelfde zeggen.
Het fenomeen dat de klok voor klok snelheid wat lager uitvalt vindt ik niet zo relevant.
Immers was dat met de overstap naar de niet PII ook al het geval die was ca 7% langzamer als ik het me goed herinner.
Ook die vertraging heeft iedereen geaccepteerd :)
Typed op PIII650@806
Mijn motto: Gewoon klokken die handel en die paar % ben je zomaar vergeten :)
32 bits redesignen zal makkelijker zijn dan 64 bits voor het eerst ontwerpen.

Ze moeten gewoon alle bottlenecks eens goed oplossen!
De Pentium 4 zal wel lekker snel lopen hoor, daar maak ik me niet druk om.

Als intel een trage baksteen gaat leveren dan zijn ze de klos en neemt AMd de markt helemaal over. En dat weet intel zelf ook wel.
Ik ben het opzich wel eens met Alias.
Ze proberen nu alles uit de bestaande ontwerpen te halen, maar de aanpassingen zijn er ook.....

En een nieuwe proc ontwerpen kost erg veel tijd, en in die tijd heeft AMD hun allang de markt uit gekickt. Dus ze moeten wel :)
Ik zal zeker niet verbaast staan als ze al een team aan het werk hebben gezet om een nieuwe proc met de nieuwste snufjes te ontwerpen. Maar AMD zit net zomin stil als Intel, maar hebben dus een enorm voordeel met de nieuwe core waar Intel dus waarschijnlijk nog mee bezig is :7 :+

* 786562 Not

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True