Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 34 reacties
Bron: EE Times

Een Intel processorontwerper heeft aan EE Times verteld wat er is gebeurd met het eigenlijke ontwerp van de Pentium 4 processor. De chiparchitecten hadden 1MB off-die L3 cache en 16KB trace cache in gedachte, verder zouden er twee volledig functionele floating point units, een langzame ALU en twee snelle ALU's zijn.

Intel vond echter dat de kosten en het stroomverbruik veel te groot waren, daarom moesten er voor de release drastische aanpassingen gedaan worden. De langzame ALU werd gedumpt, de tweede FPU omgebouwd tot dataverplaatser, het trace cache moest gehalveerd worden door een compressietechniek en het L3 cache moest verdwijnen. Om dat te compenseren is het L2 cache verdubbeld van 128 naar 256KB en is het L1 cache half zo klein geworden met vermindere latency:

Things are bound to get tougher for microarchitectures, which at Intel usually come out every five years. The most obvious ways to boost performance longer pipelines, deeper buffering, more speculation have been done. That will mean more-complex, hard-to-test designs.

"The low hanging fruit is all gone," Boggs said. "Now we have to build scaffolds around the tree. We'll stand on our head and do strange things for a little more performance."

Volgens Intel kostten al deze aanpassingen slechts 5% aan performance en weegt dat verlies lang niet op tegen de extra productiekosten, maar het zou toch leuk geweest zijn om te zien hoe de Pentium 4 het zou doen als hij geworden zou zijn zoals de makers hem in gedachten hadden.

Moderatie-faq Wijzig weergave

Reacties (34)

Intel vond echter dat de kosten en het stroomverbruik veel te groot waren
Volgens mij is vooral dat laatste een probleem, zelfs met het uiteindelijke ontwerp is het stroomverbruik nog een dikke 40W en da's bst veel voor een chippie :)
Bedenk ook dat als een chip op n volt werkt 40Watt verbruikt er dan ca 40Ampere naartoe stroomd blindstroom nog niet meegerekend!
Die stromen kunnen gewoon niet veel groter omdat je dan veel te veel kostbare ruimte moet gaan gebruiken voor aan en afvoer van stroom met ook weer die vervelende extra warmte ontwikkeling.
En AMD's dan? Die gebruiken toch ook 40W of meer?
Ook zoiets ja, de snellere Slot-A CPUs nog wel meer (700MHz was 60W)
M'n 850 zelf 78 Watt volgens specs. Angstaanjagend veel!
Ja AMD proc gebruiken meer dan 40W en ik denk dat de P4 ook wel veel meer gebruikt, anders snap ik niet waar die super voedingen voor nodig zijn. De core van de P4 is vele malen groter dan die van AMD processors, dus zou het koelen van een P4 gemakkelijker moeten kunnen. Immers een veel groter contactoppervlak.
Hebben ze geen test-samples waarmee de huidige resultaten vergeleken kunnen worden? Ze zullen toch wel een paar productie-samples hebben of niet?

Ik neem anders aan dat het 5% performance-verlies een theoretisch verlies is.
Ja, ik denk ook dat die 5% niet klopt nee.
Ze hebben heel wat dinger geschrapt, en dan 5% verlies ? ik weet het niet hoor :)
De Pentium 4 is superscaler ontwerp (Net als de overige pentiums, K6s en Athlons). Dit betekent dat de instructie stroom netjes over verschillende executie units verdeeld wordt en dat op het eind alle resultaten bij elkaar worden geschraapt en weg worden geschreven.
Als je het aantal execution units uitbreidt, moet je er echter ook zorg voor dragen dat er:
1) genoeg instructies aankomen om alle executie units te bezetten (100% efficiency)
2) weinig inter-instruction-dependencies zijn zodat een instructie niet op het resultaat van de andere hoeft te wachten. Dit is echter afhankelijk van de compiler die gebruikt wordt. Dit is ook HET groote probleem voor de IA-64 en waarom iNtel met de specialist in deze materie (HP) samenwerkt.

Het dus simple toevoegen van 'n extra execution units heeft dus niet altijd nut als niet aan deze twee voorwaarden wordt voldaan. De toevoeging zal wel tot 'n verhoging van de performance lijden, maar dat zal niet dramatisch zijn.

Om het aantal execution units met instructies te voeden is 'n goede geheugen interface noodzakelijk. Dus L1, L2, L3 cache, gekoppeld aan DDR of Rambus. Ga je het L3 cache schrappen omdat het te duur is, dan kan net zo goed ook 'n executie unit geschrapt worden omdat die toch niet veel gebruikt wordt.

Dat 'n Pentium 4 volgens de originele specs veel betere (>5%) zou kunnen hebben dan de huidige Pentium 4 met geoptimaliseerde programma's is natuurlijk duidelijk. Maar de Pentium 4 moet concureren met de Pentium III en de Athlon van nu en met de software van nu. Deze software gebruikt de Pentium 4 niet optimaal en het toevoegen van L3 cache, groter L1 cache, grotere instruction trace en extra execution units lost dat probleem echt niet op!
Je mag toch aannemen dat ze niet puur dingen hebben weggelaten :). Als ze dat zouden hebben gedaan, was de prestatiedaling zker wel meer dan 5% geweest. Door een aantal verdere aanpassingen, die ongetwijfeld nogal versimpeld zijn opgenoemd in het artikel, is het verlies aan rekenkracht dus nog beperkt gebleven :Y).
En als je dat toch kritisch bent... 5% ten opzichte van wat ?? we hebben nog niet eens kunnen zien dat het sneller geweest zou zijn.... We kunnen wel zien dat ontwikkelingen bij Intel geen geld mag kosten... want ze maken een nieuwe CPU met oude dingen.. en wij maar afvragen hoe het komt dat het niet goed loopt :)

Achja.. over een tijdje kunnen ze niet meer anders, om het toch allemaal voor elkaar te krijgen... dan zal massaproduktie ook weer de kosten drukken.. weer een-kip-en-het-ei verhaal denk ik...
De langzame ALU gedumpt, een FPU omgebouwd en L3 cache verdwijnt ? En dan 5% performanceverlies :?

Zeker berekend met die 2e FPU :) oh nee dataverplaatser..
Ik vind dit niet echt interessant nieuws als ik eerlijk ben. Je moet eens weten hoevvel producten tijdens de ontwerp fase ingrijpen veranderd worden. Het ontwerp is de grootste factor die invloed heeft op de productiekosten. En als je kijkt wat de ontwerpers eerst van plan zijn en wat er uiteindelijk haalbaar is, nou je schrikt er zelfs behoorlijk van.

5% van de snelheid is toch ook best twijfelachtig denk ik. Ik weet niet hoe ze daar aan zijn gekomen, maar volgens mij zal het beter te bepalen zijn in de praktijk dan in theorie. IK WIL EEN TEST EXCEMPLAAR ZIEN!!
Waar hadden ze die 1MB off-die cache willen laten? Ze kunnen niet terug naar Slot1, dus moet het op het moederbord komen. Maar volgens mij krijg je dan weer problemen met afwijkende chip(set)s, vertraagde werking (langere afstand van CPU nar cache, maar geen idee hoeveel de vertraging wordt) en vast nog meer dingen.
Origineel was Pentium 4 dan ook een Slot processor, een van de redenen voor het verwijderen van het L3 cache was de goedkoper socket-productie.
ha, weer wat beter voor AMD, de cpu van intel weer wat slechter, en nu die goedkoper wordt, zal de palomino ook weer goedkoper worden.
[ironische mode]
Ja, lijkt mij ook heel goed voor AMD dat Intel geen dure processoren gaat maken. Echt heeeel goed voor AMD
[/ironische mode]

Nee, ik zie het voordeel voor AMD nog niet, zeker niet zolang ze hun eigen nieuwe cpu nog niet op de markt hebben gebracht en er steeds meer software voor de P4 wordt geoptimaliseerd.
Goed gezien Grrrrrene. De Pentium 4 zou het nog wel eens goed kunnen gaan doen in de single-processor workstation markt. Kijk maar naar de 3D-Studio waarden in combinatie met 'n FireGL 2 kaart van Diamond. En dat is nog maar het begin. 3D-Studie is nog lang niet helemaal 3DNow of SSE2 geoptimaliseerd, dus er is voor de Pentium 4 nog heel wat performance te halen (en waarschijnlijk ook voor de Athlon).

De enigste fout die iNtel heeft gemaak met de P4 is het niet ondersteunen van SMP. Dit is gewoon een gigantische blunder. Als ze namelijk niet uitkijken verliezen ze hun marktaandeel in de SMP workstation markt als AMD met de 760MP chipset uitkomt. In de grafische industrie bijvoorbeeld waar het x86 platform een flinke bedreiging is aan voor de marktleider Apple, wil men ook schaalbaarheid. Dus de mogelijkheid om er 'n tweede CPU bij te prikken. Dit gaat binnenkort komen voor de Athlon, maar voor de P4 zijn er geen plannen.
hmz volgens mij snap jij t niet helemaal, de benchmarks etc die jij gezien hebt zijn al van de "nieuwe" p4 dus intel wordt er helemaal niet slechter op. en dus wordt hij ook niet goedkoper want dit is al de -dit is moeilijk te geloven maar toch- goedkope versie.
Vet zonde vind ik dit, ik doe veel met video bewerking enzo, maar vertik het om een Mac te nemen...
Deze processor leek mij ideaal om te renderen enzo...
Zit nu met een PIII 450 (slot 1) over >> op 557 MHZ met 192 MB (100mhz) end.
Weet iemand een ander soort processor die beter zou werken qua video bewerking??

Sommige mensen kennen mijn werk misschien wel, maar moet helaas bekennen dat ik daar ziek van werdt (dankzij mijn provider)

Maar ja das een ander onderwerp ;)

Nogmaals weet iemand een betere processor type dat beter is voor video bewerking dan de normale PIII

De PIIII als hij zou worden, zou echt uber zijn, maarja de plannen slaan weer eens om...

Greetz, JohnVID
Nog nooit van een Alpha gehoord??
Loopt lekker snel (RISC), iedere Linux-distributie is ook in Alpha te krijgen en is bovendien redelijk betaalbaar.

Mocht je cht veel centen in de knip hebben, zijn SunSparc en SGI stations natuurlijk een bijzonder goede optie!
Pentium 4 is idd errug snel met videobewerking. Kijk maar naar de resultaten van Tom. Dit allemaal door dual rambus channel.
Leuk idee, dual rambus channel.....
heb je ook al enig idee wanneer het betaalbaar gaat worden?
het kan wel snel zijn, maar wat mij betreft wegen de voordelen nog niet echt op tegen de hoge prijs van alles wat maar rambus heet }:O

Dan kun je het volgens mij voorlopig beter houden op DDR Ram... dat komt nu redelijk betaalbaar in....
Dat is waar. Het is schreeuwend duur en dat zal wel zo blijven. Maar het enige wat ik kan bedenken als nuttige toepassing voor de pentium 4 is een videobewerkingskist. Daar is ie ideaal voor. En als je dan toch een computer koopt helemaal voor videobewerking, dan let je meestal niet echt op 8000 piek ofsow, dan pak je het meteen goed aan met SCSI harde schijven, veel geheugen en evt. dual proc. (dual p4 mobo's staan gepland voor Q1 2001).


* 786562 Ruud
:) Nou om eerlijk te wezen lijkt het op een Oudere processor , De Intel Pentium Pro, kennen jullie die nog, ja ja de voorloper van de Intel Pentium II maar het eerste ontwerp van de P4 (die dan gecanceld werd) heeft het zelfde princiepe van de Pentium Pro die cache van 1MB!! Best wel veel eigenlijk en door die Cache had de P Pro zijn snelheid het benut van. Mijn Buurman heeft een Intel Pentium Pro 200 met 128 mb EDO geheugen en hij heeft hem een benchmark gegeven met een verglijking van een Intel Pentium II 300 met 64mb PC-100 en de verschillen waren heel klein en soms met 3D bewerking was die Pro zelfs sneller!!! Tja vind je het gek 1 mb Full speed L2 cache geheugen ten op zichte van de PII's half speed L2 cache van maar 512 kb, das ook een groot vershil hoor :9 :9 :9!!!!!!!!
Idd, in m'n server steken ook 2 PPro 200's, en die zijn echt onwaarschijnlijk snel (als je de Mhz en leeftijd in rekening neemt).

Tja, dus slaan ze bij intel weer de bal mis, of ben ik nu een beetje tr fel aan't generaliseren?

Want een deja-vue geeft het wel een beetje, die PPro's waren voor de gewone consument ook totaal niet te betalen. (en aan de heatsinks te zien,zijn ze ook niet echt zuinig)
Het lijkt wel Milli Vanilli
Blijkt na een hele tijd pas dat het eigenlijk allemaal anders in elkaar zit en dat je als publiek genept wordt....
m.a.w.

Ze hebben eerst een echt super rekenbeest ontworpen, maar omdat die pas echt duur zou zijn, niet uitgebracht.
Een perfecte voortzetting van de stapsgewijze verbeteringen. Waarom toch altijd....
oh ja... omdat wij het niet willen betalen. Zou de macht dan toch bij de consument liggen ?

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True