Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 30 reacties
Bron: Ars Technica

Bij Ars Technica is een technisch artikel (duh) verschenen waarin het design van de Pentium 4 vergeleken wordt met die van de G4e. Het gaat voornamelijk over de Pentium 4, de G4e wordt slechts gebruikt als vergelijkingsmateriaal. In het artikel wordt ingegaan op veel features en kenmerken van de Pentium 4 zoals de pipeline, de trace-cache en de double-pumped ALUís. Voor de mensen die echt willen weten hoe een CPU werkt en de Pentium 4 in het bijzonder een leuk stukje leesvoer. Hieronder een stukje uit de introductie:

Intel Pentium 4 logo (kleiner) When the Pentium 4 hit the market in November of 2000, it was the first major new x86 microarchitecture from Intel since the Pentium Pro. In the years prior to the P4's launch the P6 core dominated the market in its incarnations as the Pentium II and Pentium III, and anyone who was paying attention during that time learned at least one, major lesson: clock speed sells. Intel was definitely paying attention, and as the Willamette team labored away in Santa Clara they kept MHz foremost in their minds. This singular focus is evident in everything from Intel's Pentium 4 promotional and technical literature down to the very last detail of the processor's design. As this article will show, the successor to the most successful x86 microarchitecture of all time is a machine built from the ground up for stratospheric clock speed.

This article will examine the tradeoffs and design decisions that the P4's architects made in their effort to build a MHz monster, paying special attention to the innovative features that the P4 sports and the ways those features fit with the processor's overall design philosophy and target application domain. We'll cover the P4's ultra-deep pipeline, its trace cache, its double-pumped ALUs, and a host of other aspects of its design, all with an eye to their impact on performance.

Met dank aan BikkelZ voor de tip!

Lees meer over

Moderatie-faq Wijzig weergave

Reacties (30)

Allemaal leuk en aardig die GHz maar wanneer je in een pipeline van 20 stappen pas op 19 stap gaat kijken of het commando wat uitgevoerd word afhankelijk is van een ander commando...en dat met out-of-order-execution...Op dat moment hoop je maar dat die branch prediction erg goed is, want de prijs voor een fout execution is erg hoog. De hele pipeline moet geflushed worden (op zijn minst) en dat duurt toch weer zo'n 19 clockpulsjes...Oops foutje, bedankt. Intel zal er wel een hele goedde reden voor hebben om dat zo te doen, welke is mij onbekend.
Deze nieuwe architectuur (de Pentium vier dus) is speciaal gemaakt om hoge frequenties te halen. Daarvoor hebben ze er een lange pipeline ingebouwd. Een langere pipeline is goed voor de frequentie. Maar zoals jij al heel mooi hebt uitgelegd is het slecht voor de branch prediction.

Tot nu toe werkt deze lange pipeline in het naadeel van de P4. De Athlon kan hem immers nog steeds bijhouden met lagere kloksnelheden. Maar wanneer de kloksnelheden hoger worden en de software geoptimaliserd wordt voor de P4, zal deze een heel stuk sneller worden.

Wat meer info over snelheids winst met software optimalisatie vindt je in een posting van een paar dagen oud
http://www.tweakers.net/nieuws/17434
(sorry dat ik zo lui was om er geen pakkend verhaal omheen te zetten.....ik was al blij dat ik door die tekst heen kwam met dit weer :) ).

Maar vergeet ook niet dat het ook langer duurt voordat er uberhaupt een instructie uit komt. Vergelijk de 'classic' G4 met de P4 en je begrijpt wat ik bedoel - tegen de tijd dat de P4 er een instructie uit heeft heeft de G4 er al 5 uit - de G4 draait 'eigenlijk op 2,5 GHz'.
Bikkelz: dat is natuurlijk grote flauwekul. Pipelining houdt in dat elke instructie in een groot aantal stapjes wordt uitgevoerd, maar er zijn net zoveel stukjes onderweg als er stappen zijn. Vergelijk het maar met een buis vol knikkers. Als je er aan de ene kant een in stopt, komt er aan de andere kant een uit. Behalve als de buis leeg is duurt het lang voordat er weer een instructie verwerkt is - equivalent van wat er gebeurt bij falen branch prediction. Een CPU met een kortere pipeline heeft daar minder last van, maar om nou gelijk te concluderen dat hij daardoor op een veel hogere snelheid loopt...
Als je goed zou lezen dan zie je dat de g4+ 7 stages is en de p4 20 stages is.

Hoe dan ook een aardig intr. artikel en up to ars standards. (had voor mijn nog wel wat dieper mogen gaan)

*edit*

aarig ?!?! :)
Ten 1e trok ik een classic G4 7400 (thnx Zakalwe) in mijn vergelijking, die nog een pipeline van 4 stages heeft, ipv 7 voor de G4e.

Ten 2e zet ik 'eigenlijk op 2,5 GHz' niet voor niets tussen haakjes, misschien dat ik wat duidelijker zou moeten zijn geweest, maar een G4 'classic' is net zo snel klaar met de 1e instructie als een 2,5 GHz P4.

Dat de direct daarop volgende instructies bij een P4 er wel sneller uit komen laat ik even daar buiten. Maar dat een processor niet volcontinu belast wordt tijdens normaal gebruik, en ook niet steeds het zelfde blijft doen, is neem ik aan wel bekend.
Bikkelz, niet om flauw te doen hoor, maar een 'Classic G4' heet 7400 of 7410, een 7450 is altijd de G4e/+ geweest.
Waarom draait de G4 eigelijk op 2,5hz :?

Heeft die een kortere pipeline :?
Naast technische mogelijkheden, speelt voor Intel natuurlijk ook kosten, maar ook belangrijk is de marketing. Voor de raarste redenen worden sommige beslissingen genomen...
Die branch prediction haalt +95% juistheid. Stel je voor dat je een lusje hebt dat 100 keer doorlopen wordt. Dan kan je makkelijk stellen dat je altijd hetzelfde commando moet uitvoeren. Je zit dan maar 1 keer op 100 fout... Simpel voorbeeldje, maar die +95% juistheid heb uit gespecialiseerde literatuur, het verbaasde me zelf ook wel... ;)
De architectuur van de G4 is gericht op performance per clock-cycle. En die is ook echt optimaal. Ik denk niet dat er een processor op de markt is die cycle-voor-cycle sneller is dan de G4.

Echter..

Als je een (inferieure) architectuur kunt opschalen tot 2 Ghz.. dan heb je dat performance verlies wel gecompenseerd.. en bijkomend voordeel is dat veel mensen nog steeds geilen op Mhz.. en dat echte performance ze minder interesseert.

De nieuwere PPC designs volgen dit pad enigzins.. ook hier zie je langere pipelines opduiken.
De nieuwere PPC designs volgen dit pad enigzins.. ook hier zie je langere pipelines opduiken.
Klopt, de G4e heeft langere pipelines dan de "oude" G4. Dat is gedaan omdat die "oude" G4 niet veel verder kon dan 500MHz zonder al te veel slechte yields, daarom heeft Motorola de G4e ontwikkeld.

Alleen zie je dat natuurlijk wel terug in de benchmarks, in real-life merk je er heel weinig van (Ik werk dagelijks met de nieuwste Mac's).

De G4(e) is natuurlijk een hele snelle CPU, maar vergeet ook de Altivec unit niet, die compleet vernieuwd is in de G4e. Dankzij die unit is de G4(e) ook zo snel met grafische programma's. (Je kan de Altivec unit vergelijken met SSE2, alleen dan ietsjes beter, niet veel).

[reactie op Zeeger]
De G4(e) die door Apple wordt gebruikt wordt wel door Motorola gemaakt, want zij hebben de Altivec unit ontwikkeld. Tuurlijk heeft IBM ook PowerPC CPU's, maar geen een met de Altivec unit, want daar heeft Motorola alleen recht op.
um, G4=PowerPC processor=Motorola?
De PowerPC is niet helemaal door Motorola ontwikkeld hoor. Het is een samenwerkingsproject van IBM, Apple en Motorola
Ik denk niet dat er een processor op de markt is die cycle-voor-cycle sneller is dan de G4.
De Alpha 21264/EV6 is echt wel sneller voor normaal integer en FPU werk.
De nieuwere PPC designs volgen dit pad enigzins.. ook hier zie je langere pipelines opduiken.
Langere pipelines [dan wat de G4 heeft] zijn absoluut noodzakelijk om een hogere performance te bereiken. De truc is om te voorkomen dat de nadelige gevolgen van lange pipelines zoveel mogelijk te beperken. Bij het simpele concept van de G4 zal dat niet zo belangrijk zijn, maar wel bij een revolutionair ontwerp zoals de P4.
IBM levert G3 processoren met 4 stage pipeline tot 750 MHz......dus ja misschien dat Altivec wel de bottleneck is.
Helaas zit daar ook het nadeel aan zoveel mogelijk per clockcycle doen. Omdat je per clockcycle zo veel mogelijk wil doen moet je veel commando's hebben. vergelijk het maar met begin van de x86 de 8086. Veel commando's, geen pipeline (kwam in pentium). Bij elk commando dat naar de cpu werd gegooit moest de cpu in een groot deel van zijn 'geheugen' checken wat die precies moest doen om commando uit te voeren.
Stap in de wereld van een pentium of hoger. Hierin zijn er twee 'geheugens'. een voor complexe commando's om backwards compatible te blijven en een met minder en kleinere commando's - vandaar dat je in de meeste compilers kun instellen 'pentium/586 optimized'.
Een ander probleem is (G4 en x86-32bit) dat de commando's variable lengtes hebben. Een cpu weet dus niet wanneer een commando eindigt. In de 64-bit versie (EPIC om precies te zijn) is dit verandert (zoals bij de alpha). Commando's worden per 3 aangelevert en hebben allemaal dezelfde lengte. Dit maakt decoderen van commando's een stuk makkelijker en vergt minder transistors. Moeilijkheid is natuurlijk om dit backwards compatible te maken. Dit is nog lastiger dan bijv. de overgang naar de 386, en intel heeft het belooft. Verder heeft de 64bit wel branch prediction aan boord (wat ik heb gelezen) maar EPIC voert gewoon elke branch uit, tot wel 4 diep! Er wordt dan veel rekenwerk gedaan voor niets. Doet me denken aan een artikel op tweakers dat er steeds minder per transistor werd gedaan, dit geld zeker voor de i64.
Had het al vanochtend gelezen, maar was te lui om het te submitten.
Maar het is weer van Ars's uitstekende kwaliteit. Je steekt nog eens wat op van CPU architectuur en je lult de verkopers in de winkel eruit :-)
Dan sta je wel te kijken als een Vobis verkoper precies weet waarover jij het hebt. Want ik lees dit namelijk ook, en werk bij de Vobis. En ik wil graag weten wat ik verkoop. Dus niet elke verkoper weet niet wat hij verkoopt.
Dan ben jij echt een uitzondering :)
Ik ben al zo vaak daar voor de gein ff binnen geweest maar dan kan je echt lachen!!
Tuurlijk zijn er uitzonderingen, maar in de regel moet je niet naar zo'n winkel gaan voor vragen.
Je zegt gewoon ik hebt 3 mille in de binnen zak doet u mij maar een puterje waar ik ook een spelletje mee kan spelen enzo en dat was het. :)
(voor evt op merkingen het is bij dixons en dynabite en media markt niet beter :) :) :) )

Daarom kan je ook geen losse onderdelen kopen de gem klant kan daar niets mee !!
Ook ik heb bij de Vobis gewerkt en werk nu bij een andere computer winkel. Al die tijd lees ik behalve tweakers.net veel vakbladen. Er is altijd een baas boven baas maar als je zo wordt behandeld sta je bij de verkeerde winkel. Ik vind dat een gemiddelde verkoper de gemiddelde klant duidelijk moet kunnen uitleggen wat die koopt en met een gemiddelde tweaker goed mee moet kunnen lullen. Is dat niet zo zoek dan een andere winkel want hoe moet dat als er iets naar de klote is? Ik zou zeggen tweakers, zoek een baan als computer verkoper, dan wordt de wereld er een stuk beter op! |:(
Het is niet echt moeilijk een verkoper eruit te lullen hoor. Als je 6 Maanden lang minstens 1 keer per 2 dagen op tweakers leest weet je al veel meer dan de verkopers weten. Weten vaak minder dan zelfs in het reclame foldertje staat! :r
Is het nou zo ontzettend belangrijk dat je een verkoper eruit lult??? Net of de meeste klanten het boeit wat de floating point van een P4 is!! Kom toch op zeg...een verkoper is er gewoon om de mensen een goed advies te geven met daarbij een leuk verhaaltje. Ga je dan lange , technische vervelende verhalen ophangen dan hebben de meeste klanten al zoiets van : "Het is wel goed, allemaal veel te ingewikkeld zo'n PC ik blijf wel gewoon lekker TV kijken"
Neemt niet weg dat ze het wel moeten weten ALS iemand het vraagt!
Kom mij er eens uitlullen dan :)
Alsof het vreemd is dat ze raar reageren als je om een 1000 GHZ proc vraagt... :D

<edit>
ja he, nu niet ook stiekem er 1 GHZ van maken he!!
</edit>
vind je het gek, als je het hebt over een 1000ghz amd .. Zou ik ook niet snappen - ik zou denken dat je serieus was ..
Nou dan ben je toevallig een HELE slechte verkoper tegen het lijf gelopen hoor. Ik ben zelf ook verkoper maar ik hoop niet dat 1 van mijn collegas opdezlfde manier reageerd want anders kan ie meteen moven, denk ik
<Edit>
onzin
</Edit>

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True