Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 39 reacties
Bron: Chip Architect

Chip Architect heeft een vervolg geplaatst op de eerdere analyse van de Prescott-core. In het vorige artikel werd al duidelijk dat Intel veel meer met de Pentium 4 core doet dan simpelweg verkleinen en hoger klokken. Er zijn al meer dan genoeg aanwijzingen om aan te nemen dat Prescott op gelijke kloksnelheid beter presteert dan Northwood, en dat er zelfs nog ruimte is voor toekomstige verbetering van de IPC. Nu is er echter nog reden aan de lijst toe te voegen, die meteen verklaart waar de mysterieuze tweede Rapid Execution Engine die werd gespot op de plaatjes voor dient. Dit heeft namelijk alles te maken met het verbeteren van HyperThreading.

Pentium 4 HT HyperThreading logo (klein)De x86-instructieset met al zijn uitbreidingen is enorm en de opdrachten kennen geen vaste lengte. Dat werkt natuurlijk niet erg handig, dus intern werkt een processor met een veel kleinere subset. Iedere instructie wordt gedecodeerd in n of meer van deze zogenaamde Ops. Een logisch gevolg van HyperThreading-technologie is dat er meer van deze 'micro-operations' tegelijkertijd uitgevoerd moeten worden. Dat uitvoeren gebeurt echter niet serieel maar zo efficint mogelijk, en dat betekent in de praktijk zoveel mogelijk tegelijk, ook al moet het kriskras door elkaar. Je snapt dat het een heel gedoe is om ervoor te zorgen dat iedere opdracht de juiste invoer krijgt, en het resultaat op de goede plek terug wordt gezet. De Register Alias Table (RAT) speelt daarbij een belangrijke rol.

Prescott verbeterd design (2)

In Northwood biedt deze tabel plaats aan 126 Ops, en met HyperThreading wordt dat dus beperkt tot 63 per thread. Aan de hand van de foto van de nieuwe core heeft Hans de Vries echter met redelijke zekerheid vastgesteld dat Prescott met 256Ops tegelijk om kan gaan, oftewel 128 per thread. Tevens zegt hij dat het zeer waarschijnlijk is dat iedere thread zijn eigen Rapid Execution Engine toegewezen krijgt. Niet alleen krijgen de individuele threads dus meer ademruimte, maar ook nog extra rekenkracht. Het prestatievoordeel dat met HyperThreading behaald kan worden zou door deze verbeteringen moeten stijgen - met name in integerapplicaties.

Behalve voor het verbeteren van HyperThreading met twee threads is de infrastructuur van Prescott ook klaar voor HyperThreading met vier threads tegelijk. En fysieke processor zou zich dus aan het operating systeem kunnen presenteren als een quad-configuratie. Natuurlijk zijn de prestaties daar dan niet meteen naar, maar voor bepaalde toepassingen zou het toch erg interessant zijn hier gebruik van te maken. Voorspeld wordt dan ook dat Intel 4-way HyperThreading in de desktopversie van Prescott uit laat staan. De serverversie - de 0,09 micron Xeon met codenaam Nocona - zou echter goed gebruikt kunnen worden als testvehikel voor de technologie.

HyperThreading zichtbaar in taskmanager
Moderatie-faq Wijzig weergave

Reacties (39)

Toch vind ik het heel verwonderlijk - en tegelijkertijd heel erg goed voor Intel - dat Intel zo'n grote 'marge' heeft. Het lijkt alsof het hun heel makkelijk afgaat. Ze kunnen de Pentium - 4e generatie inmiddels - steeds erg ver opschalen. Zij hebben nauwelijks problemen met productietechnieken, en bovendien geven zij de toon aan in processor-land. AMD volgt Intel - welliswaar relatief dichtbij - in alle nieuwe ontwikkelingen, maar het is wel steeds Intel die nieuwe technieken en features introduceert waar de markt echt iets aan heeft.

Tot slot heeft Intel een geweldig marketingbeleid en -budget. Ie-der-een kent Intel.
Petje af voor Intel!
Nou die leiding die ze hebben in processorland is echt niet omdat ze zo hard werken of de beste engineers hebben.

Het is gewoon het feit dat ze vele malen meer geld te besteden hebben dan AMD, als AMD dezelfde financieen in deze situatie zou hebben als Intel hadden ze zee waarschijnlijk veel beter gepresteerd want AMD werkt gewoon zeer efficient omdat ze gewoon geen andere middelen hebben.
Blablabla...

Tuurlijk hebben ze die wel door hard werken en goede engineers....hetgeen niet betekend dat ze dat bij AMD niet hebben..
Intel heeft gewoon eerder de stap kunnen nemen om van de vorige architectuur af te stappen, in het begin heeft ze dat ook een boel problemen opgeleverd, nu ze eindelijk de vruchten plukken van hun werk is het ineens weer alleen een kwestie van geld....
Over de ontwikkelingen:
De laatste Alpha processor heeft al tijden 4-weg HTT, deze techniek wordt nu pas door intel gebruikt.

Bovendien heeft ook AMD een patent op hypertreading, misschien dat ze daar de hammers ook mee uitrusten, niemand weet het zeker op dit moment.

ps hypertreading heeft pas echt zin als je een processor hebt die een hoge IPC heeft, de eerste Alpha die HTT 2x ondersteunde had hier veel meer profijt van dan de P4 omdat deze Alpha een (veel) hogere IPC had. (soms tot 250% sneller)
Het is me niet helemaal duidelijk wat deze marge nou eigenlijk. Het resultaat van het parallel uitvoeren van micro/nano-code instructies is dat er per clock tick meer x86 instructies uitgevoerd worden. Ik meen te herinneren dat juist AMD hier het pionierswerk heeft verricht, terwijl Intel het juist in de brute kracht van meer MHz-en heeft gezocht. Kortom wat dit aspect betreft volgt Intel z'n concurrent AMD. Qua chiptechnologie en marketing loopt Intel voor, maar op het gebied van processor architectuur (ook in de embedded MCU en de DSP wereld) zijn het toch echt andere bedrijven die voorop lopen..
Ze kunnen de Pentium - 4e generatie inmiddels - steeds erg ver opschalen.

De originele Pentium 4 was zo'n waardeloze processor (qua techniek) dat het relatief *kuch* makkelijk *kuch* is om hem te verbeteren.
Deze versie van HT die dus 2 of 4 threads tegelijk kan afhandelen heeft dus itt de huidige versie van HT WEL extra rekenkracht tot zijn beschikking. Ook de 2-thread versie (Desktopversie) gebruikt de extra Rapid Execution Engine daardoor zal de IPC van de P4 dus weer omhoog gaan.
Zo langzamerhand loopt de P4 dus niet alleen heel snel, maar de passen worden ook steeds groter.
dat ziet er wel cool uit hoor die performance monitor, maar wie zegt dat het hier niet om een board gaat met 4 processors, ze hadden ook ff rechtermuisknop mijn computer moeten laten zien :)
dat ziet er wel cool uit hoor die performance monitor, maar wie zegt dat het hier niet om een board gaat met 4 processors, ze hadden ook ff rechtermuisknop mijn computer moeten laten zien
Omdat als je leest je ziet dat de processor er nog helemaal niet is.

Iemand enig idee hoe het met je windows licentie zit als je een dual Xeon/Nocona dan koopt. Ben je dan gelijk verplicht om windows 2003 datacenter te kopen omdat je 2 xeons zich voorstellen als 8 gewone processoren aan het os? Of gaat microsoft licenties veranderen?

"This os is licensed for 2 physical processors" ;)
Waarschijnlijk gaat het net als met de huidige HT, die door de MS-Os-en wel als een processor wordt gezien als je naar de licentie-vorm kijkt, maar als 2 processoren als je naar de "reken-eenheden* " kijkt.
Intel zorgt er heus wel voor dat er voldoende betaalbare software is voor hun processoren, dus dat regelen ze wel even met MS, denk ik.

Natuurlijk wordt op een groot deel van de Xeon computers wel een Linux-OS gedraaid en daar speelt het probleem sowieso niet, maar Intel wil ook de Windows gebruikers graag te vriend houden dus die regelen wel wat met MS.

* Er zijn natuurlijk niet 2x zo veel reken-eenheden, er kunnen alleen 2 threads tegelijkertijd worden verwerkt door n core, maar ik wist niet hoe ik het anders moest noemen.
MS heeft gelukkig ingezien dat twee logische CPU's niet gelijk zijn aan twee fysieke CPU's, waardoor je dus op een normale Windows XP licentie rustig een HTT enabled CPU kan draaien.

Windows 2000 en eerdere MS OS'en zien helaas niet of het om twee logische of om twee fysieke CPU's gaat, maar gelukkig heeft Windows 2000 Professional ondersteuning voor 2 CPU's. Dus voorlopig kan je nog rustig een Northwood met HTT of een Xeon draaien. Als je dual Xeon gaat draaien pak je toch wel Windows 2000 Server of Windows 2003 Server (of natuurlijk Linux of Unix).

Tegen de tijd dat er een P4 met 4-way HTT wordt geleverd gebruiken er weinig mensen nog Windows 2000, al helemaal omdat XP beter omgaat met HTT kwa performance.

Maar MS is het probleem niet, er zijn zat andere programma's waar je voor het aantal CPU's een licentie betaald, Oracle is een goed voorbeeld. Als die bedrijven geen onderscheid maken heb je een probleem als je een HTT enabled CPU gebruikt. Dan kan je beter HTT uit zetten, dan ben je goedkoper uit.
Screenshot komt van een dual Xeon systeem af met (2-way) HyperThreading ingeschakeld, maar zo zou een Nocona met 4-way HyperThreading er ook uit zien. Nergens wordt beweerd dat iemand al een werkende versie van Nocona heeft, laat staan er screenshots van gepost heeft.
Over dat plaatje van die taskmanager, waar komt die 'Page File Usage' vandaan? Ik ken alleen 'Memory Usage History'
Het verbaast me niets dat Intel de architectuur van hun processoren met iedere generatie waar mogelijk verbeterd. Blijkbaar geven ze er alleen minder ruchtbaarheid aan dan AMD... :)

Beter voor de consument, want je krijgt meer dan alleen ruwe MHz'en voor je geld.
Ik denk dat Intel een beetje geheimzinnig doet over de verbeteringen om de concurrentie voor te blijven maar daar wel het meeste geld mee te verdienen.

Zo kunnen ze kiezen een nieuwe verbetering door te voeren zodra het nodig is om de concurrentie voor te blijven. Het is gunstig om sneller te zijn dan de concurrentie, maar meer dan een beetje sneller zijn is voldoende om marktaandeel te vergroten. Daarom is het nuttig om bepaalde verbeteringen (en daardoor snelheidsvoordelen) achter de hand te houden als je al sneller bent dan de concurrentie.

Door de verbeteringen pas in een later statium aan te schakelen kan je flexibeler inspelen op de concurrentie, en dezelfde core langer mee te laten gaan. De productielijn hoeft dan niet aangepast te worden, dus kunnen er kosten bespaard worden.

Kortom, Intel is bedrijfseconomisch gezien heel slim bezig. Wel is het voor de consument jammer dat zij pas in een later stadium vooordeel hebben van de al op de core aanwezige technologische verbeteringen.
Dat Intel niet doet aan PR ratings. Ik zou het wel weten. Zo'n 3.06 Ghz zou wel sneller gaan dan echt 3.06 Ghz
Je hebt wel een beetje gelijk, maar ik denk dan dat eerder AMD zijn rating eens goed onder de loep moet gaan nemen. Dit omdat zij deze gebruiken om een vergelijking mogelijk te maken voor de consument tussen de 2 processoren qua performance. Je ziet nu al dat bijvoorbeeld de nieuwe AMD barton 3000+ met 512KB cache en 333 FSB slechter scoort dan de intel 3,06GHz. Dat is dus eerder een - dan een + :'(
Ik ben er alleen bang voor dat intel het helemaal niet nodig vind om deze 4-way HHT al bij de introductie van Prescott (einde van dit jaar) in te schakelen (zoals overigens ook al aangegeven hierboven). Wat kan AMD nou tegen een ~ 3,5 GHz Prescott inbrengen? De Athlon64 zal uitkomen rond of iets boven de 1,5 GHz. Ondanks de superieure IPC van laatstgenoemde proc. verwacht ik dat de Prescott sneller is en voorlopig zal blijven (of AMD moet heel hard gaan opschalen qua MHz'en).
Ze zijn echt niet dom bij AMD hoor. Ze zullen razendsnel op kunnen schalen. Maar je brengt natuurlijk altijd het laagste model eerst uit (nou ja, bijna altijd dan ;)) anders verziek je je eigen markt.

Zoals het er nu naaruit ziet zal AMD op dit soort snelheden Intel op dat soort snelheden bij kunnen houden. Dit blijkt dan weer voor Inter, die dan zo'n systeem weer inschakeld, waarna AMD weer wat inschakeld en opschaald. En zo gaat het maar door! Zo houd je altijd voor jezelf de markt open.
En je gaat een wagen kopen met een 5000 toeren per minuut motor??? Maar je weet niet hoe snel dat die wagen kan rijden, geen idee van koppelcurve,... De prestaties van zo'n wagen is van veel meer factoren afhankelijk dan toerentallen. Hetzelfde met de pk's, personenwagen met 150pk is iets anders dan een bestelwagen met 150pk.

De klokfrequentie zegt ook niks over de prestaties van een CPU, vergelijk eens een VIA C3 1GHz tegen PIII coppermine 1GHz en Athlon Thunderbird 1GHz. Maar n00bs weten dat niet...
[edit]
Ik had dit verkeerd verstaan...
[quote]

Beter voor de consument, want je krijgt meer dan alleen ruwe MHz'en voor je geld.

[/quote]
dacht aan ruwe MHz voor je geld...
Nu krijg je een probleem in de taskmanager van een quad-Xeon: 16 CPU's.. :?

Serieus: Weet iemand hoe threads verdeeld worden? Ik bedoel, ik heb wel eens begrepen dat een fysieke dual-CPU processen krijgt toegewezen, welke dan op die CPU blijven draaien. (wat dan weer niet geldt voor de dual- of quad-optimized software).
Hoe gaat dat hierbij? Lijkt me toch irritant als je programma ineens op een kwart van je CPU blijft draaien, terwijl je verder alles hebt afgesloten..

Dus: wijst de CPU threads dynamisch toe (soort van stikmachine:1,2,3,4,1,2,..), of wordt dat door het OS gedaan?
Serieus: Weet iemand hoe threads verdeeld worden? Lijkt me toch irritant als je programma ineens op een kwart van je CPU blijft draaien, terwijl je verder alles hebt afgesloten..
Dus: wijst de CPU threads dynamisch toe (soort van stikmachine:1,2,3,4,1,2,..), of wordt dat door het OS gedaan?
Volgens mij handelt de CPU(s) zelf de verdeling van de individuele threads af. Het verschil tussen Multi-core/multi-thread optimized software en "gewone software" is dat de multi-versie meer en kleinere threads aanbied. Deze worden door de CPU(s) zelf verder verdeeld.

Dit maakt het ook logisch dat je geen multi-CPU opstelling kunt maken met "gewone" CPU's, die zijn immers niet in staat om samen de threads te verdelen. Omdat verschillende CPU's vaak van een productielijn komen en onderdelen van de CPU later pas uitgeschakeld/ingeschakeld worden, kan het soms zijn dat een desktop CPU toch ondersteuning heeft voor multi-gebruik, zoals celerons, geruchten over de P4 en AthlonXP processoren
De CPU wijst threads niet dynamisch toe. Hierdoor zou de snelheid van het systeem afnemen.

De CPU wordt belast tot een zeker niveau (zeg 90%) de eerstvolgende opdracht wordt dan aan de 2e CPU gegeven. De CPU's onthouden beide welke opdracht de ander uitvoerd. Dit gebeurd in het cache geheugen. Het cache van beide processoren vormen kopien.

Op het moment dat je de taken bij 10% belasting al over twee processoren zou verdelen neemt de totale belasting iets toe omdat de processor nu ook bij moet houden wat de andere processor doet.

Omdat alle processoren kopien van elkanders cache hebben, dient de hoeveelheid cache toe te nemen naar mate het aantal processoren toeneemt. 2 proc --> min. 512KB cache, 4 proc. --> min. 1MB cache, 6/8 proc. --> 2MB cache etc.

Programma's die geschreven zijn voor gebruik van multithreading (bijv PhotoShop) zijn zeer rekenintensief en verdelen de berekeningen altijd over meerdere processoren.

Het OS moet wel ondersteuning bieden voor meerdere processoren anders wordt alleen de hoofdprocessor aangestuurd. De verdeling van de taken over de CPU's wordt verder door de CPU's zelf geregeld. Zou dit softwarematig gebeuren dan zou een groot deel van de voordelen van multi-cpu systemen wegvallen.
Ehh... Windows 2000 en XP zijn maar gemaakt voor 1-2 processors...

Ziet hij dit dan echt als 4 processoren??

Zit je dan direct aan de server licentie vast?

hmmzzzz.... Dubbelpost :P
Dat lijkt me niet zo'n probleem, daar 'ie toch eerst als server-CPU op de markt gaat komen.
Wat ik interessanter vind is de licentie van sommige database-achtige toepassingen als Oracle. Die worden betaald per te gebruiken CPU.
Dat zou in dit geval een beetje vervelend zijn, omdat je met een Quad-Xeon veel meer performance haalt dan met een enkele 4-way HT CPU.
W2K server ondersteunt 4 processoren. Enig nadeel om W2K server te draaien is dat sommige client applicaties niet draaien naast het licentie feit.

Een goed voorbeeld hiervan is McAffee of Norton Antivirus. De standaard client krijg je hier van niet aan de praat omdat je OS een server OS is.

Daar meeste tweakers brave borsten zijn die al hun software legaal willen aanschaffen (vette ;)), ben je dus veel meer geld kwijt om dit optimaal te kunnen benutten...

Voor de bedrijven die extra geld over hebben voor licenties zullen dan ook absoluut niet moeilijk doen om betere hardware aan te schaffen. Dit vooral omdat de hardware niet de hoogste kosten zullen zijn.
Nee hoor, afhankelijk van de versie van Windows 2000 worden maximaal 32 processoren ondersteund (Windows 2000 Datacenter Server).
Dat is dus niet zijn vraag....
Met de w2kpro licentie is het max 2 CPU's en met de duurdere licenties kun je meer CPU's aan.
Oftewel heb je een licentie duurder dan die van de w2kpro nodig voor een 4-way HT-CPU, dat is zijn vraag.
Er word steeds gezegd dat aleen W2ks en AS meer dan 4 CPU`s onder steuen, maar dat is niet zo Ook WinXP kan 4 cpu`s ondersteuen (2 echte proc`s en dan in HT-mode). Kep zelf een systeem geinstalleerd met een dual xeon in HT-mode.

Dus er is wel degelijk een betaal OS voor de consument (en tweaker uiterraad :) )
het gaat hier natuurlijk wel om WinXp pro en niet Home.

dat scheelt weer wat centjes hoor ;)
Ik denk dat als je geld over hebt voor zoveel dure procs dat je dan een tikkie duurder OS wel door de vingers ziet. Zowieso, waarvoor ga je je pc dan voor gebruiken? MS Word met '4' procs?
als ze iets veranderen verbeteren ze ineens alles waardoor een intel processor heel wat langer in waarde blijft staan en niet na drie weken slechts de helft van de prijs die je ervoor neergeteld hebt meer waard is. ik weet dus alvast wat mijn volgende processortje gaat worden of zijn het nu 4 processors ? 8-)
Hoe zouden ze het in performance monitor laten zien als je 2 of 4 van die Quad processoren op je moederbord heb zitten? :+
Dit omdat zij deze gebruiken om een vergelijking mogelijk te maken voor de consument tussen de 2 processoren qua performance. Je ziet nu al dat bijvoorbeeld de nieuwe AMD barton 3000+ met 512KB cache en 333 FSB slechter scoort dan de intel 3,06GHz. Dat is dus eerder een - dan een +
Nope. AMD heeft de rating ingevoerd om een vergelijking te maken tussen nieuwere CPU's en de originele Athlon CPU's. De hele PR-rating heeft niks met iNtel te maken.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True