Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 26 reacties
Bron: HardwareCentral

Sander Sassen van HardwareCentral heeft vanuit het Intel Developer Forum in San Jose wat info bij elkaar geharkt over de Intel Pentium 4 processor. In zijn preview lees je over neuheiten als Hyper Pipelined Technology, Execution Trace Cache en Streaming SIMD Extension 2 (SSE2) waarmee de P4 ons later dit jaar blij gaat maken:

With the introduction of a 20-stage pipeline in the Pentium IV, the longest ever implemented in an x86 CPU, Intel has found a way to run it at very high clockspeeds, in excess of 1.5 GHz. A longer pipeline can be used to increase a CPUs clockspeed by trading off the number of stages against clockcycle duration. As an instruction is processed in stages, a 10-stage pipeline divides an instruction into 10 steps and takes 10 clockcycles to process the entire instruction; during every clockcycle a stage of the instruction is finished. Due to its 20-stage pipeline Pentium IV takes 20 clockcycles to finish one instruction, so very little processing is done within a single clockcycle and it can be very short.

[...] Another performance booster is the Trace Cache; a trace cache will try to store the instructions in the sequence in which they are executed. For example, if instruction A jumps from location 100 to instruction B at location 200, the trace cache will store B in a location right behind A. So the trace cache simplifies processing by making sure that instructions are in the right sequence.

[...] Overall, Intel has implemented some quite inventive solutions in the Pentium IV to attain clockspeeds in excess of 1.5 GHz. If properly supported and implemented, the new SSE2 instructions, the long pipeline, the trace cache and the improved branch prediction algorithms all contribute to a CPU that could turn out to be a wolf in sheeps clothing.
Moderatie-faq Wijzig weergave

Reacties (26)

Klinkt wel erg interessant allemaal. Wat me het meest verbaast is dat iedereen zo'n twee weken geleden zat te twijfelen of Intel zou kunnen opboksen tegen AMD omdat ze nog niet eens de Gigaherz op de markt hadden.

Nu lijkt het erop of ze opeens vooruit komen te liggen op AMD, zeker als ze hun nieuwe technologieen patenteren. Het is natuurlijk nog wel toekomstmuziek, maar Intel lijkt nu wel stevig in zijn schoenen te staan (op papier dan).
Ik las in dit artikel:
www.tweakers.net/nieuws.dsp?ID=12801
Dat intel grote problemen gaat krijgen met productie capiciteit en zo... Dus.. ik denk dat intel het nog zwaar gaat krijgen...
Je moet niet vergeten dat die leveringsproblemen gewoon komen door hun eigen succes. Als intel hetzelfde verkocht als amd was er echt geen tekort, echter de vraag is en blijft zo groot dat ze het niet aan kunnen.

Het is dus zeker nog lang niet zo dat intel in de problemen is, maar de ontwikkelingen in de verre toekomst lijken me interresant.
Misschien komt het ervan dat amd gelijkwaardig aan intel wordt.

Laten we het hopen, dat levert lekkere concurrentie op. Want iedereen die nu zit te roepen dat amd intel mag smashen vergeet even dat als amd ooit zo'n positie zou krijgen als intel had/heeft ze waarschijnlijk hetzelfde worden.
Want amd is ook gewoon een bedrijf, geen ideeele organisatie voor goedkope procs ;)
Je moet je niet vergissen, AMD verkoopt de laatste tijd erg goed! Misschien overtreffen ze Intel, misschien niet, ik weet het niet.

Wat je zegt over de eventuele AMD monopolie-positie, dat is natuurlijk wel waar. Als AMD de grote heerser in CPU land is, dan zullen ze ook gewoon dikke prijskaartjes aan hun producten hangen.
Reken er maar op dat AMD voorlopig nog een lange weg te gaan heeft tot het Intel voorbijstreeft in de verkopen... Intel is op processorgebied echt nog steeds groter hoor.
Maar als Intel niet kan leveren dan kost dat marktaandeel - AMD krijgt zo een kans om CPU's te verkopen niet alleen omdat ze beter zijn, maar omdat er gewoon een gat te vullen is. Als Intel had kunnen leveren en niet in korte tijd een aantal blunders had begaan en foute inschattingen had gemaakt, dan had AMD veel minder poot aan de grond kunnen krijgen, ongeacht hoe goed of slecht de Athlon is t.o.v. PIII en nu P4. Een marktleider die aan de vraag kan voldoen kan tijdelijk de prijs verlagen om het de concurrentie extra moeilijk te maken. Dan hou je je marktaandeel en krijgt de concurrent het erg lastig. En leveringsproblemen ontstaan niet door succes, maar doordat de produktie niet groot genoeg is om aan de vraag te voldoen. Of de vraag is verkeerd ingeschat, of er zijn produktieproblemen.

En wat de P4 betreft, ik heb al aardig wat previews gelezen, speculaties over performance etc. Het wordt tijd voor benchmarks!
Je hebt deels gelijk, maar beweren dat AMD processoren per definitie beter zijn is natuurlijk onzin. Ze doen niet echt onder, maar zijn zeker niet beter. Ze zijn goedkoper, maar aangezien Intel nog steeds de professionele markt in handen heeft en aangezien daar minder op geld en meer op performance en betrouwbaarheid wordt gelet zal AMD daar niet zomaar binnen kunnen dringen. Bedrijven die computers leveren met Intel processors kunnen niet zomaar overstappen op AMD omdat Intel niet genoeg kan leveren. Daar zijn contracten voor, bovendien heeft die keuze gevolgen voor de hele PC (hoef ik hopelijk niet uit te leggen) :)

Ik denk dat Intel de productiecapaciteit wel zal uitbreiden, aangezien ze ook al niet genoeg chipsets konden leveren (zie nieuws weekje geleden)... Anders lopen ze inderdaad omzet mis.
AMD verkoopt echt niet zoveel als je denkt. Veel tweakers kopen het, maar dat is maar een superklein percentage van alle computergebruikers en die kopen allemaal intel.
Dat komt omdat het grote publiek nauwelijks verstand van computers heeft. Zij gaan af op wat de grote jongens zoals Dell (en in Nederland Vobis) hun voorschotelen. Dus wanneer de grote jongens massaal AMD adopteren weet je dat AMD echt gaat doorbreken.

Gelukkig weet ook AMD daar de laatste tijd langzaam voet aan grond te krijgen (dankzij Intel zelf trouwens die de levering van hun spul behoorlijk verkloot).

Dus als je AMD in de AH zit liggen, weet je hoe goed het gaat met AMD ;)
Het is net wat je zegt; Hyper Pipelined klinkt wel interessant, maar als je het bovenstaande dus goed leest is de kern van het verhaal dat een processor door die grotere pipelines wel een lekkere hoge kloksnelheid krijgt, maar dat-ie per klokeenheid gemiddeld minder doet.
Bij dezelfde kloksnelheid is dit ding dus langzamer dan een P3 en/of Athlon; her en der op het net kom je schattingen tegen van tussen de 20 en 25%.
Helaas klopt de stelling zoals je opgeschreven hebt niet. In de oude tijden kon een processor slechts 1 maal per clocktick een instructie uitvoeren.

Processoren van nu, delen het uitvoeren van een instructie op in verschillende stappen. Omdat het uitvoeren van instructies in stappen is opgedeeld, kunnen er per clocktick meerdere instructies worden behandeld. Want als instructie 1 in stap B zit, dan zou van instructie 2 tegelijkertijd stap A gedaan kunnen worden.

Dus in het geval van een pipeline die 10 stappen bevat, zal iedere instructie dus tenminste 10 clockcycles duren. Echter doordat instructies elkaar opvolgen lijkt het van buitenaf dat iedere instructie nog steeds 1 clockcycle duurt.

Dus nu duurt nog steeds zoals bij oudere processoren iedere instructie 1 clockcycle, dus wat is nou het voordeel. Doordat je iedere stap minder hoeft uit te voeren, kan de clocksnelheid omhoog, dus is de processor sneller.

Echter een pipeline die meer stappen bevat krijgt meer last van performence loss als de hele pipeline leeggegooid wordt en opnieuw gevuld moet worden door bijvoorbeeld een branch misprediction. Ook dependencies tussen instructies zorgen voor problemen.

En DAT zijn de redenen waardoor de P4 met een pipeline van 20 stappen iets slechter zou kunnen performen tov. een P3 met 10 stappen. Op dezelfde kloksnelheid. Dus de P4 performt niet slechter doordat ie per stap minder doet.
De redenering die jij hier geeft gaat ook niet helemaal op:
. In de oude tijden kon een processor slechts 1 maal per clocktick een instructie uitvoeren.
<knip>
Echter doordat instructies elkaar opvolgen lijkt het van buitenaf dat iedere instructie nog steeds 1 clockcycle duurt.
Als je deze redenering doortrekt, zou dat betekenen dat een 486 op 1ghz net zo snel is als een P3 op 1Ghz, omdat er per clockcycle maar 1 instructie wordt uitgevoerd. Dat zou betekenen dat het hele processorontwerpen neerkomt op meer Ghz'en halen en meerdere pipes naast elkaar zetten.

Volgens mij kunnen er per klokcycle wel degelijk meerdere instructies uitgevoerd worden. En valt er dus op drie fronten winst te halen:
-slim proc ontwerp (efficient, cache, etc)
-ghz (een proc op 2Ghz is sneller dan dezelfde proc op 1Ghz, daarom doen wij tweakers ook zo graag overklokken)
-ls 1 unit niet snel genoeg is, dan er maar gewoon meerdere van instoppen (dus meerdere pipelines ed. Of zoals AMD het doet: als je geen sterke fpu kan ontwerpen, stop je er toch gewoon 3 in: geeft hetzelfde effect en als het werkt...... )

* 786562 Lampje
Wat ik hier natuurlijk vertel is wel een heel simpele weergave, want ik heb geen tijd en zin om een nog langer verhaal natuurlijk te schrijven.

Maar inderdaad, als een 486 en een Pentium evenveel pipelines zouden bevatten (die hetzelfde werken) en iedere instructie zou precies dezelfde latency hebben, dan zou inderdaad een 486 op 1 GHz hetzelfde presteren als een Pentium op 1 GHz. Maar doordat de Pentium minder per stap uitvoert (dus diepere pipeline), kan hij dus theoretisch op hogere kloksnelheden draaien. En dat is de winst zeg maar.

En zomaar pipelines erbij stoppen werkt niet. Inderdaad van 2 FPU pipelines naar 3 pipelines gaan geeft nog voordelen, maar van 3 naar 4 gaan levert je veel en veel minder op. Dan krijg je namelijk steeds meer te maken met data dependencies tussen instructies in verschillende pipelines, waardoor tijdelijk de pipelines niets doen. Dus alleen maar pipelines erbij stoppen heeft echt geen zin.
Maar aangezien de pIII nooit een kloksnelheid van 1.5 GHz zal halen (door de struktuur van de proccesor+bus)
gaat Intel een nieuwe chip uitbrengen (P4)
de hele structuur van de chip verandert weer,de eerste p4 zal niet veel sneller zijn als de laatste pIII die uit zal komen mischien, maar dat is altijd zo bij overgangen tussen processoren (tussen de pI 233 en pII 233 zat kwa snelheid nie veel winst) maar omdat de hele struktuur anders is kunnen ze in de toekomst veel snellere bouwen die wel weer veel sneller zijn als de huidige processoren.
Die lange pipeline is gewoon een truukje om hogere kloksnelheden te kunnen halen. Een lange pipeline op zich is nadelig voor de snelheid (net als een te korte pipine), dus of het nu veel nut heeft betwijfel ik.

Maar de gemiddelde computergebruiker kijkt natuurlijk alleen maar naar het aantal MHz en dat weet Intel.
Ik wil niet flamebaiten, maar ik denk niet dat Intel of AMD zich het gebruik van dit soort 'truukjes' kan permitteren. Dat zou door alle hardware-journalisten doorzien worden en worden bekritiseerd. Ik denk dat dit 'truukje' eerder nodig is om in combinatie met SSE2 instructies tot betere prestaties te kunnen komen.
Ok, de PIII kon de mooie nieuwe procs van AMD niet aan (bijv. de 1,5 ghz gehaald door die japanner :) ) Maar Intel ligt zo maar wel ff voor op AMD met hun PIV tje. Is er al iets bekend over een antwoord van AMD op die PIV? en wordt dat dan Socket A? of WEER een nieuwe?

mvg
Strikt genomen is Athlon (classic) het antwoord op de P4. Athlon wordt namelijk al tot de 7e generatie x86 CPU's gerekend, terwijl Intel de zesde generatie nog verder heeft uitgemolken. (AMD's 6 CPU's waren daar te slecht voor).

Ik verwacht dat AMD voorlopig wel bij Socket A blijft, maar ik kan dat natuurlijk niet garanderen.
Ik zou niet al teveel waarde aan SSE2 hechten. Ik zou bijvoorbeeld geen idee hebben hoe je een instructie als "vector gedeeld door vector min vector plus vector" zou moeten teopassen. En dat geld voor de meeste van die 144 (?!) SSE instructies. Maar misschien ligt dat aan mij...
Dat ligt aan jou denk ik. Vul voor "vector" maar wat nuttigs in:
- een reeks coordinaten (geometrie setup voor je 3D kaart)
- een reeks pixels (een 2D plaatje kun je ook als vector opvatten, frames in een DVD film ook)
- een reeks geluidssamples die je wilt bewerken (wav, mp3 editing)
- een reeks wetenschappelijke meetwaarden (in de P4 nu ook met dubbele precisie - Hoera!)
- etc etc

Je schrijft: vector gedeeld door vector min vector plus vector. Een prima formule om een beeld mee te bewerken: Schaal het beeld (/), maak het wat donkerder (-), en tel er een ander beeld bij op (+).

Bedenk verder dat het succes van de eerste supercomputers (cray, convex, amdahl etc) gebaseerd was op vector instructies. Ook het gebruik van extra PC insteekkaarten, zogenaamde "array processors", was een aantal jaren terug erg in de mode. Processoren waren toen niet snel (286,386), maar door 128 waarden tegelijkertijd te bewerken werd het een stuk sneller. Het is grappig om te zien dat deze zelfde overweging nu weer terug komt, alsof de proc chip bakkers weer tegen grenzen aan beginnen te lopen.

Wel waarde aan hechten dus. Double precision vector instructies? GIMME GIMME GIMME
Ik zi hier heel veel staan dat de P4 clock voor clock langzamer zou zijn dan de p3 omdat deze pipelines van 20 diep heeft tegenover de p3 met pipelines van 10 diep.

Dit hoeft echt helemaal niks te maken te hebben met de clock voor clock prestaties. Het idee is dat als je een p3 met 10 diep een instructie voert hij altijd minimaal 10 clockcycles nodig heeft om deze instructie helemaal af te werken. Bij de p4 zal dit 20 cycles wezen vanwege de diepere pipeline.

Maar het idee met pipelining is juiste dat elke stap altijd bezig is met een andere instructie. Dit komt neer op een eenmalige vertraging bij het aanzetten van je pc van 10 clockcycles.

Wat wel een probleem kan zijn is een pipeline 'stall' waarbij er iets mis gaat in een van de stapjes. Hoe meer stappen er dan zijn hoe langer de vertraging hierbij is. Maar intel heeft heel goed zijn best gedaan om dit te voorkomen door onder andere betere 'branch prediction' en 'trace cache' en dergelijke oplossingen.

Al met al zou het net zo goed kunnen zijn dat de p4 clock for clock sneller is al de p3.
Een professor in de processortechnologie ben ik niet, maar als leek krijg ik de indruk dat Intel het, naast een slim cpu ontwerp, ook vooral van de SSE2 instructies het snelheidsvoordeel moet gaan krijgen. Zoals dit ookal bij de PIII het geval was, maar dan in iets mindere mate. Het wordt dan denk ik vooral zaak dat software hier goed gebruik van gaat maken. Staks zien we misschien weer dat in sommige benchmarks de prestaties van een P4 lijken tegen te vallen vergeleken met een AMD processor, maar dat applicaties die goed zijn toegesneden op die SSE2 instructies een ontzettende versnelling zullen kennen. Vraag me ook af of er dus geen speciale benchmarks nodig zullen zijn om dit te kunnen meten.
ook al wordt die p4 zo snel hij is nog steeds niet te betalen. dus ze liggen wel voor maar de meeste mensen kopen geen processor van 1500 a 200 gulden
Ziet er allemaal heel mooi uit, maar totdat Intel een DDR RAM mobo aanbiedt blijft het voor mij geen alternatief.
Ik heb nog steeds veel vertrouwen in AMD, maar ik denk niet dat ze plots de markt gaan overnemen van Intel, want HEEL veel bedrijven en OEMs die hebben gewoon een old-grown vertrouwen in Intel, terwijl AMD steeds meer populariteit wint bij de gamers, tweakers enzovoorts. AMD is goed in PR en ook errug goed in produceren, wat een sterke combinatie is. Ik dacht eerlijk gezegd een week geleden (nadat Intel de specs over de Itanium bekend had gemaakt) dat AMD Intel voorbij zou razen en dat mijn volgende systeem een AMD procje zou hebben, maar nu weet ik het niet, wel weetik dat Intel's procs het niet van de cache-grootte moeten hebben, want anders had Intel daar al lang vol trots een pers bericht over ge-released (tenzij ze niet willen dat AMD het te weten komt ofzowiets, maar dat lijkt me sterk). Ik denk dat good ol' Intel dat heus wel weet en daarom something else up their sleeves heeft, maargoed, dat zal de tijd ons leren. AMD is IMHO nog steeds de 'winnaar' van de specs, met 1,5MB l2 full speed cache, maarja, wie weet wat Intel uit gaat p00pen :P
}>

AMD verkoopt bij ons in ieder geval beter dan Intel.
9 van de 10 systemen die bij ons besteld en gebouwd worden bevatten een AMD processor.
Ik vindt het wel erg jammer dat ze weer bezig zijn met die platte klere processoren.
Vond de Slot A toch iets fijner om mee te werken.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True