Speculatie over de lange termijn plannen van AMD

Het topmanagment van Intel heeft hele duidelijke doelstellingen gezet voor het verder oppompen van de kloksnel van haar processors. Dit jaar nog vind de overstap naar 0,13 micron plaats, waarmee 3GHz gehaald zal worden. In 2005 zal met behulp van het 0,065 micron P1264 procédé 10GHz gehaald worden, twee jaar later wordt dat maar liefst 20GHz op 0,045 micron. Het huidige Pentium 4 ontwerp kan met de nodige aanpassingen en tweaks 10GHz halen, daarna zal het vervangen of drastisch aangepast moeten worden. HyperTreading zal er in ieder geval voor zorgen dat het hyperpipelined ontwerp van de chip een stuk beter tot z'n recht komt dat nu het geval is. De toekomstplannen van Intel zijn in grote lijnen dus vrij helder, maar waar blijft AMD ondertussen?

Zoals ieder ander bedrijf vraagt AMD ook patenten aan op haar werk. Omdat deze publiek opvraagbaar zijn kon Hans de Vries van Chip Architect het één en ander afleiden over de features van het K8 "Hammer" ontwerp en mogelijk zelfs al van K9 "Greyhound?". Zoals bekend is gebruikt de SledgeHammer twee cores en één gedeeld cache. Een interessante optie voor AMD zou zijn om precies andersom aan te pakken; in plaats van het werk te verdelen over twee losse cores, één core te gebruiken die twee keer zo snel draait en twee keer zoveel pipeline stadia heeft. Zo zouden heel simpel de even cycles voor core 0 kunnen spelen en de oneven voor core 1.

Qua ontwerp hoeft er dan niet zo veel te veranderen als je zou denken en uiteindelijk is het waarschijnlijk sneller en goedkoper. Verder zou het verschil in kloksnelheid met Intel meteen een stuk minder groot zijn. Nadeel is wel dat het bedrijf meteen SMT zou moeten implementeren om te zorgen dat de chips qua prestaties per MHz ongeveer op hetzelfde niveau blijven als die van Intel, maar ex-Alpha technicus Dirk Meyer kan een dergelijk project waarschijnlijk wel in goede banen leiden, mocht het management daarwerkelijk besluiten om deze strategie uit te voeren:

A more elaborately redesigned double frequency core would eliminate the remains of the dual core concept altogether. Scheduling has to take some differences into account but at the end it would be even slightly faster. The cycle delay between the split register-file introduces more latency then the pipelining. The rest of the pipeline can stay unmodified: Instruction fething, branch-prediction, decoding, look ahead unit and at the other end the instruction retiring.

[...] AMD may otherwise decide that it becomes all to complicated given the limited amount of engineering resources and time and "simply" implement two identical existing and less complicated processors on a single die. It could multiply the individual frequencies by two and use that number for sales purposes... and it would not surprise me at all if they could get away with that... :^) The latter stays a backup alternative anyway if more complicated projects are delayed too much.

Bedankt voor de tip EaS.

Lees meer

Reacties (36)

P5ycho @Tinto • 9 oktober 2001 18:39

snelheid betekent geen Mhz... snelheid betekent Mflops etc.

apa @P5ycho • 9 oktober 2001 19:14

Bij x86's kan je eigenlijk best kijken naar de MIPS (dat is algemener dan MFLOPS) omdat dat bij de huidige x86 CPU's erg hoog ligt (doordat integer operaties erg snel zijn, zelfs vergeleken met niet-x86 CPU's zoals de Itanic). De MIPS is algemener en omvat naast de FLOPS ook integer operaties.

Maar de bottom-line is dat je gelijk hebt: meer MHz'en betekenen niet noodzakelijk meer snelheid.

lvh @apa • 9 oktober 2001 20:24

Juist, kijk maar naar Intel vs AMD...

P4 @ 2.0GHz = ongeveer even snel als een AMD 1.4 a 1.5 Thunderbird, of een XP van die snelheid...

Verwijderd @apa • 10 oktober 2001 01:40

Itanic ? Hmm de T is zeker gezonken

Je bedoelt Itanium...

Verwijderd @apa • 10 oktober 2001 09:06

Pas goed op met die maatstaven!

De MIPS is een gevaarlijke eenheid. Deze vindt zijn origine bij de inmiddels prehistorisch bevonden Dhrystone benchmark. Dit is een miniscuul benchmarkje die in dit tijdperk allang in zijn volledigheid in de cache past en niets anders dan de core prestatie meet.

'Snelheid' is een lastige grootheid op het gebied van computers. Ik ben het eens met diegenen die beweren dat Moore's Law het beste toepasbaar is op de algehele systeemprestatie. Hoe deze gemeten moet worden valt nog altijd te twisten. Verschillende benchmarks zijn op verschillende applicaties gericht. Aangezien systeemontwerpen vaak getweaked worden op bepaalde applicaties is het bijvoorbeeld een vreemde zaak om de prestatie van zo'n systeem te meten met een benchmark die is gespitst op een hele andere applicatie etc etc.

Toch lijkt het mij veilig om te stellen dat meneer Moore naar voren komt in de cijfers van de benchmarks die representatief zijn voor de system workload van deze tijd (SYSMark/WinMark/etc).

Auteur

Wouter Tinus @Tinto • 9 oktober 2001 18:35

Moore's law stelt dat iedere 18 maanden het aantal transistors verdubbeld, niet iedere 10 maanden de kloksnelheid.

Raymond v/d H @Tinto • 9 oktober 2001 18:36

Hm.. ik zou zweren dat het een verdubbeling per 18 maanden is....

en dat is niet de snelheid.. maar het aantal transitors.

roelio 9 oktober 2001 19:11

één core te gebruiken die twee keer zo snel draait en twee keer zoveel pipeline stadia heeft. Zo zouden heel simpel de even cycles voor core 0 kunnen spelen en de oneven voor core 1

hoe kunnen de cycles verdeeld worden over twee cores als er maar één core op zit ??? volgens mij staat er een foutje in deze zinnen....

kalizec @roelio • 9 oktober 2001 20:01

één core te gebruiken die twee keer zo snel draait en twee keer zoveel pipeline stadia heeft. Zo zouden heel simpel de even cycles voor core 0 kunnen spelen en de oneven voor core 1

hoe kunnen de cycles verdeeld worden over twee cores als er maar één core op zit ??? volgens mij staat er een foutje in deze zinnen....

Nope is geen onzin. Je zorgt gewoon dat die ene core twee clockgenerators heeft die om en om pulseren.

Net iets als 2 cilinders in 1 motorblok, dat kan ook. In een motorblok levert eerst de ene en dan weer de andere cilinder de kracht. Zo zou net zo goed de ene cycle van core 1 kunnen zijn en de andere van core2.

Het idee is dat er dus 2 keer gebruik wordt gemaakt van hetzelfde plakje silicium/koper dat de core is.

tweakerbee 9 oktober 2001 18:25

Een interessante optie voor AMD zou zijn om precies andersom aan te pakken; in plaats van het werk te verdelen over twee losse cores, één core te gebruiken die twee keer zo snel draait en twee keer zoveel pipeline stadia heeft. Zo zouden heel simpel de even cycles voor core 0 kunnen spelen en de oneven voor core 1.

Daar snap ik iets niet. Gaat het nou wel of niet om een dual-core processor?
Als je gewoon die twee cores houdt die nog eens sneller worden gemaakt ga je toch gewoon nog harder?

Auteur

Wouter Tinus @tweakerbee • 9 oktober 2001 18:30

Simpel. Je wil je processor twee keer zo snel hebben.

Mogelijkheid 1: je gebruikt twee cores
Mogelijkheid 2: je maakt één core twee keer zo snel

AMD doet met SledgeHammer 1, maar het zou volgens deze tekst helemaal geen stom idee zijn om gewoon voor 2 te gaan.

En ja, je kunt ook meteen vier keer zo snel proberen, maar laten we realistisch blijven. Je hebt ook nog je ontwikkelkosten en yields etc.

Felicia @Wouter Tinus • 9 oktober 2001 19:08

Hier ben ik het niet mee eens. Als AMD je optie 1 zou pakken dan zou de processor dus ook meerdere threads in 1 keer moeten kunnen aanpakken. Dus beide cores zijn tegelijkertijd bezig. Het lijkt me dat dat niet het geval is omdat iedere core appart bezig is. Het beste wat je kan doen lijkt mij is dat de core dus 2 keer zoveel data krijgt toegewezen en dit dat aan meteen kan uitvoeren. Om dit te kunnen doen heb je meer pipes nodig meer cache en een beter geoptimaliseerd besturings systeem wat mij niet makkelijk lijkt omdat microsoft het meest voor de hand ligt. Microsoft zal denk ik eerder met intel verder gaan omdat zij dus inderdaad gewoon makkelijk 1 core gebruiken. in principe werkt de sledgehammer maar met 1 core tegelijk maar dit zou natuurlijk ook met 2 kunnen. Unix of linux zou hier gretig gebruik van moeten maken om alle intel systemen zeg maar als 2e rangs te laten lijken. Wat het dan in feite ook zou zijn omdat het systeem dus zeg maar het van AMD multi processor is en die van intel niet.

Ik zie wel met grote ogen toe hoe AMD iedere keer lijkt waar te maken wat ze plannen zonder al te veel uitstel. Iets wat bij intel niet altijd even goed waar te nemen is.

En als conclusie blijf ik bij mijn standpunt dat ik dus liever een AMD heb omdat die dus misschien wat meer fouten maken maar wel tegen intel op kunnen tegen een veel lagere prijs

apa @Felicia • 9 oktober 2001 19:23

Microsoft zal denk ik eerder met intel verder gaan omdat zij dus inderdaad gewoon makkelijk 1 core gebruiken

Met de oplossing van AMD maakt dat dus niks uit: het gebruik van meerdere cores op 1 chip is volledig transparant voor de software. En het is zeker niet zo dat Windows beter overweg kan met 1 core: je kan Win2k en XP gerust op een multi-processor systeem draaien: en daarvoor heb je wel aanpassingen aan de software nodig om dat te kunnen gebruiken.

De multi-core-on-single-chip oplossing van AMD is goed doordacht hoor:

* zo heeft het systeem een veel geavanceerdere branch-prediction dan eenders welke CPU van het moment: hij kan nutteloze branches vroegtijdig (veel vroeger dan huidige CPU's) afbreken en een nieuwe taak uitvoeren in die pipeline.

* de CPU heeft ook een sterkere cache (ik dacht zoiets van 4 keer zo groot; maar dat staat duidelijk uitgelegd in een vorig artikel van Mr. De Vries) om aan branch-prediction te doen

* de Hammer kan ook een instructie (als het van een van de ondersteunde types is tenminste) beginnen uitvoeren nog vóór die volledig is opgeladen in de registers! Dat is de eerste keer dat zoiets mogelijk is bij een x86 CPU en maakt van een nadeel van x86 nu een voordeel (efficiëntere benutting van de apparatuur)

Al dit, en nog veel meer maken dat de oplossing van AMD (Hammer) zeker wat technologische snufjes te bieden heeft. Het zal meteen een CPU zijn met een veel hogere graad aan parallellisme dan eenders welke x86 CPU tot nog toe en zelfs meer dan theoretische modellen tot voor kort voorspelden voor x86 CPU's... de reden is dat die theoretische modellen van een aantal zaken uitgingen om de berekeningen te maken en dat AMD die veronderstellingen doorbroken heeft (zoals meerdere cores op 1 CPU, een instructie kunnen beginnen uitvoeren vooraleer die volledig opgeladen is, ...).

apa @Wouter Tinus • 9 oktober 2001 18:58

Is het niet mogelijk om beiden tegelijk te doen? Ik bedoel daarom niet noodzakelijk in 1 keer... Maar misschien is AMD ook wel iets gelijkaardigs van plan, maar dan wat later: nu beginnen met zo veel mogelijk parallellisme in de core en later de pipelines van de cores verlengen.

mvt @Wouter Tinus • 9 oktober 2001 20:35

Mogelijkheid 1: je gebruikt twee cores
Mogelijkheid 2: je maakt één core twee keer zo snel

Wat ik uit de tekst opmaak is
Mogelijkheid 1: de mogelijk van de SledgeHammer is, namelijk : Van buitenaf aanspreekbaar als 1 chip, terwijl intern de instructies over 2 cores verdeelt worden.
Mogelijkheid 2: Van buitenaf aanspreekbaar als 2 chips, dus dubbele datainvoer, terwijl de chip zelf uit 1 core bestaat (die eigenlijk een versmelting is van 2 cores) en zich intern ook gedraagt als dual chip.

Maar ik geef toe, originele tekst is op meerdere manieren uit te leggen

Saus 9 oktober 2001 18:30

Speculatie over de lange termijn plannen van AMD

het enigste stukje dat op de titel slaat is deze imho:

ontwerp en mogelijk zelfs al van K9 "Greyhound?".

de rest gaat over hoe AMD het beter kan doen, maar dat is niet speculeren, dat is suggesties geven.......zoals ook in het orginele artikel staat: Options for AMD......

Auteur

Wouter Tinus @Saus • 9 oktober 2001 18:33

Ik neem aan dat meneer de Vries bij het schrijven van de tekst heeft gekeken naar de patenten die al zijn ingediend door AMD en aan de hand daarvan deze strategie heeft afgeleid.

apa @Wouter Tinus • 9 oktober 2001 19:01

Mr. De Vries legt enkel uit wat het effect is van de technologie waarop patenten rusten bij AMD. Deze patenten worden volgens hem gebruikt voor de Hammer, maar 100% zeker kan je daar niet over zijn. Hij heeft bv. 2 patenten gevonden die verschillende technologieën beschrijven om hetzelfde te doen.

NiGeLaToR

9 oktober 2001 18:39

It could multiply the individual frequencies by two and use that number for sales purposes... and it would not surprise me at all if they could get away with that...

Dit werkt wel bij de mensen die nu geen AMD kopen, maar niet bij de mensen die dat nu wel doen (wij tweakers dus). Ik snap dat AMD een bres wil slaan in Intel's marksegment, maar prefereer daarbij, kijkend naar het verleden, naar openheid en eerlijkheid. Een reclame campagne met AMD spullen, posters, en stickers waarop ze gewoon eindelijk zeggen dat ze per mhz meer presteren dan anderen zou al een stuk helpen. Zinnen als Intel gebruikt met 'met de P3 gaat internetten stukken sneller' wordt ook door iedereen geslikt als zoete koek. Waarom kan AMD dat dan niet eens doen, ipv halfbakken PR-ratings in te voeren. Het idee is leuk, maar ik voorzie dat ze zo de verkoopcijfers van de K6 nooit ontstijgen

Als die dubbele core wel werkt, zal het meer een workstation/server achtig iets zijn dan een thuis pc proc. Ik denk dat je zo'n proc met een huidige dual processor platfom kan vergelijken in prestatie en thuis heb je dat dus niet nodig. Ook moet de software er dan wel mee overweg kunnen, en als ze te ver van Intel afwijken zullen de meeste software schrijvers ze dan in de steek laten. Gelukkig zijn dit louter speculaties en moeten we maar afwachten wat er gebeurt

edit:
Beoordelingen: +1, -1: Troll, -1: Flamebait, +1: Inzichtvol, Totaal: 0 / 4x WTF? Ik geef alleen mijn mening.. ten goede van AMD.. ist weer niet goed ?

Verwijderd 10 oktober 2001 06:38

Ik vind het wel een aardig idee. Op deze manier kan je bijna twee keer het oppervlak besparen en toch nog dezelfde performance halen (als je er even van uit gaat dat je applicaties voordeel hebben van een multi-processor systeem). Of natuurlijk de performance verdubbelen bij hetzelfde oppervlak, dus kostprijs van het IC

.
Als klein nadeel zie ik dat je waarchijnlijk wel twee keer de hoeveelheid registers neer moet leggen, anders kan je de 'state' van de virtuele core 0 niet onderscheiden van de state van core 1 (hierdoor haal je niet helemaal de factor twee winst, hoewel het aantal registers bij x86 processoren niet zo heel groot is).
Het halen van de dubbele kloksnelheid die hiervoor nodig is moet niet al te moeilijk zijn...

/edit
Hmm, ik zie nu dat mijn opmerking over het aantal registers er al min of meer staat in de originele tekst, er staat al "split register-file" wat min of meer impliceert dat de register file vergroot is (uiteraard heeft men hier bij AMD wel degelijk over nagedacht...)
/edit

ewasx 10 oktober 2001 11:15

Waarom worden er altijd foto's van de cleanroom geshowed als het over computer architectuur gaat? Dat heeft heel erg weinig met elkaar te maken. Het ontwerpen van de processoren gaat gewoon van achter unix terminals in cubicles door ranzige hackers in spijkerbroek ed.

B.A. Baracus 10 oktober 2001 15:10

Het topmanagment van Intel heeft hele duidelijke doelstellingen gezet voor het verder oppompen van de kloksnel van haar processors

Isse goeie processer, klok isse snel?

liquid_ice 10 oktober 2001 15:18

ut zijn echt geen speculaties, maar mogenlijk heden

Boomrups 9 oktober 2001 18:26

Ik hoop echt dat AMD met goede produkten komt, ook in de toekomst en dat ze misschien zelfs hun concurrentiepositie kunnen verstevigen.

Want welke consument is er nou niet gebaat bij wat concurrentie?

Verwijderd @Boomrups • 10 oktober 2001 02:05

Hoe bedoel je "open garagedeur intrappen".

Toe nou mensen. Dat concurrentie goed is voor de technologie en consumenten is algemeen bekend. Waarom zijn er dan steeds weer (and again, and again) mensen die dit even opnieuw moeten zeggen.

Verder hou ik m'n mond maar denk ik

* 786562 saintnightmare

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (36)

Sorteer op:

Weergave: