Hoofdcategorieën
Device Settings

Nieuwe Opteron-stepping verwacht met SSE3-instructies

Door Hielko van der Hoorn, zondag 22 februari 2004 19:12
Bron: Stanford online, submitter: EaS, views: 11.913

Op de site van de Stanford-universiteit is een presentatie verschenen van Kevin McGrath van AMD over de AMD64-architectuur. In de presentatie, die bijna tachtig minuten duurt, wordt onder andere ingegaan op de ontwerpbeslissingen die AMD heeft genomen, hoe de AMD64-architectuur in elkaar steekt en wat de doelstellingen waren van de ontwerpers. Niet alleen wordt er achtergrondinformatie gegeven over de huidige architectuur, de presentatie geeft ons ook een blik op de plannen die AMD heeft voor de nabije toekomst.

Aan het eind van de presentatie, tussen minuut 56 en minuut 60, wordt gesproken over een nieuwe stepping van de huidige Athlon 64/Opteron-core. Om de prestaties van de chip te verbeteren lijkt AMD deels dezelfde keuzes gemaakt te hebben als Intel recent met de Prescott-processor. De nieuwe stepping voegt onder andere ondersteuning voor SSE3-instructies toe en het aantal write combining buffers wordt vergroot van twee naar vier. Verder krijgt de chip de beschikking over on-die thermal throttling en is de data prefetch logica aangepakt om beter te kunnen voorspellen welke data de processor nodig zal hebben. De data prefetch logica kan nu niet alleen vooruit kijken, maar ook achteruit.

AMD Opteron core

Tevens moet de nieuwe stepping minder stroom gebruiken en hogere kloksnelheden kunnen halen. Dit is gedaan door te analyseren welke transistors deel uitmaken van de kritieke paden binnen de processor. Het kritieke pad bepaalt de maximale kloksnelheid die de processor kan halen waardoor het wenselijk is om hier snelle, maar energievretende transistors te gebruiken. Tevens zijn bepaalde stukken logica geherpositioneerd om zo hogere snelheden mogelijk te maken. Buiten de kritieke paden zijn juist meer langzamere transistors gebruikt die minder stroom lekken om zo minder energie te verbruiken. Verder is er gebruik gemaakt van "clock gating" om niet actieve delen van de processor automatisch uit te laten schakelen. Als laatste is het energiegebruik van de processor in de zogenaamde "halt" en "stopclock"-modes, die gebruikt worden wanneer de processor even niks hoeft te doen, verbeterd.

AMD Opteron processor (klein, vrijstaand)De laatste veranderingen die op de lijst staan zijn de geheugencontroller en een optimalisatie binnen de instructiedecoder. De nieuwe Opteron zal overweg kunnen met DDR400-geheugen in plaats van DDR333-geheugen en daarnaast is de geheugencontroller iets efficiënter. De laatste verbetering is het vervangen van de LEA-instructie door een snellere ADD-instructie in de instructiedecoder indien mogelijk waardoor de berekening in één plaats van twee kloktikken gedaan kan worden.

Wanneer we de nieuwe stepping op de markt zullen zien verschijnen is niet helemaal duidelijk. Gezien het grote aantal veranderingen in de nieuwe stepping lijkt het logisch dat het hier gaat over de 'Athens', 'Troy' en 'Venus' Opteron-cores die geïntroduceerd zullen worden in de tweede helft van 2004. Deze cores zijn echter gebakken op 90nm en zouden volgende de geruchten uitgerust zijn met ondersteuning voor DDR2-geheugen. Hier wordt echter met geen woord gerept in de presentatie waardoor het ook niet ondenkbaar is dat de hierboven besproken stepping eerder het daglicht zal zien.

AMD roadmap, 6 november 2003
Volgende 00:22 DVD X Copy illegaal bevonden door Amerikaanse rechter
Vorige 18:56 LindowsOS voor Centrino-laptops
Advertentie

Reacties

«  1  2  »

Mooi dat ze SSE3 gaan ondersteunen, dit wordt nu nog (bijna) niet gebruikt, maar dat gaat in de toekomst natuurlijk wel gebeuren.

edit: en het is uiteraard ook mooi dat ze zuiniger worden EN sneller, zoiets moeten ze bij intel ook maar es gaan doen.

De data prefetch logica kan nu niet alleen vooruit kijken, maar ook achteruit.

Wat is hier het nu van?, een CPU hoeft toch niet te gaan voorspellen wat 'ie zonet gedaan heeft?

mss dat'ie zo kan 'leren' ofzoiets?

Lol, schoolgaande CPU's

Maybe voor een loop ofzo, dat 'ie dan makkelijker kan zien wat 'ie doen moet omdat hij het net gedaan heeft.

Maybe voor een loop ofzo, dat 'ie dan makkelijker kan zien wat 'ie doen moet omdat hij het net gedaan heeft.
Dat bedoelde ik :P maar we zaten er allebei naast (als hielko gelijk heeft dan)

skynet...

Ik pobeer het grappig te vinden maar ik snap de grap niet |:(
Wie wil zo vriendelijk zijn om mij de grap uit te leggen en wat is skynet?

(erg off-topic ik weet het)

@boerenlater:
Even zwaar off-topic: kijk eens een willekeurige Terminator-film van Arnie. :) Dan is je gelijk duidelijk wat Skynet is.

De data prefetcher bedenkt welke gegevens de processor nodig heeft uit het geheugen. Nu kan de prefetcher dus niet alleen vooruit kijken in het geheugen, maar ook achteruit in het geheugen (t.o.v een bepaalde offset).

wel als je datastreams aan het fetchen bent, en da nodige data om een of andere reden achterstevoren staat in het geheugen ofzo.

Er zullen iig wel situaties zijn waar het nuttig is, anders zouden ze het niet implementeren zou ik denke

De nieuwe Opteron zal overweg kunnen met DDR400-geheugen in plaats van DDR333-geheugen

De laatste generaties x46 en x48 kunnen ook al met DDR400 geheugen overweg.

Niet alleen de x46 en x48, aangezien ik zelf een dual 242 (met een Tyan S2880 moederbord) heb geconfigureerd met DDR400 geheugen, wat met de laatste BIOS-versie én de laatste (minor) stepping (eerdere steppings van de Opteron ondersteunen het niet) native wordt ondersteund.

Even offtopic :

Mijn oog ziet geen AMD Duron "Applebred" op o,13 Micron staan in die lijst.

Was die Duron een tussen oplossing om alle oude Thoroughbred's kwijt te kunnen?

Blijkbaar is die Duron toch best wel in de smaak gevallen.

er staat niet voor niets bij de streep "As market requires" ;)

Betekend dus eigenlijk "zie Intel roadmap". :)

In eerdere artikels word ook al gesproken over een nieuwe stepping van de core. Van C0 naar CG.

http://www.tweakers.net/nieuws/30131

Is dit misschien die stepping/core?

Gezien het grote aantal veranderingen in de nieuwe stepping lijkt het logisch dat het hier gaat over de 'Athens', 'Troy' en 'Venus' Opteron-cores die geïntroduceerd zullen worden in de tweede helft van 2004.
De Venus is geen Opteron-core maar een Athlon MP-core :)
Sorry, had de roadmap verkeerd bekeken...

foutje, blanco erover:
Het kritieke pad bepaald de maximale kloksnelheid die de processor kan halen waardoor het wenselijk is om hier snelle, maar energievretende transistors te gebruiken.

Is ondertussen verandert :)

In de SSE3 instructie-set zitten specifieke commando's speciaal ontwikkeld om samen te werken met de Hyperthreading technologie. Het lijkt mij persoonlijk dus raar dat AMD deze instructies ook helemaal over neemt/kan nemen.

Zonder precies te weten waar je het over hebt. Maar instructies gericht op hyperthreading kunnen dan toch ook een stukje code inlassen op één logische processor, in plaats van uitbesteden aan een tweede unit.

Je hebt er dan niet erg veel winst van, maar functioneel is de uitkomst hetzelfde.

Vanaf 2005 gaat AMD ook SMT in hun cpu's gebruiken volgens mij.. dan geeft het dus wel een flinke winst.

edit: SMT en niet SMP (blijkbaar)

Vanaf 2005 gaat AMD ook SMP in hun cpu's gebruiken volgens mij.. dan geeft het dus wel een flinke winst
SMT bedoel je, SMP is Symmetrical Multi Processing. SMT is Symmetrical Multi threading, oftwel Hyperthreading :Y)

Hij bedoeld CMP en dat is "Chip multi processing" oftewel 2 processor kern in 1 chip.

Dat is heel wat anders dan SMT, en SMP. AMD bezit overigens ook patenten voor SMT alleen vinden ze dat nog niet nodig. En ik geef ze geen ongelijk, een Pentium 4 met HyperThreading is nauwelijks sneller dan een moderne Athlon met onboard geheugen controler. En je haalt over het algemeen meer winst uit het geheugen controler dan uit SMT.

Zover bekend gaat AMD onderzoek doen naar CMP en niet naar het vreselijk inferieure SMT/HT.

Het verschil is dat bij SMT/HT resources op de chip gedeeld worden, dus de speedup is al bij voorbaat matig.

Bij CMP krijg je 2 identieke chips op 1 die, die hooguit de L3 cache oid delen.

Vind het eerder raar dat intel AMD zomaar SSE3 laat gebruiken, vermits Intel niet echt een antwoord heeft tegen het 64 bit geweld had ik eerder verwacht dat Intel AMD er wat langer mee zou laten wachten.
Intel is nog niet zo heel slecht :Y)

Verder hoop ik dat SSE3 beter gaat werken bij AMD, uit benchmarks waar SSE2 ondersteund werd ging het toch sneller op de P4.

Naar mijn weten hebben AMD en Intel een deal, dat ze elkaars technologien naar hartelust mogen gebruiken, maar nooit recht-toe-recht-aan clones van elkaars cores (meer) mogen maken.

Dat heeft te maken met die cross licensing deal als ik het goed heb. Intel mag dingen van AMD gebruiken zonder royalities, and vica versa met royalities. Geloof ik.

die royalties zijn alleen voor het mogen maken van x86 cpu's, alle andere dingen zijn gratis.

SMT is trouwens door AMD ontwikkeld, maar wordt tot nu toe alleen door intel toegepast.

SMT is trouwens door AMD ontwikkeld, maar wordt tot nu toe alleen door intel toegepast.
Heb je toevallig een link? Zou handig zijn in een discussie die ik momenteel aan het voeren ben.

uit benchmarks waar SSE2 ondersteund werd ging het toch sneller op de P4.
Is dit niet omdat een heleboel software kijkt of het een P4 is en niet of SSE2 wordt ondersteund (dit omdat 'vroeger' alleen de P4 dit ondersteunde)

Klopt, is een "bug" in de Intel-compiler. Als je de Intel-compiler gebruikt voor de AMD64 moet je niet vergeten de CPU-check eerst te verwijderen.

idd een "bug", goeie kans dat dit met opzet is gedaan door intel.

mooi dat dit op de opteron komt... volgt de Athlon 64 reeks dan ook? of blijft dat nog een tijd uit???

Athlon64 zal altijd de opteron volgen, als binnen 2 jaar Opteron met 2 core`s uitkomt zal Athlon64 niet lang erna volgen :)

Hoogstwaarschijnlijk zal er dan meer onderscheid komen tss de "FX" (of hoe die op dat moment ook zal noemen...) en een gewone A64. AMD zal er waarschijnlijk voor kiezen de budgetversie met 1 core uit te rusten en de high-end processoren met 2 cores.
«  1  2  »

Op dit item kan niet meer gereageerd worden.

Volgende 00:22 DVD X Copy illegaal bevonden door Amerikaanse rechter
Vorige 18:56 LindowsOS voor Centrino-laptops
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011