Nieuwe Opteron-stepping verwacht met SSE3-instructies

Op de site van de Stanford-universiteit is een presentatie verschenen van Kevin McGrath van AMD over de AMD64-architectuur. In de presentatie, die bijna tachtig minuten duurt, wordt onder andere ingegaan op de ontwerpbeslissingen die AMD heeft genomen, hoe de AMD64-architectuur in elkaar steekt en wat de doelstellingen waren van de ontwerpers. Niet alleen wordt er achtergrondinformatie gegeven over de huidige architectuur, de presentatie geeft ons ook een blik op de plannen die AMD heeft voor de nabije toekomst.

Aan het eind van de presentatie, tussen minuut 56 en minuut 60, wordt gesproken over een nieuwe stepping van de huidige Athlon 64/Opteron-core. Om de prestaties van de chip te verbeteren lijkt AMD deels dezelfde keuzes gemaakt te hebben als Intel recent met de Prescott-processor. De nieuwe stepping voegt onder andere ondersteuning voor SSE3-instructies toe en het aantal write combining buffers wordt vergroot van twee naar vier. Verder krijgt de chip de beschikking over on-die thermal throttling en is de data prefetch logica aangepakt om beter te kunnen voorspellen welke data de processor nodig zal hebben. De data prefetch logica kan nu niet alleen vooruit kijken, maar ook achteruit.

Tevens moet de nieuwe stepping minder stroom gebruiken en hogere kloksnelheden kunnen halen. Dit is gedaan door te analyseren welke transistors deel uitmaken van de kritieke paden binnen de processor. Het kritieke pad bepaalt de maximale kloksnelheid die de processor kan halen waardoor het wenselijk is om hier snelle, maar energievretende transistors te gebruiken. Tevens zijn bepaalde stukken logica geherpositioneerd om zo hogere snelheden mogelijk te maken. Buiten de kritieke paden zijn juist meer langzamere transistors gebruikt die minder stroom lekken om zo minder energie te verbruiken. Verder is er gebruik gemaakt van "clock gating" om niet actieve delen van de processor automatisch uit te laten schakelen. Als laatste is het energiegebruik van de processor in de zogenaamde "halt" en "stopclock"-modes, die gebruikt worden wanneer de processor even niks hoeft te doen, verbeterd.

AMD Opteron processor (klein, vrijstaand) De laatste veranderingen die op de lijst staan zijn de geheugencontroller en een optimalisatie binnen de instructiedecoder. De nieuwe Opteron zal overweg kunnen met DDR400-geheugen in plaats van DDR333-geheugen en daarnaast is de geheugencontroller iets efficiënter. De laatste verbetering is het vervangen van de LEA-instructie door een snellere ADD-instructie in de instructiedecoder indien mogelijk waardoor de berekening in één plaats van twee kloktikken gedaan kan worden.

Wanneer we de nieuwe stepping op de markt zullen zien verschijnen is niet helemaal duidelijk. Gezien het grote aantal veranderingen in de nieuwe stepping lijkt het logisch dat het hier gaat over de 'Athens', 'Troy' en 'Venus' Opteron-cores die geïntroduceerd zullen worden in de tweede helft van 2004. Deze cores zijn echter gebakken op 90nm en zouden volgende de geruchten uitgerust zijn met ondersteuning voor DDR2-geheugen. Hier wordt echter met geen woord gerept in de presentatie waardoor het ook niet ondenkbaar is dat de hierboven besproken stepping eerder het daglicht zal zien.

Reacties (42)

elteck 22 februari 2004 22:59

Heb die presentatie bekeken, maar er worden nog wel wat leuke dingen vermeld:

- De eerste 90 nm "samples" zijn inmiddels binnen en de eerste test resultaten zien er goed uit. M.a.w. als er geen problemen gevonden worden kunnen die elk moment in productie genomen worden.

- De Hammer core is ontworpen als een dual core processor en alle voorbereidingen voor dual core zijn in het huidige ontwerp aanwezig. Meer wil hij daar niet over kwijt. Dit is tevens het antwoord op hypertreading!

- De processor heeft 3 modii, Compatibility mode (32 bit), Legacy mode en Real mode. In Legacy mode kan een 64 bit operating system, 32 bit en 64 bit applicaties naast elkaar draaien. Real mode is een zuiver 64 bit mode, voor het opstarten van het operating systeem. Echter het omschakelen van Compatibility mode naar Legacy is een zeer trage instructie van meer dan 80 cycly (klok perioden). En dat blijkt een bijzonder lastig probleem voor Virtual machine (VMWare) die daardoor zeer langzaam loopt. Wordt aan gewerkt...

- De +/- 5 tot 20 % snelheids winst in 32 bit mode t.o.v. van de Athlon is hoofdzakelijk de on chip geheugen controller die een boel latency verwijderd.

- Zoals hier boven al vermeldt, de SOI technologie kent twee typen transistoren: LVT (lage drempel spanning) en HTV (hoge drempel spanning) transistoren. De LTV transistoren zijn volgens de presentator ruim 10 % sneller dan de HTV. Echter ze hebben een veel grotere lekstroom, waardoor ze een hogere vermogens dissipatie tot gevolg hebben. Dat was een van de problemen van Intel met de 90 nm core als ik me niet vergis. De LTV wordt dus alleen ingezet als dat noodzaak is.

- Ook leuk om te horen dat zij hun werk doen op Linux en een grote PC cluster hebben voor hun simulaties. 's Nachts worden de werkstations van de ontwerpers aan die cluster toegevoegt.

Thandor 22 februari 2004 19:20

De data prefetch logica kan nu niet alleen vooruit kijken, maar ook achteruit.

Wat is hier het nu van?, een CPU hoeft toch niet te gaan voorspellen wat 'ie zonet gedaan heeft?

Auteur

Hielko @Thandor • 22 februari 2004 19:25

De data prefetcher bedenkt welke gegevens de processor nodig heeft uit het geheugen. Nu kan de prefetcher dus niet alleen vooruit kijken in het geheugen, maar ook achteruit in het geheugen (t.o.v een bepaalde offset).

Verwijderd @Thandor • 22 februari 2004 19:21

mss dat'ie zo kan 'leren' ofzoiets?

Thandor @Verwijderd • 22 februari 2004 19:24

Lol, schoolgaande CPU's

Maybe voor een loop ofzo, dat 'ie dan makkelijker kan zien wat 'ie doen moet omdat hij het net gedaan heeft.

Verwijderd @Thandor • 22 februari 2004 19:46

Maybe voor een loop ofzo, dat 'ie dan makkelijker kan zien wat 'ie doen moet omdat hij het net gedaan heeft.

Dat bedoelde ik

maar we zaten er allebei naast (als hielko gelijk heeft dan)

catfish @Verwijderd • 22 februari 2004 22:48

skynet...

Parody @catfish • 23 februari 2004 08:49

@boerenlater:
Even zwaar off-topic: kijk eens een willekeurige Terminator-film van Arnie.

Dan is je gelijk duidelijk wat Skynet is.

Verwijderd @catfish • 22 februari 2004 23:25

Ik pobeer het grappig te vinden maar ik snap de grap niet

Wie wil zo vriendelijk zijn om mij de grap uit te leggen en wat is skynet?

(erg off-topic ik weet het)

Verwijderd @Thandor • 22 februari 2004 20:17

wel als je datastreams aan het fetchen bent, en da nodige data om een of andere reden achterstevoren staat in het geheugen ofzo.

Er zullen iig wel situaties zijn waar het nuttig is, anders zouden ze het niet implementeren zou ik denke

JSK 22 februari 2004 19:30

De nieuwe Opteron zal overweg kunnen met DDR400-geheugen in plaats van DDR333-geheugen

De laatste generaties x46 en x48 kunnen ook al met DDR400 geheugen overweg.

[BoSS] @JSK • 22 februari 2004 22:35

Niet alleen de x46 en x48, aangezien ik zelf een dual 242 (met een Tyan S2880 moederbord) heb geconfigureerd met DDR400 geheugen, wat met de laatste BIOS-versie én de laatste (minor) stepping (eerdere steppings van de Opteron ondersteunen het niet) native wordt ondersteund.

Peetke

22 februari 2004 20:08

In de SSE3 instructie-set zitten specifieke commando's speciaal ontwikkeld om samen te werken met de Hyperthreading technologie. Het lijkt mij persoonlijk dus raar dat AMD deze instructies ook helemaal over neemt/kan nemen.

Verwijderd @Peetke • 22 februari 2004 21:08

Vanaf 2005 gaat AMD ook SMT in hun cpu's gebruiken volgens mij.. dan geeft het dus wel een flinke winst.

edit: SMT en niet SMP (blijkbaar)

twan1 @Verwijderd • 22 februari 2004 21:21

Vanaf 2005 gaat AMD ook SMP in hun cpu's gebruiken volgens mij.. dan geeft het dus wel een flinke winst

SMT bedoel je, SMP is Symmetrical Multi Processing. SMT is Symmetrical Multi threading, oftwel Hyperthreading

Verwijderd @twan1 • 23 februari 2004 09:10

Hij bedoeld CMP en dat is "Chip multi processing" oftewel 2 processor kern in 1 chip.

Dat is heel wat anders dan SMT, en SMP. AMD bezit overigens ook patenten voor SMT alleen vinden ze dat nog niet nodig. En ik geef ze geen ongelijk, een Pentium 4 met HyperThreading is nauwelijks sneller dan een moderne Athlon met onboard geheugen controler. En je haalt over het algemeen meer winst uit het geheugen controler dan uit SMT.

hardwareaddict @Verwijderd • 23 februari 2004 19:22

Zover bekend gaat AMD onderzoek doen naar CMP en niet naar het vreselijk inferieure SMT/HT.

Het verschil is dat bij SMT/HT resources op de chip gedeeld worden, dus de speedup is al bij voorbaat matig.

Bij CMP krijg je 2 identieke chips op 1 die, die hooguit de L3 cache oid delen.

familyman @Peetke • 22 februari 2004 20:16

Zonder precies te weten waar je het over hebt. Maar instructies gericht op hyperthreading kunnen dan toch ook een stukje code inlassen op één logische processor, in plaats van uitbesteden aan een tweede unit.

Je hebt er dan niet erg veel winst van, maar functioneel is de uitkomst hetzelfde.

C00P 22 februari 2004 21:09

Vind het eerder raar dat intel AMD zomaar SSE3 laat gebruiken, vermits Intel niet echt een antwoord heeft tegen het 64 bit geweld had ik eerder verwacht dat Intel AMD er wat langer mee zou laten wachten.
Intel is nog niet zo heel slecht

Verder hoop ik dat SSE3 beter gaat werken bij AMD, uit benchmarks waar SSE2 ondersteund werd ging het toch sneller op de P4.

Verwijderd @C00P • 22 februari 2004 21:54

uit benchmarks waar SSE2 ondersteund werd ging het toch sneller op de P4.

Is dit niet omdat een heleboel software kijkt of het een P4 is en niet of SSE2 wordt ondersteund (dit omdat 'vroeger' alleen de P4 dit ondersteunde)

dataworm @Verwijderd • 22 februari 2004 22:22

Klopt, is een "bug" in de Intel-compiler. Als je de Intel-compiler gebruikt voor de AMD64 moet je niet vergeten de CPU-check eerst te verwijderen.

Verwijderd @dataworm • 22 februari 2004 23:06

idd een "bug", goeie kans dat dit met opzet is gedaan door intel.

Upke dupke @C00P • 22 februari 2004 21:29

Dat heeft te maken met die cross licensing deal als ik het goed heb. Intel mag dingen van AMD gebruiken zonder royalities, and vica versa met royalities. Geloof ik.

Verwijderd @Upke dupke • 22 februari 2004 21:46

die royalties zijn alleen voor het mogen maken van x86 cpu's, alle andere dingen zijn gratis.

SMT is trouwens door AMD ontwikkeld, maar wordt tot nu toe alleen door intel toegepast.

Verwijderd @Verwijderd • 22 februari 2004 22:23

SMT is trouwens door AMD ontwikkeld, maar wordt tot nu toe alleen door intel toegepast.

Heb je toevallig een link? Zou handig zijn in een discussie die ik momenteel aan het voeren ben.

SuperNull @C00P • 22 februari 2004 21:28

Naar mijn weten hebben AMD en Intel een deal, dat ze elkaars technologien naar hartelust mogen gebruiken, maar nooit recht-toe-recht-aan clones van elkaars cores (meer) mogen maken.

H!GHGuY 22 februari 2004 22:20

mooi dat dit op de opteron komt... volgt de Athlon 64 reeks dan ook? of blijft dat nog een tijd uit???

C00P @H!GHGuY • 22 februari 2004 23:24

Athlon64 zal altijd de opteron volgen, als binnen 2 jaar Opteron met 2 core`s uitkomt zal Athlon64 niet lang erna volgen

Verwijderd @C00P • 24 februari 2004 12:20

Hoogstwaarschijnlijk zal er dan meer onderscheid komen tss de "FX" (of hoe die op dat moment ook zal noemen...) en een gewone A64. AMD zal er waarschijnlijk voor kiezen de budgetversie met 1 core uit te rusten en de high-end processoren met 2 cores.

Verwijderd 22 februari 2004 22:22

Dus eigenlijk hebben ze de boel geoptimaliseerd en ervoor gezorgt dat hij minder snel warm wordt.
Dan vraag ik me dan wel even af waarom ze die optimalisaties niet eerder uitgevoerd hebben. Misschien dat het ermee te maken heeft dat ze te weinig tijd hebben om dat soort dingen uit te knutselen omdat er een concurrent ook hard bezig is.

Ben overigens wel benieuwd of deze processoren en die van Intel meer naar elkaar groeien omdat ze van elkaars technologie mogen lenen. Dan wordt het voor de gebruikers erg moeilijk om onderscheid tussen beide gaan maken omdat ze bijna even goed presteren.

Noel @Verwijderd • 22 februari 2004 23:05

Dus eigenlijk hebben ze de boel geoptimaliseerd en ervoor gezorgt dat hij minder snel warm wordt.

Deels optimalisaties om koeler te houden en deels om prestaties te verhogen.

Dan vraag ik me dan wel even af waarom ze die optimalisaties niet eerder uitgevoerd hebben.Misschien dat het ermee te maken heeft dat ze te weinig tijd hebben om dat soort dingen uit te knutselen omdat er een concurrent ook hard bezig is.

Niets is van de eerste keer perfect. En in de loop der tijd komen er nieuwe ontwikkelingen. Intel heeft er ook al 5 revisies van de P4 opzitten bvb. Je kan als fabrikant ook niet 2-3 jaar zonder nieuwe product zitten, zeker niet in PC land. Maar vooral omdat er nieuwe dingen bijkomen na de introductie van een cpu. Je kan moeilijk na 2 jaar R&D bij een nieuw product het hele ontwerp omgooien omdat er bvb SSE3 uitgevonden zijn of een sneller type geheugen uitkomt..

Ben overigens wel benieuwd of deze processoren en die van Intel meer naar elkaar groeien omdat ze van elkaars technologie mogen lenen. Dan wordt het voor de gebruikers erg moeilijk om onderscheid tussen beide gaan maken omdat ze bijna even goed presteren.

Eigenlijk is de trend net omgekeerd. Vroeger waren AMD en Intel cpu's veel meer gelijkend op elkaar. Qua MHz en specificaties. Nu is de volledige filosofie achter beide CPU's helemaal anders. AMD = IPC , Intel = MHz.

Verwijderd 22 februari 2004 19:38

In eerdere artikels word ook al gesproken over een nieuwe stepping van de core. Van C0 naar CG.

http://www.tweakers.net/nieuws/30131

Is dit misschien die stepping/core?

PowerToTheUsers 23 februari 2004 13:19

Is dit enkel vor de Opteron, of komen deze nieuwe cores later ook naar de gewone Athlon64 en de FX?

En wanneer zouden deze nieuwe cores verschijnen? Samen met socket 939 of pas vele later?

Verwijderd @PowerToTheUsers • 23 februari 2004 21:26

De Athlon64 en 64FX zullen al deze leuke dingetjes ook krijgen. Wanneer deze cores verschijnen..? waarschijnlijk idd tegelijk met 939 of misschien nog wel eerder.

Thandor 22 februari 2004 19:30

Even offtopic :

Mijn oog ziet geen AMD Duron "Applebred" op o,13 Micron staan in die lijst.

Was die Duron een tussen oplossing om alle oude Thoroughbred's kwijt te kunnen?

Blijkbaar is die Duron toch best wel in de smaak gevallen.

Verwijderd @Thandor • 22 februari 2004 19:53

er staat niet voor niets bij de streep "As market requires"

Verwijderd @Verwijderd • 22 februari 2004 21:54

Betekend dus eigenlijk "zie Intel roadmap".

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (42)

Sorteer op:

Weergave: