Nieuwe Opteron-stepping verwacht met SSE3-instructies

Op de site van de Stanford-universiteit is een presentatie verschenen van Kevin McGrath van AMD over de AMD64-architectuur. In de presentatie, die bijna tachtig minuten duurt, wordt onder andere ingegaan op de ontwerpbeslissingen die AMD heeft genomen, hoe de AMD64-architectuur in elkaar steekt en wat de doelstellingen waren van de ontwerpers. Niet alleen wordt er achtergrondinformatie gegeven over de huidige architectuur, de presentatie geeft ons ook een blik op de plannen die AMD heeft voor de nabije toekomst.

Aan het eind van de presentatie, tussen minuut 56 en minuut 60, wordt gesproken over een nieuwe stepping van de huidige Athlon 64/Opteron-core. Om de prestaties van de chip te verbeteren lijkt AMD deels dezelfde keuzes gemaakt te hebben als Intel recent met de Prescott-processor. De nieuwe stepping voegt onder andere ondersteuning voor SSE3-instructies toe en het aantal write combining buffers wordt vergroot van twee naar vier. Verder krijgt de chip de beschikking over on-die thermal throttling en is de data prefetch logica aangepakt om beter te kunnen voorspellen welke data de processor nodig zal hebben. De data prefetch logica kan nu niet alleen vooruit kijken, maar ook achteruit.

AMD Opteron core

Tevens moet de nieuwe stepping minder stroom gebruiken en hogere kloksnelheden kunnen halen. Dit is gedaan door te analyseren welke transistors deel uitmaken van de kritieke paden binnen de processor. Het kritieke pad bepaalt de maximale kloksnelheid die de processor kan halen waardoor het wenselijk is om hier snelle, maar energievretende transistors te gebruiken. Tevens zijn bepaalde stukken logica geherpositioneerd om zo hogere snelheden mogelijk te maken. Buiten de kritieke paden zijn juist meer langzamere transistors gebruikt die minder stroom lekken om zo minder energie te verbruiken. Verder is er gebruik gemaakt van "clock gating" om niet actieve delen van de processor automatisch uit te laten schakelen. Als laatste is het energiegebruik van de processor in de zogenaamde "halt" en "stopclock"-modes, die gebruikt worden wanneer de processor even niks hoeft te doen, verbeterd.

AMD Opteron processor (klein, vrijstaand)De laatste veranderingen die op de lijst staan zijn de geheugencontroller en een optimalisatie binnen de instructiedecoder. De nieuwe Opteron zal overweg kunnen met DDR400-geheugen in plaats van DDR333-geheugen en daarnaast is de geheugencontroller iets efficiënter. De laatste verbetering is het vervangen van de LEA-instructie door een snellere ADD-instructie in de instructiedecoder indien mogelijk waardoor de berekening in één plaats van twee kloktikken gedaan kan worden.

Wanneer we de nieuwe stepping op de markt zullen zien verschijnen is niet helemaal duidelijk. Gezien het grote aantal veranderingen in de nieuwe stepping lijkt het logisch dat het hier gaat over de 'Athens', 'Troy' en 'Venus' Opteron-cores die geïntroduceerd zullen worden in de tweede helft van 2004. Deze cores zijn echter gebakken op 90nm en zouden volgende de geruchten uitgerust zijn met ondersteuning voor DDR2-geheugen. Hier wordt echter met geen woord gerept in de presentatie waardoor het ook niet ondenkbaar is dat de hierboven besproken stepping eerder het daglicht zal zien.

AMD roadmap, 6 november 2003

Door Hielko van der Hoorn

22-02-2004 • 19:12

42

Submitter: EaS

Bron: Stanford online

Lees meer

AMD werpt een blik in de toekomst
AMD werpt een blik in de toekomst Nieuws van 24 april 2004
Kort interview met AMD
Kort interview met AMD Nieuws van 23 maart 2004
AMD Opteron modelnummer-roadmap
AMD Opteron modelnummer-roadmap Nieuws van 13 november 2003

Reacties (42)

42
42
29
5
1
2
Wijzig sortering
Heb die presentatie bekeken, maar er worden nog wel wat leuke dingen vermeld:

- De eerste 90 nm "samples" zijn inmiddels binnen en de eerste test resultaten zien er goed uit. M.a.w. als er geen problemen gevonden worden kunnen die elk moment in productie genomen worden.

- De Hammer core is ontworpen als een dual core processor en alle voorbereidingen voor dual core zijn in het huidige ontwerp aanwezig. Meer wil hij daar niet over kwijt. Dit is tevens het antwoord op hypertreading!

- De processor heeft 3 modii, Compatibility mode (32 bit), Legacy mode en Real mode. In Legacy mode kan een 64 bit operating system, 32 bit en 64 bit applicaties naast elkaar draaien. Real mode is een zuiver 64 bit mode, voor het opstarten van het operating systeem. Echter het omschakelen van Compatibility mode naar Legacy is een zeer trage instructie van meer dan 80 cycly (klok perioden). En dat blijkt een bijzonder lastig probleem voor Virtual machine (VMWare) die daardoor zeer langzaam loopt. Wordt aan gewerkt...

- De +/- 5 tot 20 % snelheids winst in 32 bit mode t.o.v. van de Athlon is hoofdzakelijk de on chip geheugen controller die een boel latency verwijderd.

- Zoals hier boven al vermeldt, de SOI technologie kent twee typen transistoren: LVT (lage drempel spanning) en HTV (hoge drempel spanning) transistoren. De LTV transistoren zijn volgens de presentator ruim 10 % sneller dan de HTV. Echter ze hebben een veel grotere lekstroom, waardoor ze een hogere vermogens dissipatie tot gevolg hebben. Dat was een van de problemen van Intel met de 90 nm core als ik me niet vergis. De LTV wordt dus alleen ingezet als dat noodzaak is.

- Ook leuk om te horen dat zij hun werk doen op Linux en een grote PC cluster hebben voor hun simulaties. 's Nachts worden de werkstations van de ontwerpers aan die cluster toegevoegt.
De data prefetch logica kan nu niet alleen vooruit kijken, maar ook achteruit.
Wat is hier het nu van?, een CPU hoeft toch niet te gaan voorspellen wat 'ie zonet gedaan heeft?
De data prefetcher bedenkt welke gegevens de processor nodig heeft uit het geheugen. Nu kan de prefetcher dus niet alleen vooruit kijken in het geheugen, maar ook achteruit in het geheugen (t.o.v een bepaalde offset).
mss dat'ie zo kan 'leren' ofzoiets?
Lol, schoolgaande CPU's

Maybe voor een loop ofzo, dat 'ie dan makkelijker kan zien wat 'ie doen moet omdat hij het net gedaan heeft.
Maybe voor een loop ofzo, dat 'ie dan makkelijker kan zien wat 'ie doen moet omdat hij het net gedaan heeft.
Dat bedoelde ik :P maar we zaten er allebei naast (als hielko gelijk heeft dan)
@boerenlater:
Even zwaar off-topic: kijk eens een willekeurige Terminator-film van Arnie. :) Dan is je gelijk duidelijk wat Skynet is.
Ik pobeer het grappig te vinden maar ik snap de grap niet |:(
Wie wil zo vriendelijk zijn om mij de grap uit te leggen en wat is skynet?

(erg off-topic ik weet het)
wel als je datastreams aan het fetchen bent, en da nodige data om een of andere reden achterstevoren staat in het geheugen ofzo.

Er zullen iig wel situaties zijn waar het nuttig is, anders zouden ze het niet implementeren zou ik denke
De nieuwe Opteron zal overweg kunnen met DDR400-geheugen in plaats van DDR333-geheugen
De laatste generaties x46 en x48 kunnen ook al met DDR400 geheugen overweg.
Niet alleen de x46 en x48, aangezien ik zelf een dual 242 (met een Tyan S2880 moederbord) heb geconfigureerd met DDR400 geheugen, wat met de laatste BIOS-versie én de laatste (minor) stepping (eerdere steppings van de Opteron ondersteunen het niet) native wordt ondersteund.
In de SSE3 instructie-set zitten specifieke commando's speciaal ontwikkeld om samen te werken met de Hyperthreading technologie. Het lijkt mij persoonlijk dus raar dat AMD deze instructies ook helemaal over neemt/kan nemen.
Anoniem: 93545 @Peetke22 februari 2004 21:08
Vanaf 2005 gaat AMD ook SMT in hun cpu's gebruiken volgens mij.. dan geeft het dus wel een flinke winst.

edit: SMT en niet SMP (blijkbaar)
Vanaf 2005 gaat AMD ook SMP in hun cpu's gebruiken volgens mij.. dan geeft het dus wel een flinke winst
SMT bedoel je, SMP is Symmetrical Multi Processing. SMT is Symmetrical Multi threading, oftwel Hyperthreading :Y)
Anoniem: 18155 @twan123 februari 2004 09:10
Hij bedoeld CMP en dat is "Chip multi processing" oftewel 2 processor kern in 1 chip.

Dat is heel wat anders dan SMT, en SMP. AMD bezit overigens ook patenten voor SMT alleen vinden ze dat nog niet nodig. En ik geef ze geen ongelijk, een Pentium 4 met HyperThreading is nauwelijks sneller dan een moderne Athlon met onboard geheugen controler. En je haalt over het algemeen meer winst uit het geheugen controler dan uit SMT.
Zover bekend gaat AMD onderzoek doen naar CMP en niet naar het vreselijk inferieure SMT/HT.

Het verschil is dat bij SMT/HT resources op de chip gedeeld worden, dus de speedup is al bij voorbaat matig.

Bij CMP krijg je 2 identieke chips op 1 die, die hooguit de L3 cache oid delen.
Zonder precies te weten waar je het over hebt. Maar instructies gericht op hyperthreading kunnen dan toch ook een stukje code inlassen op één logische processor, in plaats van uitbesteden aan een tweede unit.

Je hebt er dan niet erg veel winst van, maar functioneel is de uitkomst hetzelfde.
Vind het eerder raar dat intel AMD zomaar SSE3 laat gebruiken, vermits Intel niet echt een antwoord heeft tegen het 64 bit geweld had ik eerder verwacht dat Intel AMD er wat langer mee zou laten wachten.
Intel is nog niet zo heel slecht :Y)

Verder hoop ik dat SSE3 beter gaat werken bij AMD, uit benchmarks waar SSE2 ondersteund werd ging het toch sneller op de P4.
Anoniem: 93545 @C00P22 februari 2004 21:54
uit benchmarks waar SSE2 ondersteund werd ging het toch sneller op de P4.
Is dit niet omdat een heleboel software kijkt of het een P4 is en niet of SSE2 wordt ondersteund (dit omdat 'vroeger' alleen de P4 dit ondersteunde)
Klopt, is een "bug" in de Intel-compiler. Als je de Intel-compiler gebruikt voor de AMD64 moet je niet vergeten de CPU-check eerst te verwijderen.
idd een "bug", goeie kans dat dit met opzet is gedaan door intel.
Dat heeft te maken met die cross licensing deal als ik het goed heb. Intel mag dingen van AMD gebruiken zonder royalities, and vica versa met royalities. Geloof ik.
die royalties zijn alleen voor het mogen maken van x86 cpu's, alle andere dingen zijn gratis.

SMT is trouwens door AMD ontwikkeld, maar wordt tot nu toe alleen door intel toegepast.
SMT is trouwens door AMD ontwikkeld, maar wordt tot nu toe alleen door intel toegepast.
Heb je toevallig een link? Zou handig zijn in een discussie die ik momenteel aan het voeren ben.
Naar mijn weten hebben AMD en Intel een deal, dat ze elkaars technologien naar hartelust mogen gebruiken, maar nooit recht-toe-recht-aan clones van elkaars cores (meer) mogen maken.
mooi dat dit op de opteron komt... volgt de Athlon 64 reeks dan ook? of blijft dat nog een tijd uit???
Athlon64 zal altijd de opteron volgen, als binnen 2 jaar Opteron met 2 core`s uitkomt zal Athlon64 niet lang erna volgen :)
Anoniem: 74500 @C00P24 februari 2004 12:20
Hoogstwaarschijnlijk zal er dan meer onderscheid komen tss de "FX" (of hoe die op dat moment ook zal noemen...) en een gewone A64. AMD zal er waarschijnlijk voor kiezen de budgetversie met 1 core uit te rusten en de high-end processoren met 2 cores.
Dus eigenlijk hebben ze de boel geoptimaliseerd en ervoor gezorgt dat hij minder snel warm wordt.
Dan vraag ik me dan wel even af waarom ze die optimalisaties niet eerder uitgevoerd hebben. Misschien dat het ermee te maken heeft dat ze te weinig tijd hebben om dat soort dingen uit te knutselen omdat er een concurrent ook hard bezig is.

Ben overigens wel benieuwd of deze processoren en die van Intel meer naar elkaar groeien omdat ze van elkaars technologie mogen lenen. Dan wordt het voor de gebruikers erg moeilijk om onderscheid tussen beide gaan maken omdat ze bijna even goed presteren.
Dus eigenlijk hebben ze de boel geoptimaliseerd en ervoor gezorgt dat hij minder snel warm wordt.
Deels optimalisaties om koeler te houden en deels om prestaties te verhogen.
Dan vraag ik me dan wel even af waarom ze die optimalisaties niet eerder uitgevoerd hebben.Misschien dat het ermee te maken heeft dat ze te weinig tijd hebben om dat soort dingen uit te knutselen omdat er een concurrent ook hard bezig is.
Niets is van de eerste keer perfect. En in de loop der tijd komen er nieuwe ontwikkelingen. Intel heeft er ook al 5 revisies van de P4 opzitten bvb. Je kan als fabrikant ook niet 2-3 jaar zonder nieuwe product zitten, zeker niet in PC land. Maar vooral omdat er nieuwe dingen bijkomen na de introductie van een cpu. Je kan moeilijk na 2 jaar R&D bij een nieuw product het hele ontwerp omgooien omdat er bvb SSE3 uitgevonden zijn of een sneller type geheugen uitkomt..
Ben overigens wel benieuwd of deze processoren en die van Intel meer naar elkaar groeien omdat ze van elkaars technologie mogen lenen. Dan wordt het voor de gebruikers erg moeilijk om onderscheid tussen beide gaan maken omdat ze bijna even goed presteren.
Eigenlijk is de trend net omgekeerd. Vroeger waren AMD en Intel cpu's veel meer gelijkend op elkaar. Qua MHz en specificaties. Nu is de volledige filosofie achter beide CPU's helemaal anders. AMD = IPC , Intel = MHz.
In eerdere artikels word ook al gesproken over een nieuwe stepping van de core. Van C0 naar CG.

http://www.tweakers.net/nieuws/30131

Is dit misschien die stepping/core?
Is dit enkel vor de Opteron, of komen deze nieuwe cores later ook naar de gewone Athlon64 en de FX?

En wanneer zouden deze nieuwe cores verschijnen? Samen met socket 939 of pas vele later?

:?
De Athlon64 en 64FX zullen al deze leuke dingetjes ook krijgen. Wanneer deze cores verschijnen..? waarschijnlijk idd tegelijk met 939 of misschien nog wel eerder.
Even offtopic :

Mijn oog ziet geen AMD Duron "Applebred" op o,13 Micron staan in die lijst.

Was die Duron een tussen oplossing om alle oude Thoroughbred's kwijt te kunnen?

Blijkbaar is die Duron toch best wel in de smaak gevallen.
er staat niet voor niets bij de streep "As market requires" ;)
Betekend dus eigenlijk "zie Intel roadmap". :)

Op dit item kan niet meer gereageerd worden.