Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

NUMA in Windows XP 64-bits: eerste benchmarks

GamePC verrast ons vandaag met twee primeurs. De eerste is de bevestiging dat Windows XP 64-bits Edition is uitgerust met de ondersteuning voor Non Unified Memory Access (NUMA). NUMA is vernoemd naar het feit dat de geheugenregionen in een NUMA-systeem met verschillende snelheden toegankelijk zijn, bijvoorbeeld omdat een geheugendeel zich op een andere fysieke bus bevindt dan de processor die dit gebied wil benaderen. Deze architectuur was tot voor kort voorbehouden, met enkele uitzonderingen, aan systemen die niet gebruik maakten van de x86-architectuur.

Het was dan ook niet nodig voor Microsoft om de verschillende Windows NT-versies te voorzien van NUMA-ondersteuning. Maar met de komst van de AMD Opteron-processor is dat veranderd. In een multiprocessor systeem dat gebruik maakt van de Opteron kan iedere cpu namelijk over zijn eigen geheugen beschikken dat ook door de andere cpu's kan worden aangesproken: een NUMA-architectuur dus. Reden genoeg dus voor Microsoft om naast 64-bits ondersteuning, ook ondersteuning voor NUMA in te bouwen in de Windows XP 64-bits Edition en de 32- en 64-bits versie van Windows 2003 Server Enterprise Edition.

De tweede primeur is het benchmarken van de NUMA-architectuur zelf. Naar ons weten is GamePC namelijk de eerste die een flink aantal testen heeft gedraaid om het verschil in snelheid te meten tussen niet-NUMA en NUMA. Hiervoor hebben ze een Tyan Thunder K8W voorzien van twee Opteron 248-processors waarop ze twee verschillende combinaties van geheugenmodules hebben gestoken. In de eerste combinatie worden alle geheugenmodules aan een processor gekoppeld en in de twee configuratie worden de modules over de verschillende processors verdeeld. Dit leverde de volgende verschillende combinaties op:

TotaalDIMM'sChannelsNUMA
1GB2 x 512MBdualnee
1GB2 x 512MBsingleja
2GB4 x 512MBdualnee
2GB4 x 512MBdualja

Met behulp van SiSoft Sandra 2004 SP1, draaiende onder de beta-versie van Windows XP 64-bits Edition werd gemeten hoe snel het geheugen kan worden benaderd. Hieruit blijkt dat een systeem met 2GB aan geheugen in een dual-channel en NUMA configuratie, maar liefst 10GB aan data per seconde kan verplaatsen. Dit is echter niet terug te vinden in benchmarks met Unreal Tournament 2004 en Adobe Photoshop. Dit komt waarschijnlijk omdat deze applicaties geen baat hebben van de grotere bandbreedte. In het geval van Unreal is het zelfs zo dat dual-channel NUMA iets langzamer is dan dual-channel niet-NUMA. Iets dat verklaard kan worden door het feit dat de latentie van geheugen dat via een NUMA-architectuur wordt aangesproken iets hoger is dan bij een niet-NUMA-architectuur. GamePC heeft hierna ook nog een flink aantal testen gedraaid met een hoop verschillende configuraties, variŽrend van single-channel zonder NUMA met maar 512MB aan geheugen tot dual-channel met NUMA en 6GB aan geheugen. Deze testen geven nagenoeg hetzelfde resultaat. De conclusie is dan ook positief en GamePC voorspelt zelfs dat er grote kans is dat Intel in de toekomst ook met processors uit zal komen die een geÔntegreerde geheugencontroller hebben.



NUMA-architectuur
geen NUMA-architectuur

* Update

Naar aanleiding van dit artikel heeft Tweakers.net lezer JumpStart ook enkele testen gedraaid op een dual-Opteron 244 systeem waarover hij de beschikking heeft, waarvoor onze dank groot is. Dit systeem heeft als basis een Tyan Thunder K8W moederbord waarop elke processor is uitgerust met twee 512 MB PC333 ECC registered DDR SDRAM-modules (CAS 2,5-3-3-3 dual-channel). Op deze machine draait de 32-bits versie van Windows 2003 Server Enterprise Edition met NUMA ondersteuning. Op de eerste screenshot kunnen we zien hoe snel het geheugen is in de geheugenbenchmark van SiSoftware Sandra 2004 (Win32 x86) Version 2004.10.9.89, als de ondersteuning voor NUMA is uitgeschakeld, terwijl we op de tweede screenschot kunnen zien hoe snel het geheugen is als NUMA aan staat. De resultaten bevestigen trouwens de resultaten van GamePC:

Dual Opteron 244 - Geheugenbandbreedte (MB/s)
Met NUMAInt 8244
Met NUMAFloat 8155
Zonder NUMAInt 3599
Zonder NUMAFloat 3853

Door Ralph Smeets

Nieuwsposter

02-03-2004 • 22:09

45 Linkedin Google+

Bron: GamePC

Lees meer

Linux 2.6.0-kernel verwacht in december Nieuws van 26 november 2003
Athlon 64 kloksnelheden en ratings Nieuws van 8 januari 2003
AMD Hammer gaat Opteron heten Nieuws van 24 april 2002
Meer AMD Clawhammer speculaties Nieuws van 22 mei 2001
SGI komt met Itanium-Linux systemen Nieuws van 18 maart 2001
Interview met Linus Torvalds Nieuws van 18 februari 2001

Reacties (45)

Wijzig sortering
De conclusie is dan ook positief en GamePC voorspelt zelfs dat er grote kans is dat Intel in de toekomst ook met processors uit zal komen die een geÔntegreerde geheugencontroller hebben.
Als dat zo is dan is Intel niet alleen AMD toch 'een beetje aan het volgen' in de 64bits markt, maar ook het integreren van de core.

Dit moet toch een zeer positief beeld afgeven voor AMD, dat ze trendsetter zijn, en dat de nu grootste, allergrootste cpu bakker AMD na volgt.
Dat betekent ook dat je in de spotlight staat, dat je te boeken gaat staan of al staat als innoverend. En dat spreekt bedrijven heel erg aan. Als ze dan daarom heen ook nog een reclame campagne kunnen plaatsen (als ze er voldoende geld voor zouden hebben) dan zou het helemaal geweldig zijn.
Heb jij ergens gezien dat de door intel geintroduceerde 64bits extenties van AMD zijn? Nee... Dus voor 99% van de consumenten zijn die door Intel uitgevonden, zij weten simpelweg niet beter. En als Intel deze strategie gaat volgen, zullen ze ook zeker niet bekend maken dat deze van AMD geleend is.

Daarnaast is AMD volgens mij niet de eerste die de geheugencontroller in de CPU integreerd.
AMD zal misschien niet de eerste zijn, maar AMD en Intel zijn wel de grootste spelers op de Windows Desktop afzet markt. Daar heb ik het dan over. En AMD en Intel zijn de enigste bekende bedrijven... al kennen veel mensen AMD nog nieteens :(

maja de 64bits extensies van Intel zijn niet 100% hetzelfde als die van AMD maar ze zijn wel degelijk compatible! Daar volgen ze AMD dus gewoon in.. ze riepen eerst dat het niet nodig was, en ze volgen nu wel eerder dan geplant.
Laat ik nog eens een gedurfde uitspraak doen. IBM en AMD werken al een tijdje erg intensief samen.
Nou en dan? Als twee bedrijven op R&D-vlak gaan samenwerken dan levert dit nu eenmaal meer en sneller resultaten op. Daar kan je toch niet tegen zijn.
Indien je je lijstje aan wil vullen: AMD was ook de drijvende kracht achter Hyptertransport (dit heb ik me toch laten vertellen). Deze standaard levert toch ook veel prestatiewinst op!
Natuurlijk weet de "gewone mens" dit niet, maar deze weten ook niet dat Intel SSE2 heeft uitgevonden. AMD heeft dit immers ook op haar Procs.

Ik denk trouwens niet dat IBM gewoon zegt:"We zullen AMD eens wat vooruithelpen." AMD zal ook zeker bijdragen tot de research. Beide partijen zullen zeker een even groot aandeel hebben in de uitvindingen. IBM zal zich niet zomaar int zak laten zetten :Y).
Als dat zo is dan is Intel niet alleen AMD toch 'een beetje aan het volgen' in de 64bits markt, maar ook het integreren van de core.

Dit moet toch een zeer positief beeld afgeven voor AMD, dat ze trendsetter zijn, en dat de nu grootste, allergrootste cpu bakker AMD na volgt.
Het concept van een on-die geheugencontroller is echt niet bedacht door AMD hoor. HP had het in 1991 al op de PA-7100LC, en waarschijnlijk zijn er nog wel oudere voorbeelden te vinden. Ook is het niet zo dat AMD degene is die het nieuw leven in heeft geblazen of iets dergelijks. Transmeta heeft het in alle CrusoŽ / Efficeon processors sinds de eerste TM5600 uit 2000, Sun sinds de UltraSPARC IIe (ook uit 2000), HP in de Alpha EV7, IBM in de Power5 (nog niet uit maar al wel vele jaren 'under construction'), etc.

Er is dus meer dan Intel en AMD in deze wereld. Dat Intel op sommige vlakken wat conservatiever is dan AMD zal ik niet ontkennen, maar om AMD daarom nu meteen te gaan bestempelen als de grote trendsetter in processorland gaat wel erg ver.
Het concept van een on-die geheugencontroller is echt niet bedacht door AMD hoor.
Wat misschien ook een interessant weetje is is dat een vorm van NUMA ook al veel eerder toegepast is in de Amiga (1985). Er werd een verschil gemaakt tussen Chip- en Fast-RAM (en tussenvormen zoals Ranger) die op verschillende modellen via verschillende bussen toegankelijk waren: via de processorbus (geheugen geÔntegreerd op het moederbord, op losse kaarten in 'trapdoor' slot, op externe HD controllers op hybride Zorro/processor extensieslot, geheugen op losse processorkaarten) of via de Zorro of video bus (PCMCIA kaarten, losse Zorro geheugenkaarten of op SCSI controllers, zelfs grafisch geheugen van videokaarten).

De verschillende typen geheugen werd automatisch ingebonden in het systeem met verschillende priorities zodat het snelste geheugen het eerst kon worden gebruikt, bepaalde soorten konden softwarematig uitgeschakeld worden (nofastmem), voorrang gegeven (fastmemfirst), je kon zelfs de priorities veranderen (ChangeMemPri op Aminet),software kon zelf bepalen welk soort geheugen het wilde gebruiken of kon worden omgeleid via utilities zoals MCP (force fast), een ongelofelijk flexibel systeem.
Non Unified Memory Access
moet zijn Non-Uniform Memory Access.

Zou niet weten wat ik me voor moet stellen bij
Non Unified
. Misschien een mix van DDR en Rambus of DDR2 en EDO? :+

\[edit:]

@Ralph Smeets:

Google geeft 45 hits bij unified en 13.000 hits bij uniform. Bovendien krijg ik bij Fujitsu-Siemens ook veel meer hits bij uniform dan bij unified: 11 om 2. Dus unified is gewoon fout volgens mij.
GamePC maakt rare conclusies. NUMA heeft opzichzelf niets te maken met het wel of niet hebben van een eigen memory controller.
De door tweakers aangeduide uitzondering is daar een heel mooi voorbeeld van. Daar is het 'gewoon' via de chipset gedaan.

Verder natuurlijk wel een beetje onnozel om NUMA te gaan testen met applicaties als UT en Photoshop. Weet je bij voorbaat dat je niets te zien krijgt.
Die Sisoft benchmark is leuk om te zien, maar geeft alleen maar een super best case. Het levert nul komma nul informatie over hoe effectief NUMA zal gaan werken.

Die primeur krijgt wat dat betreft van mij een "-1 first post" moderatie, aangezien ze welbeschouwd geen enkele informatie leveren.

De echte vraag is in hoeverre OS ťn applicatie er in de praktijk ook voor kunnen zorgen dat cpu's bij hun eigen geheugen kunnen blijven, en slechts weinig bij andermans moeten lenen?
Multi cpu, multi-threading, hyper-threading, e.d. zien er theoretisch ook altijd prachtig uit, maar de praktijk is weerbarstig...
Moet Intel wel eerst ff afstappen van de bus die ze nu gebruiken sinds, ik geloof, de Pentium Pro.

AMD gebruikt een point-2-point verbinding van processor naar geheugen (iedere cpu een eigen verbinding naar het geheugen) TOV Intel bus (weet naam ff niet meer), wat een gesharede bus is waardoor als 2 CPU's tegelijk het geheugen willen benaderen ze de bandbreedte moeten delen.

Dit is ook een van de redenen dat Intel multi-proc systemen minder goed schalen.
AMD is pas met de 386 begonnen met het maken van x86 chips. Voorheen maakten ze andere soorten chips. AMD vs Intel is iets van de laatste 10 jaar.
Ja en nee staat voor NUMA... wel of geen NUMA, maar alletwee dual channel

Op dit item kan niet meer gereageerd worden.


Apple iPhone XS Red Dead Redemption 2 LG W7 Google Pixel 3 XL OnePlus 6T FIFA 19 Samsung Galaxy S10 Google Pixel 3

Tweakers vormt samen met Tweakers Elect, Hardware.Info, Autotrack, Nationale Vacaturebank en Intermediair de Persgroep Online Services B.V.
Alle rechten voorbehouden © 1998 - 2018 Hosting door True