Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 49 reacties

Intel zou met de introductie van de serverversie van zijn Haswell-processors overstappen op ddr4-geheugen. De reguliere desktopversie van Haswell, die een jaar eerder verschijnt, zou echter alleen met ddr3-geheugen overweg kunnen.

De opvolger van Intels Sandy Bridge-architectuur, de processorgeneratie met codenaam Ivy Bridge, is aanstaande; de eerste 22nm-processors moeten eind deze maand verschijnen. De opvolger van Ivy Bridge is echter eveneens in ontwikkeling en deze 22nm-'tock' draagt de codenaam Haswell. In 2013 moeten de Haswells met een nieuwe microarchitectuur voor consumentenplatforms verschijnen. Die zullen gaan samenwerken met ddr3-geheugen, al is dat waarschijnlijk wat sneller dan de huidige reepjes.

Een jaar later, begin 2014, staan de serverversies van Haswell, ofwel de Haswell-EX-processors op de planning. Volgens VR-Zone gaan deze processors met tot zestien cores gebruikmaken van ddr4-geheugen. Dat geheugen moet niet alleen tot zuinigere systemen leiden, maar ook beter foutherstel bieden. De ddr4-geheugenstandaard, die vorige zomer werd geformaliseerd door de Jedec, krijgt een werkspanning van 1,2V. Onder meer Samsung heeft al modules met ddr4-geheugenchips ontwikkeld.

Samsung ddr4-geheugen
Moderatie-faq Wijzig weergave

Reacties (49)

Intel heeft geen haast om DDR4 snel tot de nieuwe standaard te maken want dan spelen ze AMD in de kaart. AMD heeft met hun APUs namelijk een geheugenbandbreedte te kort voor het GPU gedeelten van de APU.

AMD kan dit op meerderen manieren oplossen:

1. I.p.v. een dual-channel IMC (Integrated Memory Controller) een triple- of quad-channel IMC gebruiken in hun APUs. Probleem hiermee is dat dit niet handig is voor laptops waar het plaatsen van drie of vier geheugen modules niet wenselijk is en met de hype van kleiner en dunner al helemaal niet. Ook verbruikt het meer, wat voor laptops ook zo laag mogelijk moet zijn. Daarnaast is het natuurlijk ook duurder om meerdere reepjes te gebruiken.

2. De snelheid die de IMC ondersteund omhoog schroeven. Probleem hiermee is dat snelle geheugen reepjes relatief duur zijn.

3. De IMC veel efficiŽnter te werk laten gaan. Dit hebben ze als het goed is gedaan met de IMC in Trinity (t.o.v. Llano). Trinity heeft net als Llano een dual-channel IMC. Trinity heeft een veel beter GPU gedeelte dan Llano waardoor de vraag naar bandbreedte alleen maar toe is genomen. Ondanks dit is Trinity toch ~50% sneller op grafisch gebied dan Llano.

4. De vierde oplossing is natuurlijk DDR4. Dit heeft na genoeg geen nadelen behalve dan dat het even duurt voordat het goedkoper is dan DDR3 omdat het bij introductie geen standaard is. DDR4 is ook nog eens zuiniger dan DDR3. DDR4 zal pas in 2015 goedkoper zijn dan DDR3 en AMD zal het geheugen bandbreedte tekort op een andere manier moeten oplossen.



AMD is, omdat ze met hun GPU gedeelten in de APUs tegen een geheugen bandbreedte bottelnek aan lopen, meer gebaat bij sneller geheugen dan Intel dat is. CPUs en CPU gedeeltes bij APUs hebben geen voordeel van veel bandbreedte. Zelfs met geheugen intensieve benchmarks is er vaak maar een marginaal verschil tussen geheugen snelheden. Elke keer als AMD en Intel van DDR naar DDR2 of van DDR2 naar DDR3 gingen was er geen significante performance toenamen toe te zien. Als er wel spraken was van een significante performance toenamen dan kwam dit vaak door iets anders zoals een betere IMC of in Intel zijn geval een betere MC in de chipset.

De laatste tijd heeft Intel sowieso enorme sprongen gemaakt. Met socket 1366 gingen ze naar triple-channel geheugen en met socket 2011 gingen ze zelfs naar quad-channel geheugen. Eigenlijk was dit onnodig, CPUs op socket 1366 hadden waarschijnlijk ook meer dan genoeg gehad aan dual-channel en de CPUs op socket 2011 zouden dan wel weer wat baat hebben gehad bij triple-channel.

We kunnen dus concluderen dat Intel geen haast heeft met DDR4 en dat AMD het, het liefst vandaag nog tot de standaard zou maken.

[Reactie gewijzigd door madmaxnl op 5 april 2012 14:34]

Je vergeet oplossing 5: vergroting van de cache, meer cache betekent minder cache-misses, dus heb je minder bandbreedte nodig om de data uit RAM te halen. Dit kost echter wel dure chipoppervlakte.
Cache is inderdaad ook nog een manier, Intel heeft dit gedaan met Sandy Bridge. Ze gebruiken hun L3 cache ook voor de GPU. Probleem is dat wanneer de GPU en CPU belast worden de L3 cache vol loopt met als gevolg dat de prestatie inkakt. Daarnaast is L3 een dure oplossing.
Oplossing 6 ligt ook wel voor de hand: AMD kan een aantal geheugenchips in de chip package plaatsen, bijvoorbeeld voor dedicated gebruik voor het GPU-gedeelte van de chip.

Waarschijnlijk net zo kostbaar als een groter L3, maar zal vermoedelijk betere performance opleveren.

[Reactie gewijzigd door W3ird_N3rd op 5 april 2012 21:44]

de bandbreedte die DDR3 kan leveren is echt al veel meer dan nodig. Het probleem zijn de latencies.

Die liggen eigenlijk nog veel te hoog, DDR4 zal wel kom af maken met de channel architectuur, hopelijk verlaagt dat de latenties, die voor deze tijden eigenlijk echt bijna extreem hoog liggen.

Volgens mij is het cache geheugen van een Pentium 1 nog altijd sneller bereikbaar dan het RAM geheugen van vandaag.

Net als de ontwikkeling van HDD naar SSD is het nu de buurt aan RAM niet voor bandbreedte,maar de latentie, net als de HDD wel snel veel kan lezen schreven, seqentieel, maar de acces-time ligt extreem hoog, 12ms op de snelste schijven!

BTW, met de GPU-CPU combi's waar we heen gaan, hebben we nog harder nood aan lage latenties, anders is je GPU sterk belemerd, kijk naar de APU's van amd

[Reactie gewijzigd door g4wx3 op 5 april 2012 11:23]

de bandbreedte die DDR3 kan leveren is echt al veel meer dan nodig. Het probleem zijn de latencies.
Een echte verbetering van de latency is alleen mogelijk als men afstapt van de multiplex (ras/cas) adressering, theoretisch mogelijk maar praktisch niet echt uitvoerbaar.

Echter de praktijk is dat code en data voor het grootste deel sequentieel worden benaderd, maw een grote L1 cache + prefetch is afdoende om het latency probleem te minimaliseren zo niet op te lossen.
Volgens mij is het cache geheugen van een Pentium 1 nog altijd sneller bereikbaar dan het RAM geheugen van vandaag.
Cache zit in de CPU en de CPU heeft directe toegang (want het is gewoon deel van je CPU-architectuur), de afstand naar L1-cache is slechts millimeters, dus niet zo heel vreemd dat cache voor latencies extreem veel lager ligt dan van geheugen.

[Reactie gewijzigd door bwerg op 5 april 2012 12:35]

Ten tijde van de originele Pentium zat de level 2 cache nog op het moederbord geprikt. De enige cache die op de processor zelf zat was de level 1 cache.
Inderdaad, en de off-chip cache van de Pentium was geen latency wonder.
BTW, met de GPU-CPU combi's waar we heen gaan, hebben we nog harder nood aan lage latenties, anders is je GPU sterk belemerd, kijk naar de APU's van amd
De rest van je verhaal slaat de spijker op de kop, maar hier zit je toch echt fout. Latency maakt vrij weinig uit bij een moderne GPU en dat komt omdat een GPU duizenden threads tegelijk aan het werk heeft. Als een van de threads moet wachten (meestal een batch van X threads) wordt gewoon een andere batch aan het werk gezet. Door de "embarrasingly parallel" aard van graphics maakt latency weinig uit. Het probleem bij de APUs is juist bandbreedte. Bij een moderne discrete GPU heb je snel 50-200 GB/s aan bandbreedte, een APU heeft maximaal 20-30 GB/s ter beschikking, en dat moet gedeeld worden met de CPU zelf.
Theoretisch zou je gelijk kunnen hebben, maar de praktijk blijkt een stuk weerbarstiger. Als ik er even de benchies bijpak dan kun je zien dat voorlopig een grotere bandbreedte heel interessant is, en lagere latencies minder uitmaken. Da's natuurlijk een beetje afhankelijk van het programma, maar in de meeste gevallen staat data sequentieel, wat betekent dat je rustig je volgende commandos alvast kunt doorgeven, en data heel hard door blijft stromen, zonder al te veel onderbrekingen. In die gevallen hangt de overdrachtssnelheid vooral van je bandbreedte af (immers 2 signalen heen, en daarna moeten er 64 bits terug, die meestal wel in parallel kunnen overigens).

Vergeet overigens niet dat hoewel C9 heel populair is, er al jaren DDR3-1600 C6 bestaat... dat alleen amper verkrijgbaar is vanwege lage vraag. DDR3-2400 C9 is gewoonlijk een pak sneller, en dat gaat nog veel verder oplopen als straks GPUs op de CPU nog meer bandbreedte gaan eisen. AMDs houden wel van lage latencies, maar ook weer niet zoveel, trouwens :) (ik haal nog geen 2% winst tussen 1600 C9 en C6)

Pentium 1 werkte op 200 Mhz, CAS 1, iets waar we met een beetje geheugen zo op zitten... 2400 / 9 = 267 enzo ;)
Op zich weer een stapje erbij. Altijd leuk. Maar met hogere bandbreedtes komen ook hogere latencies. Het zou misschien handiger zijn om meteen XDR geheugen te gaan gebruiken.
Dat heeft meer oemf en is zuiniger.

http://www.xbitlabs.com/n...DR_Memory_Sub_System.html
Op zich weer een stapje erbij. Altijd leuk. Maar met hogere bandbreedtes komen ook hogere latencies. Het zou misschien handiger zijn om meteen XDR geheugen te gaan gebruiken.
Dat heeft meer oemf en is zuiniger.

http://www.xbitlabs.com/n...DR_Memory_Sub_System.html
Die latencies worden uitgedrukt in clock cycles, als die enorm verhoogt wordt omdat er per clockslag meer data overgepompt wordt, dan maakt een hogere latency nauwelijks uit: je wacht miss een paar klokslagen meer, maar omdat die korter duren is de latency in ns nauwelijks veranderd...

Neemt niet weg dat rambus een interessant concept heeft neergezet met hoge snelheden. Qua verbruik, als je serverpark 100'en GB's heeft dan is die stroombesparing wel siginicant, maar voor een thuisgebruiker zul je die paar watt van je geheugen nauwelijks merken naast een cpu en een graka?
Zodra ik het woord Rambus zie, begin bij mij toch andere dingen op te komen. Maar dat is misschien wel voorbij.

Wat ik zelf verbaast is hoeveel winst er nog wordt geboekt tussen DDR3 en DDR4. Is dit nog wel een significante prestatieverschil in benchmarks? Niet alleen in synthetische maar ook in games of applicaties.
Achja, toen DDR3 uit kwam was het ook marginaal sneller dan het beste wat DDR2 te bieden had. Inmiddels zit dat ook wel anders.

Zo ook met DDR4 denk ik, als je de volgende generatie zou overstappen helpt dat niet zo gek veel, maar misschien is dat ook wel waarom Intel nog niet over gaat met Haswell.

Als de prestaties niet duidelijk beter zijn en er geen technische reden is over te stappen, dan doe je dat natuurlijk nog niet toch? Dat is alleen maar de consument op kosten jagen, kosten waar Intel zelf ook nog eens niet echt iets mee verdiend...
Dat interesseert de gemiddelde consument helemaal niets. Intel heeft al eerder moederborden gehad met Rambus geheugen en dat is toch eigenlijk, door de prijs, een redelijk niche product gebleven. Denk niet dat ze daar nog een keer in gaan trappen.
Rambus is ook vrij duur met patentjes/licenties :(.

*Edit;
Als je de reacties leest onder de link die je plaatst, dat zegt ook al genoeg....

[Reactie gewijzigd door SantaMuerte op 5 april 2012 11:22]

Dat men niet voor XDR kiest, heeft waarschijnlijk te maken met de reputatie van Rambus.

[Reactie gewijzigd door Abom op 5 april 2012 11:24]

Het latencie getal wordt dan wel hoger maar in absolute tijd blijft het per generatie ongeveer hetzelfde.
Maar met hogere bandbreedtes komen ook hogere latencies.
latency wordt bijna volledige bepaald door de snelheid van de interne geheugen cell.
die draait al jaren op 200mhz
vanaf ddr1-400 tot ddr3-1600, draait die op 200mhz.
latency in tijd is dus exact het zelfde gebleven, maar om meer bandbreedte te creŽren zijn meer van geheugen cellen op 200mhz bij elkaar gezet om voor extra bandbreedte te zorgen.
Kan iemand mij uitleggen waarom het risico voor Intel zo groot is om over te stappen naar DDR4? Met VRAM zijn we al veel verder en daarbij zijn dan alle risico's/problemen al ondervangen.
Of zijn de berekening die het interne geheugen moet uitvoeren zoveel complexer?
Je stelt hierbij de nummertjes achter GDDR gelijk aan die achter DDR, dat is niet juist, maar wel een veel voorkomende fout. GDDR5 is gebaseerd op DDR3. Het is alleen geoptimaliseerd voor videokaart geheugen en de snelheid is opgeschroefd.
Ik had uit betroubare bronnen vernomen dat het DDR4 geheugen mogelijk alleen in so-dimm formaat zou komen, om kosten en verbruik te drukken.

Iemand anders die hier misschien meer over kan vertellen/bevestigen?
Dat heb ik ook gehoord. Van een geheugenfabrikant zelf. (al was het maar een chipjes op latjes soldeerder)
Wat ik me afvraag is met de quad, octo en hexa-core CPU's die er zijn of gaan komen, dat de memory bus niet de grootste bottlenech gaat worden? Misschien dat ze bij Intel (of AMD) ook onderzoek gedaan hebben naar parallelle memory busses. Bv. elke cure zijn eigen dedicated memry bus. Ik weet niet of dit impact heeft op de zgn NUMA architectuur?
Het probleem dat je dan hebt is dat de gebruikte socket (met de memorycontrollers op de CPU) alle mogelijke memory bussen/channels moet ondersteunen, dat betekent een duurder moederbord, ook als je een single of dual core CPU wilt gebruiken, of verschillende sockets voor verschillende hoeveelheden cores. Ook zullen de moederborden dan geheugenslots moeten hebben voor alle mogelijk gebruikte geheugenchannels, die onbruikbaar zijn bij minder cores, dus weer dure moederborden. Of de goedkope moederborden worden niet voorzien van alle mogelijke memorychannels en die kan je dan niet gebruiken in combinatie met meer-core CPU's.

Uiteindelijk zal je dan uitkomen op verschillende sockets voor elk mogelijk core-aantal. Productieaantallen per type moederbord zijn dan lager, dus de prijs gaat omhoog.

NUMA is een mooi systeem voor meerdere sockets, maar op een enkele socket kan je beter de geheugencontrollers samenvoegen en een bredere bus of meerdere bussen laten gebruiken (in geval van DDR4 is het geen bus meer maar een point to point protocol tussen memorycontroller en elke geheugenmodule), de L3 cache zal waarschijnlijk ook gedeeld zijn, dus waarom niet de geheugencontroller?
waarom dan pas. klinkt in mijn oren een beetje dat als intel het nog niet wilt, je nog even mag wacht op ddr4.
Misschien is het wel een goed iets. Intell wil niet weer een product op de markt gooien die niet 100% werkt (zoals met de eerste sandy-bridge processoren). Geef het wat tijd om wat verder te ontwikkelen.
Wat? Die 'bug' in de sata-controller was inderdaad nogal een fail, maar het overgrote deel van de gebruikers heeft daar echt geen last van gehad en bovendien had het niets met de CPU te maken.
Intel heeft wel vaker z'n vingers verbrand aan te vroeg met een nieuwe geheugentechniek beginnen, onder andere twee keer met RDRAM van Rambus, eerst eind jaren 90 met de Pentium 3 i820 chipset en vervolgens in 2000 met de eerste P4's. RDRAM was moeilijk leverbaar, 2-3x duurder dan SDRAM, en leverde maar amper performance voordeel op.

En om het nog erger te maken, voor de i820 was ook een MTH (Memory Translator Hub) beschikbaar zodat er SDRAM op het bord gebruikt kon worden, na lancering werd daar echter een bug in ontdekt die voor BSOD's zorgde.

Uiteindelijk heeft RDRAM Intel de nodige problemen opgeleverd, een volledige call-back actie van alle i820+MTH moederborden en moeten terugvallen op een verouderde BX chipset (die minder performance leverde) omdat een i820+RDRAM te duur was voor 95% van de gebruikers.

Intel kijkt in het vervolg dus wel uit met introduceren van nieuwe geheugenstandaarden.


Daarnaast zouden er nog andere problemen kunnen zijn die leiden tot een uitstel van DDR4.
• Ten eerste is er al lang een eerste (en misschien tweede) spin-out geweest van het Hasswel silicium, met daarop een DDR3 controller (DDR4 standaard is nog niet zo lang klaar), je gaat in zo een "laat" stadium niet nog even de architectuur compleet overhoop gooien.

• Ten tweede en derde is DDR4 waarschijnlijk gewoon nog te nieuw voor een grote marktintroductie in Q1 2013:
2: Momenteel heeft volgens mij alleen Samsung momenteel samples van DDR4 chips beschikbaar, wat het evalueren en valideren van een Haswell processor met DDR4 controller lastig maakt.
3: Het is maar de vraag in hoeverre productie van DDR4 chips en geheugenreepjes volgend jaar al optimaal verloopt. Je wilt niet dat je processors en moederborden vollop in de schappen liggen maar dat er geheugen verkrijgbaar is.


edit: was bedoeld als reactie op otandreto.

[Reactie gewijzigd door knirfie244 op 5 april 2012 11:56]

En niet te vergeten FBdimm. Ik heb nog steeds blaren aan m'n poten van die dingen. Goedkoop waren ze ook niet echt niet.

Hoewel Intel eigenlijk wel een handje heeft van (te) snel platforms wisselen, ben ik blij dat DDR4 er niet direkt ingerambussed word, RAM is nog steeds geen bottleneck en dat houd upgraden toch nog even open.
ja daar heb je wel gelijk in. misschien iets te voorbarig met mijn uiting.
Waarom 2 treden overslaan als elke tree een sloot geld heeft gekost om te ontwikkelen. Eerst je investering terugverdienen, dan verder.

Doe je dat niet dan is je bedrijf geen lang leven beschoren.
Kan iemand uitleggen waarom het foutherstel beter zou zijn?
Sowieso zou een verwijzing naar een artikel over foutherstel in DDR3 of 4 fijn zijn.
en hoeveel sneller is dit geheuge en hoe zijn de latencies?
als de latencies steeds hoger en hoger worden schieten we niet veel op...
en dan nog de vraag hoe optimaal worden de geheugencontrollers?

de huidige reekt is nog niet eens in staat om het maximale uit ddr3 2133 te halen dus waarom hebben we ddr4 daadwerkelijk nodig wat zijn de direct prestatievoordelen?
Momenteel voegt het niet echt meer wat toe sinds DDR2 800MHz 4-5 timings is en nu met DDR3 1600mhz 9 timings oid.. Dus komt op het zelfde neer (ongeveer).

geheugen is sowieso voor gamers niet relevant. Vraag me af wanneer het weer nieuwswaardig wordt.

[Reactie gewijzigd door A87 op 5 april 2012 11:19]

800/4=200 wat wel wat heeft dus met 1600/8 lijkt het hetzelfde maar als je al een reepje hebt met 1600/7 zit je al op 228 en dat is weer een dikke 10% sneller
geheugen is sowieso voor gamers niet relevant. Vraag me af wanneer het weer nieuwswaardig wordt.
Misschien is het niet voor gamers relevant, maar dit is geen gamerswebsite, voor mij is dit wel degelijk nieuwswaardig, misschien zit jij op de verkeerde website, of in ieder geval op het verkeerde deel ervan.

[Reactie gewijzigd door i8086 op 5 april 2012 13:45]

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True