Op het IDF demonstreerde Intel ook de Hybrid Memory Cube of HMC, een geheugenmodule die het bedrijf samen met Micron ontwikkeld heeft. Volgens de makers is dit het 'snelste en efficiëntste dram ter wereld'. De truc ervan is om meerdere lagen geheugenchips direct op elkaar te plaatsen, met de i/o-circuits daaronder. Het prototype zou veel sneller werken en bovendien veel efficiënter zijn dan de modernste ddr3-modules van dit moment.
Vorig jaar demonstreerde Intel al een prototype dat 1,4 milliwatt per gigabit per seconde verbruikte. Dit jaar gaf het bedrijf ook details over de 'geheugenkubus' zelf vrij. We vroegen de aanwezige onderzoekers onder andere hoe snel de module nu werkelijk is, en wanneer we de Hybrid Memory Cubes in onze pc's mogen verwachten.
Dat is gewoon pertinent onwaar. De bandwidth is dan wellicht wel voldoende, maar de latency is absoluut niet om over naar huis te schrijven. Als een stuk geheugen niet in de cache staat, dan gaan er al gauw 200 CPU cycles overheen voordat het geheugen op z'n plek is, en als er verder geen berekeningen te doen zijn (bijv. omdat die data nou eenmaal nodig is) dan staat de CPU dus doodleuk uit z'n neus te eten. Met andere woorden, als je een app hebt die niets anders dan random access naar uncached geheugen doet, dan gedraagt je 2GHz CPU al gauw alsof het eigenlijk een 10MHz CPU is. Welkom in 1985Het is in ieder geval zo dat we op dit moment gewoon niet echt sneller geheugen nodig hebben dan het huidige DDR3 geheugen in PC's en Laptops
The short of it is that no, memory latency is not reduced. Other technology from Micron such as RL-DRAM (reduced latency DRAM) trades off die-area for a reduction in latency. In short, they chop the bitlines up into shorter pieces, reducing RC delay, and getting your data out faster. The HMC is all about low-power and bandwidth. In many video applications, getting larger bandwidth is actually more important than reduced latency, especially as density increases. I imagine that with a logic chip built in a logic-specific process would contribute very little in terms of latency to the system. Remember that transistors in a DRAM are incredibly slow due to the high-temperature steps in capacitor formation. A high-speed logic device will be capable of running at incredible frequencies - implying very minimal gate delays (and thus, an insignificant increase in latency relative to the RC delay of a large bitline).
[Reactie gewijzigd door .oisyn op vrijdag 30 september 2011 11:32]
Dit is dus exact hoe het niet zit...Het is in ieder geval zo dat we op dit moment gewoon niet echt sneller geheugen nodig hebben dan het huidige DDR3 geheugen in PC's en Laptops. Natuurlijk zal het systeem misschien iets sneller reageren, maar het limiet zal al snel bij de drive en processor liggen.
(emphasis added)From 1986 to 2000, CPU speed improved at an annual rate of 55% while memory speed only improved at 10%. Given these trends, it was expected that memory latency would become an overwhelming bottleneck in computer performance.
Ik kan er iig de eerste al bedenken, waar het praktisch altijd (in het begin) door komt: geld. De kosten van nieuwe technologie is in het begin altijd duur, naar mate het meer en meer gebruikt wordt, wordt de kennis over de technologie beter, het proces om het te maken verbeterd en wordt daardoor ook goedkoper, zuiniger en sneller. Uiteindelijk zal dit denk ik heus wel in de desktop verschijnen, maar zal nog even duren eer het populair en betaalbaar genoeg is.Waarom dat zo is weet ik niet, misschien wordt het geheugen buitengewoon duur?
Het werd ook niet helemaal duidelijk wanneer dit soort geheugen dan in supercomputers beschikbaar zou komen, daar ben ik ook wel benieuwd naar.
Ik weet niet hoe jij dan een FPS wilt gaan spelen als je een soort videostream bedient.. Lijkt me dat dat al een hoge latency oplevert als de server bij je om de hoek staat. Laat staan als een server in de VS staat.. Je ping is al 50ms.. dan is het maar hopen dat je verbinding super stabiel is..Meerdere werelddelen spelen op verschillende tijdstippen, dus relatief minder hardware nodig
Nee, dat is gewoon de praktijk van verschillende hardware. Met Direct3D heb je precies hetzelfde (al is bovenstaand stuk code wel overdreven). Problemen kennen meerdere oplossingen, en niet elke oplossing werkt even goed op elk stuk hardware.Carmack is haast zo ver dat hij, tenminste, las ik ooit ergens, helemaal aan het begin van z'n engines een mooie: IF (nvidia) THEN (engine1), ELSEIF (amd) THEN (engine2) ELSE (engine3) neerzet (of gewoon 3 binaries aanbieden). Dat is de praktijk van OpenGL.
[Reactie gewijzigd door .oisyn op vrijdag 30 september 2011 11:19]
Lijkt me evident; het bevindt zich nog in de laboratorium fase, getuige deze demo van Intel labs.En daar wil ik dus eigenlijk mee zeggen dat RayTracing, hoewel een typische "OpenCL" taak op dit moment, nog helemaal niet volwassen is....Pure, raytrace graphics zijn nog onontgonnen gebied.
Laat er eerst maar eens voldoende snelle en betaalbare hardware ontwikkeld worden om hoge kwaliteit raytracing real time te doen. Zolang raytracing zich nog in de laboratorium fase bevindt, is het wat vroeg voor een standaard. Als de techniek rijp is, komt er die standaard er wel.Laat er eerst maar eens een standaard opgelegd worden.
Hangt er vanaf wat voor demo het is; product demo, game demo, of demo van een render techniek.* Tearing in het filmpje. Not done voor demo's
[Reactie gewijzigd door Kaw op vrijdag 30 september 2011 12:02]
Er is technisch gezien helemaal geen API nodig. Je kunt ook gewoon zelf commando's in een commandbuffer schrijven, wat op de consoles niet eens zo heel vreemd is.Er is een API nodig om de hardware van je videokaart te kunnen benaderen om die methodes die je aan je videokaart kun overlaten aan te kunnen spreken.
Natuurlijk kun je dat zelf. Maar het daadwerkelijk ook zo efficient mogelijk doen is niet voor heel veel mensen weggelegd. Beter praat je gewoon tegen een API die het zo goed mogelijk implementeert op de aanwezige hardware. En omdat hardware nogal verschilt, zou je dus ook raytracing-drivers kunnen hebben. En op het moment dat je drivers hebt, is een API wel zo handig.maar je kunt zelf ook het raytracen toepassen.
Ik heb het over welk stuk hardware dan ook. Uiteindelijk gaan we een kant op waarin dingen steeds meer geïntegreerd worden in de CPU. Zo is er Intel's Larrabee, en AMD's Fusion. Dingen als OpenCL zijn leuk, maar hoewel je het daarmee kunt implementeren blijft een extra laag van abstractie die niet nodig is als je een library wilt maken met 1 bepaald doel.Raytracing-drivers? Om wat voor stuk hardware aan te spreken? Volgens mij zit je nog steeds in het idee dat je de GPU de raytracing laat uitvoeren
[Reactie gewijzigd door .oisyn op vrijdag 30 september 2011 15:10]
Als je de video kijkt, op 0:50 zegt de engineer dat ze draaien op "eight Knight Ferry cards". Dat is een ander research-project van Intel: Many Integrated Cores (MIC). Hoewel die kaarten er inderdaad uit zien als grafische kaarten bevatten ze in feite x86 (of x86-achtige??) cores. Of de CPU een Xeon is maakt niet uit, de Knights Ferry kaarten doen het eigenlijke werk.Raytracing-drivers? Om wat voor stuk hardware aan te spreken? Volgens mij zit je nog steeds in het idee dat je de GPU de raytracing laat uitvoeren. Daar gaat het artikel niet over en in de praktijk wordt raytracing vrijwel alleen toegepast met behulp van de CPU. In het geval van het artikel een Xeon E7-cluster.
Yep, dat doe ik ook.(Carmack is haast zo ver dat hij, tenminste, las ik ooit ergens, helemaal aan het begin van z'n engines een mooie: IF (nvidia) THEN (engine1), ELSEIF (amd) THEN (engine2) ELSE (engine3) neerzet (of gewoon 3 binaries aanbieden). Dat is de praktijk van OpenGL.
[Reactie gewijzigd door Mythx op vrijdag 30 september 2011 13:51]
[Reactie gewijzigd door .oisyn op vrijdag 30 september 2011 12:02]
[Reactie gewijzigd door Maximilian op vrijdag 30 september 2011 11:39]
Duh, het punt is dat je mW per GB per s ook kunt lezen als mW/GB/s (en dat is doorgaans ook gebruikelijker), wat wat anders is dan het bedoelde mW / (GB/s). Het is maar net hoe je de haakjes zet. Dat "per" voor een deling staat snapt iedereen denk ik wel.Per staat voor verhouding, dus gedeeld door, dus [mJ/s]/[Gb/s]=[mJ/Gb]
[Reactie gewijzigd door .oisyn op vrijdag 30 september 2011 22:40]
[Reactie gewijzigd door Wolfos op zaterdag 1 oktober 2011 01:16]
Op dit item kan niet meer gereageerd worden.
Populair: Asus Samsung Mobiele telefoons Laptops Apple Sony Games Microsoft Consoles Microsoft Xbox One
© 1998 - 2013 Tweakers.net B.V. Contact Over Tweakers Jouw privacy Algemene voorwaarden Cookies
Tweakers wordt uitgegeven door De Persgroep en wordt gehost door True