Vergeet niet dat de AMD cpu's de mem controller op de die hebben. Plak daar de gpu bij, en je zit goed.
Nee, want zoals ik al zei, is een memorycontroller van een GPU compleet anders, en heeft veel meer bandbreedte.
Geintegreerde GPUs gebruiken in feite ook de memorycontroller van de CPU (meestal die van de chipset dus), en daardoor komen ze nooit vooruit.
Waarom hebben gpu's zo veel bandbreedte (agp 8x, pci-x, etc) nodig?
Dat hadden ze vroeger nodig, omdat de GPU nog geen GPU was, maar een dom processortje dat een polygon in 2d kon tekenen met een textuurtje erop.
De CPU moest dus de complete geometrie bewerken, en vertex voor vertex naar de GPU pompen. Daar had je een hoop bandbreedte voor nodig.
Maar sinds de opkomst van T&L is dat niet meer het geval (dit was omstreeks het AGP4x-tijdperk). Je uploadt gewoon je vertices, en om ze te tekenen hoef je alleen nog maar de transformatiematrix te versturen.
Veel minder bandbreedte dus.
Het enige probleem dat je nu nog hebt, is een eventueel tekort aan videogeheugen, zodat textures en andere data in- en uitgeswapt moeten worden.
In dat geval is het wel prettig om zoveel mogelijk bandbreedte te hebben.
Maar, een GPU gebruikt DMA om dit zelf te doen. De CPU komt hier niet aan te pas, en dat wil je ook niet. Het zou niet fijn zijn als je CPU stil komt te liggen zodra er een textuurtje geswapt moet worden, omdat de GPU ineens al je bandbreedte steelt.
Verder maakt PCI-e het mogelijk om ook snel het videogeheugen uit te lezen, wat bij oa toepassingen als GPGPU handig is. Dit is een toepassing waar het eventueel wel handig kan zijn om snellere communicatie te hebben tussen CPU en GPU, maar dit is geen technologie die je tegenkomt in normale 3d-applicaties. Dit is momenteel puur een academisch experiment.
De vraag is ook hoe belangrijk die communicatie is, omdat de bottleneck meestal het rekenwerk zal zijn, niet de input/output. Je kunt zelfs redeneren dat als de input/output de bottleneck is, dat het rekenwerk dan dermate triviaal moet zijn, dat je het sneller op de CPU kunt doen, omdat je dan de input/output kunt overslaan.
Verder moet je het zo zien: dit zorgt voor een meer geintegreerde oplossing, wat een eenvoudiger mobo impliceert. Dat kan de hogere kosten van deze cpu+gpu al meer dan goedmaken.
Dat is helemaal niet gezegd. Zoals je uit mijn bovenstaande verhaal kunt concluderen, MOET je een geheugencontroller op je videokaart hebben, en eigenlijk MOET je ook specifiek videogeheugen hebben, omdat standaard-geheugen meer gericht is op latency dan op bandbreedte. Videogeheugen is precies omgekeerd.
In dat geval moet je dus twee memorycontrollers via je socket gaan voeden (waarbij een GPU ook nog eens 256 bit is ipv 128 bit), dus je moet enorm veel pinnen op je socket maken. Ik denk dat dat niet eens mogelijk is. En anders wordt dat zeker heel erg duur.
Plus dat je niet off-chip hoeft voor communicatie, wat bv ook zeer veel stroom spaart.
Maar die communicatie is dus niet zo interessant, zoals ik al heb uitgelegd.
Dit wordt geen high-end oplossing, maar kan een heel leuke low of zelfs mid-end oplossing bieden.
Dat zei ik al, maar dan zijn de regels natuurlijk compleet anders. Voor high-end is het waarschijnlijk onhaalbaar, en voegt het verder ook niets toe qua performance.