Laten we met het begin beginnen en de grote lijnen van deze Vega 10-architectuur, zoals deze eerste generatie Vega bij AMD heet, in kaart brengen. Er zijn en komen nog diverse kaarten die met deze architectuur zijn uitgerust, maar voor de duidelijkheid hebben we het hier primair over de gpu zoals die in de AMD RX Vega 64 te vinden is. De gpu's RX voor Vega, de consumentenkaarten met de Vega 10-architectuur, zijn opgebouwd uit 12,5 miljard transistors die op 14nm geproduceerd worden. AMD laat Vega door Global Foundries op het 14nm-lpp finfet-procedé maken. De Vega 10-architectuur maakt gebruik van de vijfde generatie Graphics Core Next, maar de compute-units daarvan zouden dermate veranderd zijn dat AMD spreekt van Next Generation Compute Units.
De gpu met 12,5 miljard transistors beschikt over één graphics-engine, vier asynchrone compute-engines en evenveel geometry-engines. Elke compute-engine stuurt zestien compute-units aan, goed voor 64 in totaal. Er zijn vier texture-units per compute-unit en één render-unit per cu. Elke cu is natuurlijk weer onderverdeeld in streamprocessors en met 4096 streamprocessors in totaal zijn dat er 64 per cu. Dan is er nog 1MB L2-cache voor elke compute-engine, oftewel 4MB L2-cache in totaal, twee keer wat Polaris aan boord heeft. Dat is lang niet al het geheugen, want in totaal bevat de gpu 45MB sram. Zo heeft een compute-unit 16kB L1-cache en 64kB lokale dataopslag, en natuurlijk vector- en scalarregisters, goed voor viermaal 64kB en 4kB respectievelijk. In totaal telt Vega dan ook 45MB aan sram-geheugen. Het die-oppervlak daarvan is binnen de perken gehouden door samenwerking met het Zen-team, dat ook veel sram op weinig oppervlakte gebruikt.
Dat sram-ontwerp is niet het enige wat van het Zen-team gebruikt wordt. Ook het Infinity Fabric uit de Zen-architectuur vinden we terug in Vega. In de toekomst kan dat voor efficiënte communicatie met Zen-cores gebruikt worden, denk aan de komende Raven Ridge-apu's, maar vooralsnog dient het onder meer om de timings juist te krijgen. Zo'n grote chip moet natuurlijk een gesynchroniseerd kloksignaal hebben en dankzij het Infinity Fabric kan AMD een veel sneller kloksignaal gebruiken dan bij Polaris. Die architectuur was voor ongeveer 1,3GHz ontworpen, maar Vega is voor zo'n 1,7GHz gemaakt, met volop ruimte voor snellere kloks. Vergeleken met AMD's vorige high-end generatie Fiji is het verschil nog groter; de Fiji-architectuur was voor 1GHz ontworpen.
AMD prijst Vega aan als een nieuwe architectuur, maar als we even het Infinity Fabric en het geheugen, waar we zo direct dieper induiken, daar laten, dan is Vega in beginsel gewoon de bekende gcn-architectuur met vier asynchrone compute-units, net als Fiji, Polaris en voorgangers. We zullen de verschillen moeten zoeken in het geheugenbeheer, de software en de manier waarop AMD 16bit-rekenkracht inzet.