AMD heeft tijdens een evenement in San Francisco details over zijn nieuwe Zen-architectuur onthuld. Daarbij toonde het resultaten van een benchmark waarin de highend-serie processors op basis van deze architectuur, Summit Ridge, zich kunnen meten met Intels Broadwell-E.
Tijdens het event ging AMD dieper in op de architectuur achter Zen, die moet schalen van laptop tot server. Daarbij is vanzelfsprekend gewerkt aan prestatiewinst, aangezien de Bulldozer-architectuur niet tegen Intels processors kon opboksen, maar ook de honger naar energie is aangepakt. Waar Bulldozer-cores, die in de AMD FX-processors gebruikt worden, nog over modules met twee integer- en een gedeelde floating point-unit per twee 'cores' had, heeft elke Zen-core zijn eigen integer- en floating point-eenheid.
Elke integer-unit beschikt over vier
alu's voor rekenwerk en twee
agu's voor de geheugenadressering. De fpu's hebben twee optel- en twee vermenigvuldig-eenheden. Om instructies aan de rekenblokken te voeren heeft AMD de branch prediction, die voorspelt welke instructies waarschijnlijk volgen en zo alvast klaargezet kunnen worden, verbeterd. Daartoe is ook een micro-op cache toegevoegd, die in Bulldozer ontbrak en voor aanzienlijke winst moet zorgen. Per kloktik moet Zen vier instructies aan de queue toevoegen, waarna zelfs zes instructies aan de schedulers gevoerd kunnen worden. Volgens AMD levert dat 50 procent tot 75 procent verbetering op in de pipeline.
Om de cores van instructies te voorzien, zijn ook de caches verbeterd: er zijn aparte instructie- en data-caches in de zeer snelle L1-caches, terwijl AMD van vrij grote L2-caches gebruik maakt die voor zowel data als instructies geschikt is. Dit 512KB L2-cache is langzamer dan de L1-caches, die 32KB voor de data en 64KB voor instructies groot zijn. Over de L3-caches is wat onduidelijkheid, die zou 8MB groot zijn en gedeeld worden tussen vier of acht cores. Vergeleken met de Bulldozer-architectuur zijn de L1-caches in snelheid verdubbeld en de data-cache is in grootte ook verdubbeld. Gecombineerd moeten de caches gezamenlijk vijf keer meer bandbreedte per core bieden. In tegenstelling tot de twee pseudo-cores van Bulldozer zonder hyperthreading moeten de Zen-cores wel echte hyperthreading, het werken aan twee programma-instructies tegelijk, ondersteunen. Een Zen Summit Ridge-processor met acht fysieke cores laat dus zestien logical cores zien.
Om het energieverbruik, van oudsher eveneens een heikel punt bij AMD, aan te pakken, is overgestapt op een 14nm
finfet-procedé. Die techniek kan al voor flinke besparingen zorgen vergeleken met de 32nm-processors van voorheen, maar AMD heeft daarnaast ook agressieve
clockgating toegepast om ongebruikte delen van de processor zo min mogelijk energie te laten verbruiken en tal van andere tweaks gedaan om het verbruik te beperken. Dat zou de Zen-cores een stuk zuiniger maken dan Excavator-cores, terwijl de
ipc met 40 procent verhoogd zouden zijn. Gecombineerd zouden de Zen-cores daarmee een grote stap vooruit op de prestaties per watt zetten.
Tijdens een demonstratie van een engineering sample van een Zen Summit Ridge-processor werd deze achtcore-processor op 3GHz geklokt. Als vergelijking toonde AMD een op eveneens 3GHz geklokte Broadwell-E-processor, de Core i7-6900, die normaal op 3,2GHz tikt. Beide cpu's beschikken over acht cores met hyperthreading of
smt, die op 3GHz tikken. In een Blender-benchmark, die zwaar op floating point-berekeningen leunt, toonde de Zen-processor zich iets sneller dan Intels processor. Eind dit jaar zouden de eerste Zen-processors, voor het high-end Summit Ridge-platform, moeten verschijnen, gevolgd door mainstream en mobiele processors. Pas dan kunnen we de daadwerkelijke prestaties van de nieuwe architectuur met eigen benchmarks op de proef stellen.