ARM claimt dat processors met de nieuwe A72-cores vergelijkbare prestaties als Intels Core M 5Y10 bieden. Het chipontwerpbedrijf deed deze claim bij de bekendmaking van de details over de architectuur van de Cortex A72-core voor smartphone-processors.
ARM publiceerde benchmarkresultaten waarbij een processor met vier Cortex A72-cores werd vergeleken met een Intel Core M 5Y10-dualcore met ondersteuning voor HyperThreading. Bij de singlethreaded testen GeekBench ST, SPECint en SPECfp moet de A72-core zijn meerdere erkennen in de Core M-core, aldus ARM, maar het verbruik zou met minder dan 1W aanzienlijk lager liggen dan de 4W van de Intel-chip. Bij de verwerking van vier threads bij GeekBench MT en SPECintRate zou de A72-quadcore beter presteren. Ook bij de Stream-benchmark, die is bedoeld om de invloed op de geheugenbandbreedte te meten, zou de A72 bij drie van de vier benches beter presteren. Tegenover Ars Technica laat ARM weten dat als de A72 en Core M zo ingesteld worden dat ze gelijk presteren, de Cortex-core driekwart efficiënter is.
Of de claims waar zijn, moet blijken als de eerste processors met A72-cores verschijnen. Dit zou in 2016 moeten gebeuren. Fabrikanten kiezen vaak de benchmarks waar hun product het best in naar voren komt en ook blijkt soms dat de kloksnelheden van chips op ontwikkelborden onrealistisch hoog gezet zijn.
De Cortex A72 werd in februari aangekondigd en donderdag bracht ARM nieuwe details naar buiten. De Cortex A72 wordt de opvolger van de Cortex A57-core van onder andere de Snapdragon 810. Qualcomm gaat de nieuwe cores onder voor enkele Snapdragon 600-modellen inzetten. Voor krachtiger Snapdragons komt de chipfabrikant met zijn eigen Kryo-cores. Bij chips die op 28nm geproduceerd, zou een A72-core 20 procent zuiniger zijn dan een A57-kern, maar ARM gaat er volgens AnandTech van uit dat de productie op 14nm à 16nm van Samsung respectievelijk TSMC plaats zal vinden, waardoor het verschil in de praktijk aanzienlijk groter zal zijn.
ARM bereikt dit door voort te bouwen op de architectuur van Cortex A57, maar op belangrijke onderdelen verbeteringen door te voeren. Zo is er gebruikgemaakt van een efficiënter algoritme voor branch prediction, dat minder leunt op speculatie en minder fouten maakt. Ook zijn er aanpassingen doorgevoerd bij de AArch64-implementatie voor 64bit-verwerking, door instructies bij de afhandeling samen te voegen, en zijn er verbeterde simd- en fp-registers. Bij het verzenden van de instructies naar de execution units kan de A72-core opdrachten in kleinere onderdelen opbreken, wat de effectieve bandbreedte ten goede komt. De uitvoerende eenheden zijn verder zo aangepast dat de latency is teruggebracht en de bandbreedte is toegenomen bij verschillende instructies. Ook is de fp-pijplijn verkort en tenslotte is de bandbreedte naar de LS- en L2-cache toegenomen, onder andere door een geavanceerde gecombineerde prefetcher.
ARM claimt zo elk onderdeel van de A57-architectuur geoptimaliseerd te hebben en verbeteringen te kunnen bieden op gebied van zowel oppervlak en prestaties als verbruik.