A720
Voor de midcores, ofwel de A720, heeft Arm zich voornamelijk op de efficiency gericht, met als doel dus het energiegebruik te reduceren. Dat wil niet zeggen dat de prestaties niet verbeterd zijn, maar omdat de midcores de werkpaarden van een mobiele soc zijn, is het belangrijk ze zuinig te krijgen.
De verbeteringen van de A720 zitten in de frontend, waar de penalty voor brachmispredictions voortaan elf cycles kosten, in plaats van twaalf bij de A715. Ook dit zou bij benchmarks weer niet zo'n verschil maken, maar wel in de praktijik, zo benadrukt Arm.
In de ooo-core heeft het A720-team de pipelined fdiv/fsqrt-unit overgenomen, wat bepaalde floatingpointberekeningen aanzienlijk moet versnellen zonder een grotere core nodig te hebben. Ook de issuequeues, zeg maar de wachtrij met instructies voor de core, en de executionunits waar die instructies verwerkt worden, zijn verbeterd zonder een toename van die-oppervlak.
Ten slotte is de latency voor toegang naar de L2-cache verlaagd van tien naar negen kloktikken en is het prefetchen van data uit die L2-cache verbeterd, weer met dank aan het Cortex-X-team. Dat alles zorgt ervoor dat de A720-core op vrijwel alle fronten een stukje beter presteert én zuiniger is dan de A715-core. De performancewinst en energiebesparingen zijn afzonderlijk met een procent of 4 of 5 niet zo imposant als bij de X-cores, maar toch zorgen alle verbeteringen samen voor een efficiëntieverbetering van 20 procent.
A520
De kleinste cores zijn de A520-cores. Anders dan de X-cores en A720-cores zitten die twee aan twee in een cluster. De twee cores delen sommige componenten, waaronder de L2-cache. Ze zijn vooral bedoeld voor achtergrondtaken, als je telefoon in je zak zit bijvoorbeeld, zoals periodiek berichten checken. Een zuinige A5xx-core is dus belangrijk voor een lange accuduur van je telefoon. Ook voor andere apparaten, bijvoorbeeld smartwatches, zijn deze cores van groot belang.
Arm heeft de A520 dan ook vooral zo zuinig en klein mogelijk geprobeerd te maken. De prestatiewinst van de A520 moet daarom komen van handelingen die niet veel energie kosten, zoals het prefetchen van data en de branchpredictionunit. Verbeteringen daarin, en in bijvoorbeeld de issue-engine van de executioncore, moeten andere energiebesparende maatregelen compenseren. Zo verwijderde Arm een van de drie alu-pipelines van de A510, zodat de A520 er nog twee heeft. Toch presteert de A520 nog altijd 8 procent beter dan de A510, terwijl het complex toch zo'n 3 procent zuiniger is. Dat levert bij gelijke prestaties een vermogenswinst van 22 procent op.