In een uitgebreid artikel heeft AnandTech de Intel Core-architectuur (Conroe) vergeleken met de AMD K8-architectuur (Athlon 64 en Opteron). De Core-architectuur kan beschouwd worden als Intels achtste generatie architectuur die voor een groot gedeelte gebaseerd is op de Pentium M-architectuur. Dat wil echter niet zeggen dat het een regelrechte kopie is, want 80% van het Pentium M-ontwerp is door Intel veranderd voor de Core-architectuur. Net als de Pentium M-architectuur combineert de Core-architectuur het beste van twee andere Intel-architecturen: de prefetchers en de bus zijn gebaseerd op de Netburst-architectuur, terwijl de rest van de processor een evolutie is van de Pentium Pro-architectuur.

Prefetcher en cachegeheugen
De prefetcher is verantwoordelijk voor het ophalen van instructies en gegevens uit het geheugen. Het is zijn taak om te zorgen dat de pipeline van de cpu gevuld blijft met instructies en dat deze instructies de gegevens ter beschikking hebben om mee te werken. De Core-architectuur heeft per core een prefetcher voor instructies en twee voor gegevens. Daarnaast beschikt de dualcore-implementatie van de Core ook nog eens over twee extra prefetchers voor het L2-cachegeheugen. De K8 heeft echter maar een prefetcher per core. Naast meer prefetchers heeft de Core ook meer L2-cachegeheugen ter beschikking. Opmerkelijk is dat de 4MB grote L2-cache in ongelijke stukken over beide cores kan worden verdeeld. Dit zou een groot voordeel kunnen zijn voor singlethreaded applicaties. De L1-cache is daarentegen twee keer zo klein als dat van de K8. Dit wordt echter goedgemaakt door het feit dat het 8-way associative is (Core) in plaats van 2-way voor de K8. De hitrate zou dan ook ongeveer hetzelfde moeten zijn.
Decoder
Na het prefetchen van instructies en data is het de taak aan de decoder om de instructies in kortere instructies (micro operations) op te delen. Dit zijn de instructies die uiteindelijk door de processor uitgevoerd zullen worden. De Core heeft hiervoor de beschikking over drie decoders voor simpele instructies en een decoder voor complexe instructies. De K8-architectuur heeft drie decoders die allen met complexe instructies overweg kunnen. Gezien het merendeel van applicaties uit simpele instructies bestaat, heeft de Core hier een voordeel.
Out of order execution
Zowel de Core als de K8 kan instructies in een andere volgorde uitvoeren. Om de resultaten hiervan bij te houden heeft de Core-architectuur de beschikking over een tabel met 96 velden, 16 meer dan de Pentium M en zelfs 56 meer dan de Netburst-architectuur. De K8-architectuur gebruikt een tabel met 72 velden. Hier staat echter tegenover dat de Core slechts maximaal 32 instructies kan herordenen en de K8 maar liefst 60. Toch lijkt het erop dat de Core in het voordeel is. Zo kan de Core maar liefst drie 128-bits SSE1/2/3-instructies tegelijkertijd uitvoeren, terwijl de K8 over slechts twee 64-bits SSE execution units beschikt. De Core zal volgens AnandTech bij het gebruik van SSE-instructies dan ook minimaal twee keer zo snel zijn als de K8. Voor het verwerken van drijvendekommagetallen is de Core op papier ook sneller, omdat die hiervoor vier eenheden ter beschikking heeft ten opzichte van drie eenheden voor de K8. Behalve dit alles kan de Core ook de volgorde van het uitvoeren van load- en store-instructies veranderen. De K8 kan dit echter niet.
Conclusie
Op papier heeft de Core een betere architectuur dan de K8. De eerste benchmarks hebben dit ondertussen ook bevestigd. Toch betekent dit niet dat de K8 een achterhaalde architectuur is. Op een aantal punten zou deze namelijk nog flink verbeterd kunnen worden. Meest voor de hand liggend is het verhogen van het aantal SSE-units en het verhogen van de bandbreedte van het L2-cachegeheugen. Daarnaast zou de out-of-order logica van de K8 verbeterd kunnen worden zodat loads en stores ook in een andere volgorde uitgevoerd kunnen worden.