Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 121 reacties
Submitter: ultra500

De Turkse website Donanimhaber heeft een engineering sample van een AMD Bulldozer-octacore weten te benchmarken. De sample had een kloksnelheid van 3,2GHz en werd samen met 4GB ddr3-geheugen en een GTX580-videokaart getest.

Amd logo 2Donanimhaber prikte de onderdelen op een Gigabyte 990FX-UD5-moederbord en onderwierp ze vervolgens aan enkele benchmarks. De achtkoppige engineering sample had een kloksnelheid van 3,2GHz.

In 3DMark 11 wist de Bulldozer-cpu in combinatie met de GTX580 een score van 6265 punten neer te zetten, vergelijkbaar met een Core i7 2600 van Intel, die een kloksnelheid van 3,4GHz heeft.

Bij PCMark 7 werd een totaalscore van 3045 punten genoteerd, met 4310 punten in het cpu-intensieve Computation-subonderdeel. Daarmee was de sample in die specifieke subtest iets sneller dan een Intel 2500K op 3,3GHz.

De cpu wist de SuperPi-benchmark, waarin het getal pi zo snel mogelijk tot een miljoen cijfers achter de komma berekend wordt, in 19,5 seconden te doorlopen. Recente Intel-cpu's hebben daarvoor, op een vergelijkbare kloksnelheid, ongeveer de helft van de tijd nodig.

Cpu-z geeft aan dat de processor een tdp van 186W heeft, maar vermoedelijk klopt die waarde niet. Volgens AMD krijgen de nieuwe chips een maximaal tdp van 125W.

Omdat het om een engineering sample gaat, kunnen nog weinig conclusies getrokken worden uit de scores. In het derde kwartaal van dit jaar, als AMD zijn nieuwe, op de Bulldozer-architectuur gebaseerde cpu-lijn introduceert, wordt pas echt duidelijk hoe de nieuwe chips afsteken tegen het aanbod van Intel.

AMD Bulldozer engineering sample benchmark AMD Bulldozer engineering sample benchmark AMD Bulldozer engineering sample benchmark AMD Bulldozer engineering sample benchmark AMD Bulldozer engineering sample benchmark
Moderatie-faq Wijzig weergave

Reacties (121)

Ik moet zeggen dat ik de resultaten opmerkelijk vind. Het is duidelijk dat "grote" taken redelijk efficiënt lopen, qua performance zitten ze redelijk in de buurt van de hyperthreading Intel's, op een lagere clock nog wel! Zo goed schalen die tests nou ook niet weer precies met meer CPU's, maar toch, lagere clock, sneller, maar meer echte cores... tsja... oké... "redelijk". zeg maar.

Een ding vind ik echter wel heel vreemd, en dat is hoe ze de cache in elkaar hebben gezet. En dat zie je terug bij de Pi-bench: veel mathematische bibliotheken (en in het geval van Pi heb je het dus over bignum arithmetics en dat zijn dan meestal de dingen als GMP en MPIR) zijn daar juist erg gevoelig voor, omdat ze een getal niet als één binaire representatie (een decimaal), maar als juist meerdere: "limbs" in plaats van "digits" als binaire representatie. Om dan 8 cores te delen met zulk.. gammel L1 cache en een feitelijk gedeelde L2 cache (zei het dat het heel veel is, maar ik weet niet hoe het zich qua snelheid houd)... tsja... ik heb m'n bedenkingen wat dergelijke "small" math betreft.

Om te vergelijken: een hedendaagse Sandy Bridge (en er is geen reden om te denken dat de opvolger van dezelfde architectuur dat anders heeft) heeft (X = aantal cores):

X* 32 Kilobyte L1-Data (8way)
X* 32 Kilobyte L1-Instructie (8way)
X* 256 Kilobyte L2 (8way)

Willekeurige hoeveelheid L3 (Core i7 2600: 8MB, 16-way), Laptop Dualcore CPU's zoals de Core i5 2410 zitten aan de 3Mbyte, 12-way)

Ter vergeljiking: De bulldozer zit aan:

X* 16KByte L1-Data (4-way)
(X/2)* 64Kbyte L1-Instructie (2-way)
(X/2)* 2048KByte L2 (16-way)
8192KByte 64-way L3

De vuistregel is dat elke verdubbeling van "way", in de praktijk ongeveer evenveel effect heeft als het verdubbelen van de cache in hoeveelheid. Laten we eens gaan kijken wat we dan hebben:

Sandy Bridge:

32*8 = " 256 "virtu-K" per CPU core L1 Data én instructie
256*8 = 2048 "virtu-K" L2 per CPU core

Bulldozer:

16*4=64 "virtu-K" per core L1 Data
64*2way / 2cores per unit = 64 "virtu-K" per core L1 Instructie
2048*16way/2cores per unit = 16384 "virtu-K" per core L2

Qua L1 (wat voor echte math veel gebruikt wordt) wordt de bulldozer in de pan gehakt, dit kan Pi misschien verklaren, maar de overige caches... ik vind ze nodeloos complex omdat er zoveel gedeeld wordt door cores, maar het is "effectief" wel meer cache. Er dient alleen héél specifiek voor geprogrammeerd te worden. En geheugen programmeren is sinds NUMA toch al niet zo straightforward meer ;)
bij 'echte math' wordt lijkt me HT zo veel mogelijk benut.

is het dan niet redelijk om de l1 en l2 caches van intel en AMD per thread te bekijken ipv per core? dan wordt het verschil ineens 2x ipv 4x.

[Reactie gewijzigd door Countess op 11 juli 2011 16:37]

32KB 64KB cach doet er uiteraard toe.
Maar de busbreedte vergeet je.
Ik weet dat iNtel al heel lang aan de 256bit breede cache bus zit.
En AMD? Nog steeds niet?
Dat zou ik wel eens willen weten.
Ik heb de afgelopen maanden ook met deze processoren kunnen spelen, maar dan met de serverversie (die heeft 16 i.p.v. 8 kernen). Het is hard werken voor de benchmarker: Je kunt er spectaculaire snelheidswinsten mee boeken, maar het gebruik van AVX- en liefst nog FMA-instructies is cruciaal en dat kan nog niet met ieder programma, en ook niet met iedere compiler. Het is momenteel ouderwets handwerk; lekker met assemblerinstructies prutsen.

Betekent wel dat deze processor waarschijnlijk sneller wordt gedurende zijn leven. Zeker als Sandy Bridge verschijnt zal AVX snel gemeengoed worden en de processor zijn volle vermogens kunnen benutten.

Van belang is ook de stepping: De B0 deed het erg slecht, maar de B1 presteert best wel lekker.

[Reactie gewijzigd door dmantione op 11 juli 2011 15:25]

Ik begrijp dat je niks over de prestaties van je ES mag loslaten, maar mag ik vragen of jij denkt dat het voor AMD een goede keuze is om voor veel cores te kiezen?
In mijn markt wel (supercomputers), omdat het heel normaal is dat je een programma op bijvoorbeeld 1024 kernen draait. Die 16 kernen van de Interlagos (64 in een systeem bij 4 sockets) komen dan als geroepen. Communicatie mete en processor over het netwerk is altijd een stuk trager dan communicatie met een processor binnen een machine, dus veel kernen in een machine is voordelig.

Wat ik wel zie aankomen is een "paralleliseringscrisis": Het aantal kernen neemt sneller toe dan programmeurs ze kunnen gebruiken. Dat is op alle lagen in de informatica zichtbaar: Van mobieltjes tot supercomputers. Ja, zelfs in de supercomputers, want met de bschikbaarheid van dit soort processoren krijg je dat mensen op meer kernen willen kunnen draaien, nu bijvoorbeeld 1024, straks bijvoorbeeld 16384 kernen en het betreffende programma moet wel flexibel schalen naar zoveel rekenkracht.

Deze trend betekent dat veel capaciteit die beschikbaar komt ongebruikt zal blijven.
De meeste commerciele software wordt volgens mij nog steeds met maximaal SSE2 gecompileerd, omdat men de software aan zoveel mogelijk mensen wil verkopen. Ben wel benieuwd naar wat echte benchmarks (office productivity, games).

AVX/FMA zet natuurlijk wel wat sneller door in de video-codecs en dergelijke...
Omdat het om een engineering sample gaat, kunnen nog weinig conclusies getrokken worden uit de scores. In het derde kwartaal van dit jaar, als AMD zijn nieuwe, op de Bulldozer-architectuur gebaseerde cpu-lijn introduceert, wordt pas echt duidelijk hoe de nieuwe chips afsteken tegen het aanbod van Intel.

Dus eigenlijk zeggen ze: De chip is gebenchmarkt, dit zijn de resultaten vergeleken met de concurrent, en we zeggen niet dat het tegenvalt maar een intel met 4 cores is net zo snel als een octocore.... Maar eigenlijk kun je nog niks met deze resultaten, dus negeer het bovenstaande! Beetje raar artikel..

[Reactie gewijzigd door josttie op 11 juli 2011 15:19]

Engineering sample's zijn bedoeld om moederborden te testen, niet om score's mee te halen.

Er is een andere ES die 15sec op sPi doet, dat is dus ~20% verschil tussen twee dezelfde CPU's van dezelfde batch met dezelfde stepping. (B1)

De opteron ES uit het K8 tijdperk presteerde bedroevend, later bleken het monsters.
Dus deze score's hoeven niets te zeggen.

Als je goed naar de branches kijkt zie je dat het L2 cash serieus kreupel is, aardig om te vermelden is dat de turbo core naar 4,2Ghz prima werkt :)
"en we zeggen niet dat het tegenvalt maar een intel met 4 cores is net zo snel als een octocore"

laat AMD's octo core nu maar iets groter zijn als intel's quadcore (ex L3 cache) en dus voor een heel vergelijkbare prijs op de markt gezet kunnen worden.

en bijvoorbeeld de pass 1 van x264 ecodering doet AMD het meer als 33% beter als welke intel cpu ook.
niet slecht voor het model met waarschijnlijk een van de laagste kloks uit de serie uiteindelijk.

[Reactie gewijzigd door Countess op 11 juli 2011 15:54]

en bijvoorbeeld de pass 1 van x264 ecodering doet AMD het meer als 33% beter als welke intel cpu ook.
Maar kijk dan eens naar Intel's Quick Sync resultaten...
De opteron ES uit het K8 tijdperk presteerde bedroevend, later bleken het monsters.
Dus deze score's hoeven niets te zeggen.
De ervaring met veruit de meeste late-batch engineering samples (en daar lijken we het nu echt over te hebben, we zitten nog maar vlak voor massaproductie [B2]) is dat ze beter presteren (vaak weliswaar met een overclock, maar die overclock kan dan erg hoog) dan retail. Het is onwaarschijnlijk dat er nog meer dan zeg 10% performance bij komt in retail, laat staan de 50% die nodig is om AMD hier echt het IPC- en performance/watt-voordeel te geven boven Intel. Of het performance per siliciumoppervlak-voordeel. We hopen natuurlijk allemaal dat dit niet waar blijkt te zijn, maar het bericht stemt pessimistisch.

En dat betekent dat AMD weer op prijs moet gaan concurreren, wat hun profitability niet ten goede komt.
50% nodig? waarom?

IPC performance kroon is AMD helemaal niet naar op zoek, in tegendeel. ze gaan voor meer clocks. (maar niet zo extreem als de p4 dat deed) de IPC's zijn nogsteeds hoger als de phenom2's.

het performance/watt voordeel is helemaal niks over te zeggen aangezien er niks staat over het verbruik.
en de performance per silicium oppervlak heb je het ook mis, de octo core is exclusief L3 niet veel groter als een sandy bridge quadcore zonder L3 en kan er dus prima mee concurreren op prijs.

daarbij heb ik nog erg veel twijfels of het wel een zogeheten late batch is. er zijn nog maar nauwelijks benches van b1 steppings gezien, laat staan b2's.practische alles was b0 tot nu toe.

[Reactie gewijzigd door Countess op 12 juli 2011 16:54]

Quick Sync? Welke kwaliteits waarderende encoder gebruikt dat?
En waar ik bang voor ben is dat de retail processors niet veel anders zullen presteren dan deze engineering sample. Waardoor amd alsnog voor peformance harder zijn best zou moeten doen om interresant te blijven voor de consument.
AMD's vector processor lijkt een beetje in elkaar gehackt om 256bit AVX te accepteren via 2x128Bit vector processor, dit levert dus duidelijk een prestatie verlies op in gevallen zoals Pi.

ik denk niet dat AMD dit probleem kan fixen binnen 3 maanden.
Het probleem van Pi is dat deze een verouderd (x87) instructie set gebruikt. Deze instructies worden geemuleert in de AMD cpu's.
Verder heb je natuurlijk nog de cache van AMD die totaal niet op de uiteindelijke snelheid loopt.

En het is een ES daar kun je geen conclusies aan verbinden, Intels Ivy Bridge ES is ~10% trager dan een SB op gelijke snelheid. No way dat de release verzie van IB trager is dan SB ;)
super pi gebruikt geen AVX. het gebruikt niet eens SSE1.

en nee bulldozers floating point unit is alles behalve in elkaar gehackt.
het is een heel mooi staaltje efficienty engineering die de 128bit FP performance kan bieden
van 2 intel (AVX enabled) cores in de helft van de ruimte.
AMD is dus per module even snel af als intel met 2 cores. (en 1 module is maar iets groter als 1 enkele intel core)
enkel als AVX wordt gebruikt door beide cores in een module tegelijkertijd dan halveert de performance. de kans dat dat in de nabije toekomst vaak gaat gebeuren is vrij klein.

[Reactie gewijzigd door Countess op 11 juli 2011 17:16]

intel heeft 256bit avx per core dat is veel efficiënter dan 2x128bit, want de chip moet alle avx instructies in tweeën splitsen.

en SSE loopt trouwens altijd door AVX op moderne cpu's trouwens, en zal ook sneller zijn als het geen AVX ondersteunt :+

[Reactie gewijzigd door stewie op 11 juli 2011 17:58]

het hoeft helemaal niet opgesplitst te worden want de FP unit heeft zijn eigen scheduler en ruimte voor 2x128bit. dat kan er dus in 1 keer doorheen. de theoretische AVX doorvoor is dus precies gelijk.

en dat laatste betwijfel ik ten zeerste.
je gaat me niet vertellen dat al bestaande software, zonder iets te veranderen, ineens snapt dat het 256bit tot zijn beschikking heeft en de nieuwe register kan gebruiken of ineens 3 operand instructies snapt waar hiervoor enkel 2 operand instructies gebruikt konden worden. ect.

[Reactie gewijzigd door Countess op 11 juli 2011 18:36]

De Buldozer moet inderdaad alle AVX-instructies in tweeën splitsen, waardoor hij dubbel zo lang bezig kan zijn met een AVX-instructie dan een Intel-processor. Echter, kan de Buldozerkern de FPU van zijn buurman lenen als die ongebruikt is, en zo de AVX-instructie toch in één klokpuls afhandelen.

Bovendien beschikt de Buldozer over FMA-instructies, waardoor hij kan vermenigvuldigen en optellen in één instructie. Bij veel toepassingen zoals matrixvermenigvuldigingen die in 3D-computerspelletjes veel voorkomen, volgen vermenigvuldigingen en optellingen elkaar afwisselend op. Bij FMA kan de Buldozer dus theoretisch tweemaal zoveel FPU-berekeningen per seconde doen, hoewel dat lang niet bij ieder programma zal gelden, waardoor hij toch op hetzelfde niveau kan komen als de Sandy Bridge.

Je kunt verwachten dat de Sandy Bridge toch iets sneller is met zijn 256-bit unit. En omdat SB geen FMA ondersteunt, zullen programmeurs terughoudend zijn FMA in te zetten. Daar staat tegenover dat de Buldozer door deze aanpak een veel minder complexe chip is, dat kan allerlei voordelen tot gevolg hebben: Lagere fabricagekosten, hogere kloksnelheden of een lager verbruik. Of meer kernen, want AMD zal de enige zijn die processoren tot 16 kernen kan leveren, zodat degene die brute rekenkracht nodig heeft toch bediend kan worden.

De taktiek van de minder complexe chips heeft voor de Radeons goed uitgepakt. Nvidia kon ten tijde van de Radeon 5870 ATi verslaan, maar met een aanzienlijk duurdere GPU en aanzienlijk meer hitteproduktie en herrie in je PC-kast. AMD lijkt met de Buldozer op hetzelfde te gokken.
AMD heeft bewust minder die-space besteed aan het FPU/SSE deel omdat uit analyses bleek dat maximaal 40% van de instructies hieruit bestaan. Dus als de twee cores in de module ieder 40% floating point verwerken dan wordt deze nog maar maximaal 80% benut. Het is dus slimmer om transistoren elders te besteden (cache bijvoorbeeld).

Vandaar dat in syntetische tests Intel sneller zal zijn in de floating point, en bij specifieke codecs. Ik ben echt benieuwd naar de praktijkperformance van Bulldozer tov de i2600 want ik wil dit jaar nog iets nieuws aanschaffen.

Moet wel zeggen dat de i2600 erg goed is qua price/performance, daar zal AMD een zware dobber aan hebben.
AVX word al door alle software gebruikt in tegenstelling tot SSE etc bied AVX wel echte prestatie winst voor moderne games/physics/photoshop etc.

dit is wel interessant.
http://software.intel.com...tor-extensions-intel-avx/

[Reactie gewijzigd door stewie op 11 juli 2011 18:05]

bron? want ik geloof er niks van dat je AVX kan gebruiken zonder op zijn minst te hercompileren.
legacy SSE word geemuleert door AVX...
en 128bit SSE is sneller en 256bit is trager via AVX, maar superpi gebruikt 128bit.

en het bewijs? Superpi is 50% sneller op intel.

[Reactie gewijzigd door stewie op 11 juli 2011 19:58]

superpi gebruikt niet eens SSE, laat staan AVX.
je bewijst niks. ik wil een bron vermelding.

edit:
superpi 32m 990x = 11:19m
superpi 32m 2600k 9:05m

kloks gelijk, enkel de 2600k heeft AVX.
conclusie: AVX heeft geen 50% hogere scores tot gevolg.(zelfs al was het verschil veroorzaakt door AVX, en dat is het niet)

of is de 2600k eigenlijk langzamer en doet enkel AVX het lijken alsof hij sneller is? is dat wat je wilt zeggen? want dan lach ik je helemaal vierkant uit.

edit2: legacy SSE word niet geëmuleerd. x87 word geëmuleerd.
AVX en SSE delen bepaalde hardware dat klopt, maar zijn nog steeds native.

[Reactie gewijzigd door Countess op 12 juli 2011 01:40]

my god een max tdp van 186W!!! Dat is niet gezond meer voor een stock setting :o
my god een max tdp van 186W!!! Dat is niet gezond meer voor een stock setting :o
Vergeet niet dat dat de absolute max is. Intel geeft als TDP 'average' aan. Volgens mij doen de CPU's van Intel minstens net zo veel. (ze ontlopen elkaar niet veel op dat front).
Is niet waar, dat Intel een "average" gebruikt.

Spraak verwarring komt van het feit dat intel een average "max" gebruikt op basis van metingen en AMD een theoretische max. Beide geven gewoon een max TDP aan op basis waarvan je cooling-solution opgezet wordt.

Verder heeft AMD nog een ACP waarde, welke weer wel meer naar een gemiddelde gebruikswaarde gaat.

Lees o.a.:
http://www.theinquirer.net/inquirer/opinion/1050824/amd-talks-acp-vs-tdp
Op de wikipedia staat de TDP nog op 125 Watt. Maar wie zegt dat wikipedia uptodate is.

Wat ik me afvraag is waarom ze het systeem met een miezerige 2GB hebben uitgerust.
Voor benchmarking is niet veel meer nodig dan 2GB Voor de meeste benchmarks is minder geheugen zelfs beter voor CPU performance.
idd nog interesanter is het een enkele stick of was het 2x 1gb als het een enkele stick was ben ik impressed by de geheugenprestaties anders niet echt.
Plaatjes zeggen meer dan ... een paar woorden:
http://ic.tweakimg.net/ext/i/imagelarge/1310386953.jpeg

Het is 4GB (2x2GB). Ben bezig feedback te plaatsen.

Plaatje zegt bij Chipset 2GB, bij DIMMs 2x2.

[Reactie gewijzigd door Allubz op 11 juli 2011 16:13]

Volgens mij staat daar 2x2GHz (4GHz), en total memory 2GB DIMM DDR3...
I stand corrected.

[Reactie gewijzigd door hoipimniet op 11 juli 2011 16:15]

2GB DIMM. 2x. =4GB. Total computer memory geeft wel 2GB aan. Verwarrend.

Je citeert de FSB speed.

[Reactie gewijzigd door Allubz op 11 juli 2011 16:15]

daarom is het ook een engineering sample. retail zal gewoon 125, misschien 140watt zijn.

edit: het is 125 watt voor het top model en 95watt voor alle modellen daaronder volgens de meest recente informatie.

[Reactie gewijzigd door Countess op 11 juli 2011 17:30]

En dan nog, als het om een acht-core processor gaat vind ik het niet vreemd dat hij meer kan verbruiken.

De TDP is (de naam zegt het al) Thermal Design Power, dus meer een richtlijn waarop je je koeling zou moeten afstemmen. Het betekend niet dat deze processor ook contstant (of zelfs ooit) 186W uit het stopcontact trekt..
Nee, maar het betekent wel dat je koeliing er op voorbereid moet zijn dat de CPU zoveel vermogen om kan zetten in hitte. Zelfs als hij gemiddeld maar 10 watt zou verbruiken dan moet er dus toch een beest van een koeler op voor die keren dat hij wel heel veel verbruikt.
Als het uiteindelijke model echt zoveel zou verbruiken (wat ik niet verwacht) voorzie ik redelijk wat throttlende systemen omdat ze niet meer goed genoeg koelen...
die 186W is nog een CPU-Z bug dat is bekend.
Veel mensen voor mij hebben al genoteerd dat het waarschijnlijk komt vanwege het een ES versie is, en omdat de kans groot is dat CPU-Z de cpu niet correct uitleest of de juiste info bezit. Duidelijk :)

Wat mij verder nog opvalt is het voltage. 1.4v+ is erg stevig voor een octocore en zal een flink effect hebben op het wattage. Ik hoop dat dit naar beneden gaat richting de 1.3/1.25v anders zitten we snel boven de 130watt.
(wat eigenlijk nog meevalt, mijn i7 920 haalt 130watt ook en heeft de helft van de CPU cores!)
Da's nou jammer. Nu blijft het dus dat je moet rekenen in de zin van 2 AMD cores = ~1 Intel core. Het enige voordeel dat AMD dus heeft is de IGP [er zit geen IGP in, zie hieronder], maar dat is bij de high-end chips niet zo interessant omdat dat spul toch wel met een discrete videokaart wordt gecombineerd.

Anyways, nog een belangrijke omissie in de resultaten: cinebench multithreaded of een andere renderingbenchmark. Daarin doen de 'echte' extra cores van AMD het doorgaans beter dan Intel.

edit: spoke too soon, Donanimhaber had wel Cinebench getest, met een score van 24434 in Cinebench R10. Dat is nipt meer dan een 2600K op stock, die haalt ongeveer 23000 punten.

[Reactie gewijzigd door mux op 11 juli 2011 15:26]

Nu blijft het dus dat je moet rekenen in de zin van 2 AMD cores = ~1 Intel core.
Zolang AVX extensies niet worden gebruikt is zo'n amd core 100% gelijk aan een intel core. Bulldozer heeft geen igp. Trinity is een bulldozer met igp. Superpi is geoptimaliseerd voor intel.
Conclusie: sandybridge en bulldozer hebben een gelijke ipc, sandybridge heeft hyperthreading en snelle transcoding waar bulldozer meer cores bied.
Zolang AVX extensies niet worden gebruikt is zo'n amd core 100% gelijk aan een intel core.
En is dit een redelijke aanname in benchmarks cq. real-world loads?
sandybridge en bulldozer hebben een gelijke ipc
Daar lijkt het dus helemaal niet op. Dan zou Bulldozer het toch duidelijk twee keer zo goed moeten doen als Intel - dan hebben we het dus over IPC per core, zoals het gewoonlijk wordt geïnterpreteerd.

[Reactie gewijzigd door mux op 11 juli 2011 16:23]

Niet in deze benchmarks. De CPU presteert redelijk gelijkwaardig aan de quad core i7 chips. Dus twee bulldozer cores zijn gelijk aan 1 Intel core met Hyperthreading. Daar is weinig mis mee (zeker aangezien Ivy Bridge uitgesteld lijkt naar Maart) maar de geruchten gaan dat Bulldozer te veel gebruikt. Mocht dat meevallen lijkt AMD eindelijk weer eens competitief aan de bovenkant van de markt.
De bulldozer heeft toch nog geen IGP?
Afbeelding nummer 4 geeft wel iets aan van een IGP de RD890 weet alleen niet welke kaart deze precies is
Dat is de chipset, niet de IGP. Bulldozer heeft geen IGP.
Je hebt gelijk ik poste te snel, leek verdacht veel op de R800 series vandaar mijn veel te snelle post.
Llano is a 32 nm CPU based on slightly improved K10.5 (Deneb) architecture with some Radeon cores.

Zambezi is a 32nm CPU based on Bulldozer architecture without any GPU.

Bulldozer-based APU will come next year.
Dit is een Zambezi.
Hm, dat was dus de verwarring. Dit is dus blijkbaar géén APU, enkel een CPU.
Er staat ook nergens dat het een APU is.

Voor de toekomst is multi-core wel interessant. Voor nu is het 'een beetje jammer', als dit bij benadering de prestaties zijn.

Gezien het overclockpotentieel van SB lijkt het me sterk dat Bull dit kan toppen. Misschien als er vier cores kunnen worden uitgeschakeld om zo de hitte tegen te gaan dat een 8-koppige overclock bewerkstelligt.

Voor gaming zal het weinig uitmaken, een SB of Zambezi. Het is wel mooi om een degelijke GPU in een APU package te krijgen. Maar of het nu een bijzonder meerwaarde heeft t.o.v. een IGP op het moederbord, I don't know.

Price-performance verhouding verwacht ik in het voordeel van AMD. Dit is een bewezen strategie, zolang het rendabel is.

[Reactie gewijzigd door Allubz op 11 juli 2011 15:38]

Ziet der goed uit! Ben alleen bang dat tegen de tijd dat AMD er mee in de verkoop gaat, het weer voorbij gestreeft is door intel....

Go AMD
Het is nog steeds voorbij gestreeft. Kijk die Super PI berekening dan! ook al is het een engineering sample, ik geloof nooit dat men dat soort berekeningen nog geoptimaliseerd kunnen worden waardoor die tijden gehalveerd worden.
Daarbij rekening houdend met de enorme hoeveelheid energie die zo een CPU verbruikt, is het ook op jaarbasis niet echt goed voor de portomonnee (ook al zou die CPU 50 euro gaan kosten).
AMD cpu's doen het nooit goed als het om superPI gaat, kijk maar naar wat results van AMD cpu's. Daarom kun je Super PI ook niet gebruiken om AMD cpu's met Intel cpu's te vergelijken.
Je gaat je toch afvragen hoe SuperPI geprogrammeerd is, dat het zo een grote voorkeur heeft voor Intel.

Found it.

Super PI is a computer program that calculates pi to a specified number of digits after the decimal point - up to a maximum of 32 million. It uses FFT arithmetic and Borwein's quartically-convergent algorithm and is a Windows port of the program used by Yasumasa Kanada in 1995 to compute Pi to 2^32 digits. Super PI uses x87 floating-point unit, so it favors processors with good FPU performance, such as AMD Athlon 64 and Intel Core 2.
Super PI uses x87 floating-point unit
Oef en x87 is al sinds P4 vervangen door SSE2
Maar het zit zoals er in de geselecteerde tekst staat nog
Steeds in een Core 2 duo en AMD athlon. Ofwel: ze zijn blog niet vervangen
enkel om de backwards compatibility niet te verbreken. er is geen enkel modern programma dat x87 nog gebruikt. in software is x87 wel al lang vervangen door SSE1 en hoger.

sterker nog, in x64 modes worden x87, MMX en 3DNow helemaal niet meer ondersteund en vanaf de p4 is er al geen dedicated x87 hardware meer maar word dat geëmuleerd met een vertaling naar sse2 met alle performance gevolgen van dien.

[Reactie gewijzigd door Countess op 11 juli 2011 17:29]

Het is nog niet voorbij gestreeft. Als je op een onderdeel de 2600k verslaat, een ander de 2500k en een 3e onderdeel 2x zo traag bent duidt het er sterk op dat er leuke dingen gaan komen.

Daarbij is het een 3.2ghz versie, wat het goed mogelijk maakt dat dit niet het high end (a la 2600k) model is.

Gaat dan dus weer sterk terug naar jaar of 10 geleden:
- Gamen? Pak een AMD
- Foto/Video etc? Pak een Intel


Bovendien zegt verbruik niks. Engineering samples zijn wat dat betreft altijd slecht af.

[Reactie gewijzigd door Xanaroth op 11 juli 2011 15:31]

De 2600K is ook niet de snelste intel CPU, denk hierbij aan de i7980X /i7990X

Aan het jaar/begin volgensjaar komt LGA2011 versies van intel, want de 1155 is de " midrange" van Sandybridge. LGA2011 is de "high end" versie.
Zoals 1156 en 1336 ook naast elkaar gelopen hebben

Maar ben benieuw na de daadwerkelijke benchmarks van de afgewerkte versie.
Ik wil wel eens een AMD systeem.
Die "snelste" cpu's van Intel zijn dan weer lastig vergelijkbaar omdat de prijs zo extreem veel hoger is.
Maar de prijzen van deze AMD chips zijn nog volkomen onbekend. En AMD heeft er nooit een probleem mee gehad hoge prijzen te vragen voor topproducten. Het AMD is goedkoper mantra komt puur doordat AMD wel op prijs moet concurreren. Als AMD chips heeft die met de duurste LGA2011 chips kunnen concurreren zullen die chips vergelijkbaar geprijsd zijn. Misschien ietsje lager, maar niet veel.

Ook het verbruik van Bulldozer is nog onbekend Je kan dus enkel kijken naar performance en de huidige Intels presteren gelijkwaardig. Toekomstige versies (LGA2011 en Ivy Bridge) lijken dus sneller te gaan worden. Vast duurder, maar ook sneller.

Daarnaast zit Intel op een aardig snel schema voor het vernieuwen van CPUs en is het te hopen dat AMD de Bulldozer architectuur inderdaad de komende jaren competitief kan houden. Ik gun AMD een competitief product, maar het lijkt alsof Intel de zaken op dit moment goed voor elkaar heeft. En dat maakt het lastig om op basis van deze benchmarks te gaan juichen over Bulldozer.

Net zoals de APUs trouwens, ook bij die chips is het moeilijk de juiste markt te vinden (buiten HTPCs) Vooral het feit dat met een losse middelmatige GPU's de APUs het moeten afleggen tegen de i3 maakt dat de APU eigenlijk weinig te zoeken heeft in alles waarbij "games" op de verlanglijst staan. En voor de rest is ook de IGP van de i3 vaak voldoende. AMD lijkt gegokt te hebben op een marktontwikkeling die er (nog) niet is.
Wat betreft de prijzen van Bulldozer CPU's betreft, het High End model zou een geschatte richtprijs hebben van $320, wat neer zou komen op een (heb ik mij laten vertellen) prijs van rond de €250 voor het beste model van de octacores. Geen idee of dit zo zou zijn maar het zou best een worp in de juiste richting kunnen zijn?
Qua prijs verwacht ik weinig bijzonders. AMD kijkt hoe de chip presteert tov de Intels en kiest een prijs die net onder gelijkwaardige intel chips ligt. Elk ander prijsbeleid lijkt zelfmoord. Net als Intel wil AMD gewoon winst halen. Prijzen hoger dan vergelijkbare intel chips gaan niet werken en met prijzen flink lager dan intel snijd AMD zichzelf in de vingers.

Als deze chip prestaties levert tussen een 2500k en 2600k in en nu op de markt zou komen zal de prijs dus tussen de 177 en 250 euro moeten liggen. De prijs wordt dus bepaald door de performance tov de concurrentie.
Ja daarom, al is de 2600K wel een aardige vergelijking.
Niet al te duur en goede prestaties. (met een aardig overklok imago)

Maar dan heb je nog het feit dat Intel aardig wat sockets verslijt in de jaren...
AMD, houd een socket lang en brengt hier ook weer nieuwere CPU's op uit.

Ieder heeft z'n voor en nadelen.

Als de Buldozers goed geprijst zijn, gaat Intel dat zeker voelen.
tja mijn amd 955 doet superpi 1m in 22 sec rond veel sneller is deze bulldozer dus echt niet.
helaas.

geheugen test is wel iets beter maar is het een single of dual channel test aangezien er maar 2gb gebruikt is weet ik dit nog niet echt.

maargoed hoeveel van de superpi test is daarwerkelijk relevant in intensief pc gebruik ?

[Reactie gewijzigd door computerjunky op 11 juli 2011 16:01]

http://gathering.tweakers...message/36384083#36384083

Plaatje bekijken. Conclusies trekken. Dual Channel.

Computer memory staat voor 2GB
Chipset memory staat voor 2GB
DIMMs installed: 2x2GB
- Wat hier de logica van is ontbreekt me.

[Reactie gewijzigd door Allubz op 11 juli 2011 16:33]

@computerjunky

Superpi is compleet irrelevant en dat Bulldozer traag erin is lijkt me niet meer dan logisch, het zijn dual core modules met per core 80% performance van een echte core.

Superpi kan maar met 1 core omgaan, dus die andere 7 staan uit hun neus te eten.
Ja je hebt gelijk daar heb ik even niet goed gelezen :D thx voor de verduidelijking.
Superpi is single threaded, Bulldozer gebruikt hier dus maar een achtste van z'n totale kracht, terwijl de quadcore sandybridge een kwart van z'n totaal gebruikt. Als alle cores gebruikt worden dan kan BD gewoon SB bijhouden (dat is, als deze benchmark echt is, er komen dagelijks van dit soort twijfelachtige benchmarks uit, snap dan ook niet waarom tweakers deze opeens zo nieuwswaardig vindt).
De cpu wist de SuperPi-benchmark, waarin het getal pi zo snel mogelijk tot een miljoen cijfers achter de komma berekend wordt, in 19,5 seconden te doorlopen. Recente Intel-cpu's hebben daarvoor, op een vergelijkbare kloksnelheid, ongeveer de helft van de tijd nodig.
Eigenlijk is de Bulldozer dus al voorbijgestreefd door Intel voordat hij zelfs maar is uitgebracht .. :'(
superPI is een ENORM slechte benchmark. hij verteld je werkelijk niks over de daadwerkelijke performance van je CPU. daarbij is hij single threaded en daarmee hopeloos verouderd. (edit : evenals om het feit dat hij nog x87 instructies gebruikt, die in alle andere programma's al lang zijn vervangen door SSE1 en hoger instructies)

en superPi is heel erg cache gevoelig, en laat het nou vrij waarschijnlijk zijn dat er bij een engineering sample bepaalde cache functies uit staan.

[Reactie gewijzigd door Countess op 11 juli 2011 16:02]

SuperPi is inderdaad een vreemde eend. Het is in basis ontwikkeld in 1995, en geport en gecompiled onder Windows, waarbij de Compiler me onbekend is. Dat zal best wel eens een Intel compiler kunnen zijn. Die geeft vaak wat andere effecten dan de WinSDK compiler bijvoorbeeld.

Zonder veel te weten over de werkelijke code, gok ik, zeker als het nogal fixed is, dat het erg "laag" de CPU in gaat. Want laten we eerlijk zijn: veel hiervan kan berekend worden puur en alleen door schuiven in de CPU caches. Zo groot is zo'n getal nou ook weer niet, als je absoluut gaat kijken. MPIR en GMP proberen dit immers ook: zoveel mogelijk cache-frotten. En dat gaat nou eenmaal single threaded.

Hieronder heb ik reeds opgemerkt dat ik de cache configuratie van deze CPU apart vind, en ik gok wel dat CPU-Z in staat is om dát goed uit te lezen. Laat SuperPi nou net JUIST heel erg afhankelijk hiervan zijn, en de Sandy Bridges nou juist heel erg GOED in dingen als "close-to-CPU-cache" (de L1 van die dingen is werkelijk IMMENS), en een turbo hebben die één core naar absurde cijfers kan tillen.
Precies. Ik dacht dat iedereen dat inmiddels zou weten.
Dat Super Pi door Tweakers nog steeds gebruikt wordt in een AMD/Intel vergelijking, is waarschijnlijk gemakzicht. Nut heeft het al jaren niet meer.
Nu zie ik hele verhalen over SuperPi, uiteraard omdat dit in het artikel wordt genoemd, maar hoe zit het eigenlijk met de benchmark HyperPi (ook hier)? Deze is als het goed is deze wel multithreaded en dus ook geschikt voor meerdere cores.

Weet iemand hoe dit zich uit tussen AMD en Intel en of deze wel meer geschikt kan worden bevonden voor een dergelijk benchmark?

[Reactie gewijzigd door marcel87 op 12 juli 2011 07:46]

Niet echt. Hij geeft een goede benchmark van singlethreaded app performance - en dus van de "turbo" functie die dit soort multicore procs tegenwoordig hebben (waarbij ze enkele cores uitschakelen om de overige cores een boost te geven).

Het geeft dus geen realistische office performance, of game performance van games die wel meerdere cores belasten.

[Reactie gewijzigd door Aetje op 11 juli 2011 15:34]

wel echt. superpi gebruikt nog x87 instructie.
NIEMAND gebruikt die dingen nog. die zijn allemaal al lang omgezet naar SSE1 en hoger.

dat intel daarmee sneller is dan AMD is dus COMPLEET irrelevant.
Wat je goed noemt...ze evenaren wat Intel doet met een mid-range cpu met 4 cores maar met een flink hogere TDP. Laten we maar hopen voor AMD dat dit ligt aan het feit dat het een engineering sample is en niet represenatief wordt voor het eindproduct.
Het was al bekend dat het topmodel 125W gaat gebruiken en de rest 95W. Dus de 186W in de screenshot is of een fout in cpu-z of omdat het een ES betreft.
Ben alleen bang dat tegen de tijd dat AMD er mee in de verkoop gaat, het weer voorbij gestreeft is door intel....
Intel heeft anders niks in de planning staan de komende tijd. de nieuwe tripple channel socket duurt nog tot de kerst (en daar verwacht ik weinig van) en ivy bridge is nog weer 3-4 maanden later.
en gezien het feit dat Intel elk jaar een nieuwe CPU uit brengt is 7 maanden de tijd aardig lang.
Welke "nieuwe" tripple channel "socket" heeft Intel dan? Of bedoel je het twee jaar oude LGA1366 (socket B ) platform?

En ja LGA1356 (socket B2) en LGA2011 (socket R) laten nog even op zich wachten, tot minimaal Q1 2012, zie ook hier.

Op zich is 7 maanden natuurlijk lang, aangezien AMD dan vrij spel heeft, maar uiteindelijk is ook te zeggen dat de huidige Sandy Bridge cpu's naast performance ook prijstechnisch waarschijnlijk beter kunnen concurreren (prijsdaling) met die Bulldozers van AMD. Dus in principe is het maar net wat je er zelf van maakt/waar je voor gaat en doen in mijn ogen die 7 maanden er helemaal niet toe.

Ik zag hier binnen de reacties onder dit artikel ook veel mensen zeggen dat AMD prijstechnisch echt stukken beter is voor een compleet systeem. Maar Sandy Bridges zijn gewoon erg lekker geprijsd en moederborden kan je daar ook al van rond de 100 euro kopen. De enige punten waarop een AMD dan goedkoper moet zijn is de CPU plus eventueel het moederbord, de rest componenten houd je dan gewoon precies hetzelfde als bij een Intel systeem. In het verleden was het inderdaad wel eens anders, daar ben ik het mee eens. :)

[Reactie gewijzigd door marcel87 op 12 juli 2011 08:00]

"maar uiteindelijk is ook te zeggen dat de huidige Sandy Bridge cpu's naast performance ook prijstechnisch waarschijnlijk beter kunnen concurreren (prijsdaling) met die Bulldozers van AMD."
een bulldozer octo core is niet veel groter als een sandy bridge quadcore. zeker als je kijk naar het oppervlakte zonder L3 is het verschil klein. bulldozer kan dus prima met sandy bridge concurreren op prijs.
en op het compleet nutteloze superpi na doe hij het helemaal niet slecht in vergelijking.

even opgezocht.
216mm2 voor sandy bridge (inclusief L3)
30.9mm2 per module voor bulldozer zonder L3 = 123,6 mm2 voor 8.
voor de hele die inclusief L3 zijn nog geen officiële cijfers, er word gegokt op 280-300mm2.
genoeg ruimte voor AMD om te schuiven dus. en een vele malen betere verhouding als de thuban tegenover sandy bridge.

[Reactie gewijzigd door Countess op 12 juli 2011 17:15]

Ja dus? Wat is je punt? Dat is mij nou totaal niet duidelijk :|, ik bedoel je haakt op mij in, om er vervolgens niets over te zeggen :?. Leuk die oppervlakten die je allemaal noemt en gist, maar waar het op slaat zie ik niet....
Ik vind 'm erg teleurstellen. Ik weet ook wel dat dit nog niks aantoont, maar ik had toch echt gehoopt dat zelfs met dit soort modellen en benchmarks de Bulldozer een 2600k wegveegt. Nu zal AMD's enige sterke punt hun lage prijs wel weer zijn.
Ik was aan het sparen en wilde wachten tot Bulldozer. Ik ga wel een extra weekje op vakantie en wacht nog wel een jaartje tot ik een nieuwe pc koop.
Ik sta echt te kijken van alle conclusies die getrokken worden over dingen die NIET zeker zijn. Het TDP is 100% zeker niet correct. Super Pi is een domme benchmark om daar teveel op te baseren.
Teveel gejank nu al van mensen die niet weten wat het uiteindelijk gaat worden.

Hoe kan je nou in 1 zin zeggen dat het niks aantoont, EN meteen gaan zeuren er over? :S

hypocriet gedoe altijd :/
Met als verschil dat 3.2Ghz vermoedelijk een van de laagste bulldozer clocks is, terwijl bij intel de 2600K het hoogste is (als je de ik-heb-veel-geld high ends niet meerekent).
Vindt ik toch tegenvallen, het gaat hier om een OCTA core (ofwel 8 cores) en dan nog presteert deze matiger dan een core i7 quadcore (ofwel 4 cores)..
Een i7 is ook 8 cores (hypertreathing). Verder lees mijn post van hierboven en je zal begrijpen waarom je nu nog niet je mening mag laten vallen...
De Intel Core i7 2600 mag dan wel hypertreathing hebben maar dat betekent niet dat hij dan ook 8 Cores heeft, dat is heel wat anders.
In 3DMark 11 wist de Bulldozer-cpu in combinatie met de GTX580 een score van 6265 punten neer te zetten, vergelijkbaar met een Core i7 2600 van Intel, die een kloksnelheid van 3,4GHz heeft.
Ja vind dat SuperDre gelijk heeft, als dit ook de snelheid word van de versie die ook in de winkels komt te liggen is, is de AMD's Bulldozer-octacoren niet snel maar zelfs langzaam.

[Reactie gewijzigd door AmigaWolf op 11 juli 2011 21:32]

Daar ben ik het mee eens, ik zeg gewoon dat we daar nog niet over kunnen spreken tot dat die uit is... (PS: ik ben geen AMD fan, ik heb zelf een i7)
Het is toch wel algemeen bekend dat IPC tussen verschillende cores flink kan verschillen.

Hypertreading houd in een over maat aan reken pipelines waar door out of order afhankelijkheden niet optmaal gebruik van gemaakt kan worden. De sweet spot zit rond 3 a 4. INtel gebruikt extra veel pipes en kunnen dmv HT wel benut worden.
Een iNtel core heefd dus 1,5x de resources om single tread af te werken en met HT eigenlijk net te weinig om twee out of order treads optimaal parrallel te verwerken.
plus de overhead. En HT verieerd sterk kwa meer performance gemiddeld 1,3x

AMD cores Zijn een siamese tweeling.
De 8 core is eigen een quad siamese tweeling core.
De pipelines zijn er in 8 coretjes maar de FPU is gedeeld door 2.
Het is dus een 4 x 2:1 (ALU's : FPU)

Dus een intel six cor teld ALU 1,5 keer mee 9x vs 8 van AMD.
Wel full 6 FPU voor intel CPU, voor amd oct is het 8/2

Daar komt de IPC variatie nog overheen en je ziet dan dat AMD het nog steeds moeilijk heefd.

Want een CPu van grond af opnieuw opzetten. Kan ook betekenen met bestaande logic rond schuiven.Verhoudingen tussen logi aanpassen. IPV radicale IPC verbeterende architektuur binnen die logic units veranderen.
De cpu wist de SuperPi-benchmark, waarin het getal pi zo snel mogelijk tot een miljoen cijfers achter de komma berekend wordt, in 19,5 seconden te doorlopen. Recente Intel-cpu's hebben daarvoor, op een vergelijkbare kloksnelheid, ongeveer de helft van de tijd nodig.
Ouch. Dat valt toch wel erg tegen.
Omdat het om een engineering sample gaat, kunnen nog weinig conclusies getrokken worden uit de scores.
Waarom niet? De kloksnelheid is niet onredelijk laag en AMD gaat niet het hele design van de chip nog omgooien.

[Reactie gewijzigd door Olaf van der Spek op 11 juli 2011 15:22]

omdat compilers nog van grote invloed kunnen zijn, omdat bepaalde cache functies nog zijn uitgeschakeld misschien, omdat de turbo nog niet naar behoren werkt misschien omdat 3.2ghz een van de laagste snelheden gaat zijn waar bulldozer op uit komt, omdat er misschien nog word gesleuteld aan de microops code ect.

welke allemaal nog van toepassing zijn en welke nog van grote invloed zijn weet ik niet maar
genoeg reden om nog een slag om de arm te nemen lijkt me.

[Reactie gewijzigd door Countess op 11 juli 2011 15:46]

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True