Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 52 reacties
Bron: Ace's Hardware

Ace's Hardware heeft mooie grafiekjes gemaakt van de benchmarks van een Intel Itanium 667MHz, naar aanleiding van deze post in het mailarchief van de makers van ATLAS. De schrijver van die post vergelijkt de prestaties van de Intel Itanium 667MHz, Intel Pentium 4 1,5GHz en AMD Athlon 1GHz (met SDRAM) onder ATLAS, een programma voor lineaire algebra´sche berekeningen. Ace's Hardware heeft een diagram gemaakt van de resultaten in een double precision matmul benchmark. In deze test worden twee matrices met elkaar vermenigvuldigd.

DMatmul ATLAS benchmark van Itanium

Intel's nieuwe IA-64 architectuur zet dus zeker geen onredelijke prestaties neer. Volgens Paul DeMone, die zijn reactie geeft in deze thread op het forum van Ace's, geeft dit echter nog geen enkele garantie voor de performance van de Itanium in andere applicaties:

Given the machines are running Linux and the IA-64 compilers on Linux don't do serious EPIC specific optimizations yet (AFAIK) I presume these Atlas routines are hand code and optimized in IA-64 assembly language. Unfortunately that reduces the usefulness of these results to predict ultimate Merced performance on compiled programs such as the SPEC suite.

In deze benchmark werden overigens nog geen SSE2 of 3DNow! optimalisaties gebruikt. Met dank aan Crack voor de tip.

Moderatie-faq Wijzig weergave

Reacties (52)

Hoe groot is de cache van de Itanium? Ik vraag me af of die knik in de curve veroorzaakt wordt door een volle cache. Een double precision floating point getal is 64 bits, toch? De knik zit ongeveer bij 350, aangenomen dat het vierkante matrices zijn en er twee verschillende matrices vermenigvuldigd worden en ook nog een resultaat matrix opgeslagen wordt, zou er ongeveer 3MB cache in zitten. Dat is een stuk meer cache dan de Athlon en de P3 hebben, dus de vraag is hoeveel deze grafiek zegt over de performance van de Itanium core.
Op http://www.vr-zone.com/Home/news56/news56.htm#8 58 wordt geclaimed dat cachesizes 2 en 4mb zullen zijn voor de verschillende modellen. Volgens Intel zelf staat het nog niet vast: ftp://download.intel.com/design/IA-64/Download s/24547401.pdf - op pagina 14 van dit document willen ze alleen kwijt dat er verschillende modellen komen. Dus die 2-4mb lijkt me niet zo gek gezien de huidige 1-2mb op de zwaardere Xeons.
Die score valt me niet eens tegen, maar ik had 'm liever t.o. een Alpha, Sparc, Mips of HP-PA gezien want daarmee zal hij toch moeten concureren.

In vergelijking met de Athlon is hij vergelijkbaar met een 1500MHz versie, en dat voor 666MHz da's zo'n 2,25x zo snel per clockcycle...
Maar ja, zo'n monster als de Alpha 21364 moet hij nog maar eens zien te kloppen.
Zoals uit de nieuwspost al naar voren komt is het inderdaad niet tegenvallend, maar je moet je wel bedenken dat dit volledig in ASM uitgewerkte routines zijn; Weet je nog wat er met FlaskMPEG gebeurde als je voor de Athlon ging optimaliseren? 200+% prestatiewinst!

De benchmark is dus wel redelijk aardig te noemen, maar echter niet eerlijk. In hoeverre een met een compiler gebouwd programma (waarbij de optimalisaties lang niet zo goed zijn) even snel is, is af te wachten. Het hangt eigenlijk dus allemaal van de ondersteuning in de compilers af... :)
Weet je nog wat er met FlaskMPEG gebeurde als je voor de Athlon ging optimaliseren? 200+% prestatiewinst!
* 786562 arjenk
Misschien wel erg rooskleurig, maar veel minder moet het ook niet zijn. De IA-64 heeft een nieuwe instructieset zodat eindelijk afgerekend kan worden met de x87 stack-georienteerde instructies die de oorzaak is dat P4 en Athlon in floating point naar verhouding veel slechter presteren als in integer instructies vergeleken met RISC processors. Het zou mij juist tegenvallen als Intel er niet in slaagt de relatieve FP performance te verdubbelen.
Dit ziet er allemaal wel erg rooskleurig uit he. Ik kan me niet voorstellen dat een 667Mhz Itanium bijna 2x zo snel is als een athlon 1Ghz. Natuurlijk is het wel een 64-bits, maar ik vind het verschil wel errug groot. En waarschijnlijk zal de prijs van die itanium wel weer een paar honderd gulden hoger liggen dan die van amd's proc.

Maar we zullen zien, misschien is het wel echt een goeie en betaalbare proc, maar ik kan het me nauwelijks voorstellen dat het verschil ZO groot is
Paar honderd :+

Reken maar op een paar duizend, dit is een high-end processor voor in servers. En het is vrij normaal dat hij op 667mhz sneller is dan een 1ghz AMD, de cores van de procs verschillen zoveel onderling, afgezien dat de ene 32bit is en de andere 64.
Over de benchmark kan ik nog weinig zeggen, zie liever real life benchmarks, maar het belooft iig veel goeds.
Dit word toch de toekomst, van 32bit naar 64bit, dus hopen dat ze ervan leren en later een mooie thuisgebruiker versie neerzetten.
Maar ik snap niet dat ze 32bit procs met 64bit procs vergelijken, dat werkt niet, het kan namelijk zo zijn dat deze proc veel langzamer is met x86 instructies dan een p3 of athlon. Dat komt omdat de instruction set EPIC zwaar afhankelijk is van de compiler, maar we zien wel hoe het verder uitpakt. Intel heeft ze zinnen erop gezet en kondigt hem nu al bijna een jaar of 2 aan, dus we wachten af. :)
Was het niet zo dat de itanium niet backwards compatible was? dus dat de oude x86 instructies ge-emuleerd zouden moeten worden?
Of zijn de instructies hetzelfde en moet alleen het 32bits gedeelte ge-emuleerd worden...

iig, dan is de performance gewoon zwaar klote voor gewoon 32 bits.
Wat dus NIET geld voor de hammers van AMD, want die zijn WEL backwards compatible

maar ja, backward compatibilty is ook niet alles. Als intel zijn 386 niet compatible had gemaakt dan hadden we nu waarschijnlijk met veel betere processors gezeten omdat het ontwerp dan gewoon helemaal anders had gekund.
32 vs 64 bits = 2 keer.
Dus de performance zou in principe 2 keer zo hoog kunnen zijn.
Ze zeggen ook dat de bemnchmark, handmatig is geoptimaliseerd voor 64 bits. Dus in de praktijk zal dit vreschil veel kleiner zijn.
Nee, 64 vs 32 bit zegt in de eerste instantie helemaal niets over performance winst. 64 bit betekent dat het datapad in de CPU 2 keer zo breed is als bij 32 bit.
Stel het maar voor dat je nu getalletjes kan vermenigvuldigen met 2 keer zoveel cijfers. Je zou bij wijze van spreke dezelfde vermenigvuldiger uit de 32 bits cpu kunnen pakken, en die 2 keer zo breed maken. Het eindresultaat is dat hij net zo snel is.

De echte snelheidswinst bij de Itanium wordt veroorzaakt door de EPIC instructie set. Daarmee is het mogelijk om van te voren (bij het compilen) al te kijken wat er moet gebeuren (welke data uit het geheugen waarheen in de cpu). Vooral bij dit soort matrixberekeningen is dat vrij makkelijk, zoals je kan zien aan de goede resultaten. Bij spelletjes is het helaas iets minder eenvoudig, dus minder snelheidswinst.
Nee, 64 vs 32 bit zegt in de eerste instantie helemaal niets over performance winst. 64 bit betekent dat het datapad in de CPU 2 keer zo breed is als bij 32 bit.
Natuurlijk wel. Als je (precies zoals in de test) rekent met double precision floats (die voorgesteld worden op 64 bits) dan heb je (grof gezegd) op een 32 bits processor 2 kloktikken nodig en op een 64 bits processor maar 1 kloktik per bewerking nodig. Dat is ook de hele reden dat de DEC Alpha processor zo verrekte snel is in double precision floating point berekeningen.

Ik ben wel benieuwd naar de integer performance van de Itanium, die zou wel eens een stuk achter kunnen blijven.
Hmmm ja ja,

voorbeeldje:

Ik loop met een kruiwagen vol zand (pre-natal-silicium voor mensen die niet buiten komen :) )
Dit duurd X tijd
Nu krijg ik een 2 keer zo grote kruiwagen,
geldt dan : Dit duurd 2*X tijd ?

Neeeeeeee, til verdomme maar eens zo'n kruiwagen.

Nou is dit een dom voorbeeld maar bij 32 bits naar 64 bits is de versnelling niet zomaar *2 zonder haken & ogen.

Aan iemand anders de eer om die haken & ogen te gaan vertellen; ik ga fijn slapen :z
Damn ik moet echt gaan slapen:

2*X tijd moet natuurlijk X/2 zijn in dit geval.

To the point:

Het gaat niet 2 keer zo snel want ik breek mn rug.
Een Itanium is absoluut waardeloos met 32 bits applicaties....ik spreek uit ervaring :)
welke ervaring heb jij er mee dan? zijn er 32 bits applicaties die het doen op IA64 dan?
Uche...top secret :)

32 bits applicaties werken wel op IA64 maar dan moet de code omgezet worden. Dat kost tijd, en naar blijkt erg veel tijd. Wil je een Itanium fatsoenlijk kunnen gebruiken dan moet je al je 32 bits code hercompileren, anders kun je net zo goed een pentium 100 gaan gebruiken
Maar zoveel grote servertoepassingen zijn er nu ook niet, dus dat recompilen zal ook niet zo lang duren.
sukkels.... kunnen jullie niet rekenen ofzo??

sinds wanneer is 2 * 2^32 -> 2^64 FOUT FOUT FOUT FOUT elke dode wiskundige draait zich nu om in zijn graf > :).

reken zelf maar ff na als je me niet gelooft. Ik vind de prestaties daarom ook tegenvallen. Maarja hier worden ook eigenlijk appels met peren vergeleken.
Als de Itanium 1700 mflops haalt en de Athlon 1200 mflops, dan lijkt mij de Itanium niet 2x zo snel. Eerder 1,4 keer zo snel. :o Neemt niet weg dat dat nog steeds lekker snel is.
vergeet niet dat die itanium op een lagere kloksnelheid draait.....
De EPIC instructieset is juist het goede aan de itanium, zeker voor de desktop systems. Die instructieset levert juist zoveel meer info op voor de processor om intern te optimaliseren, zodat er veel meer snelheid kan worden behaald.

de huidige 32bit programma's draaien op een Itanium lijkt me niet zo nuttig. Hij moet dan emuleren en dat levert nooit snelheidswinst op. Hercompileer je echter de code met een itanium enabled compiler, dan heb je dat voordeel van die EPIC instructieset weer WEL.

wel naar dat die instructieset 'EPIC' heet. Moet telkens denken aan een Unreal game, heel gek :+
Het ligt vooral aan de software die je er voor gebruikt en met welk programma er wordt getest,

vergelijk het maar met vroeger met de (486 SX en de DX2 versies)
Die Paul DeMone krijgt zo onderhand een goddelijke status......je kletst wat op een forum en je wordt over de hele wereld meteen gequote ;)
Wie is Paul deMone? :)
Zoals BikkelZ al zei:
Die Paul DeMone krijgt zo onderhand een goddelijke status......je kletst wat op een forum en je wordt over de hele wereld meteen gequote ;)
lineaire algebra´sche berekeningen in een double precision matmul benchmark :?

ja idd. als we die nou ff met een flinke terominale byte sessie converteren naar een hyper time super molecuul bypass product, dan kunnen we die vergelijken met het over suspended blue bit map syndroom.
Maar dan zit je weer met het probleem dat de quantum fluctiaties in het plasma-array gaan optreden. Wat weer tot gevolg heeft dat de superinduction lightenhancer te veel electronen in de magneton-unit brengt en dat moeten we natuurlijk niet hebben
Dit belooft veel goeds voor de toekomst :)

* 786562 Frank
Iets meer dan een jaar zal het nog wel moeten duren.
De 64 bits processor van AMD de sledgehammer lijkt me interessanter. En die komt pas in 2002.
Maar voor de consumenten komt er nog een thuisgebruikers versie de Clawhammer. En als die komt zal het doorbreken van 64 bit denk ik pas echt gaan beginnen.
AMD gaat volgend jaar nog niet zorgen voor een doorbraak hoor. Zij hebben maar een te verwaarlozen invloed op de ontwikkelingen.
Ik had graag ook een vergelijking gezien met een p3 667Mhz.
Dan had je pas kunnen zien wat het verschil is tussen 32 en 64 bit.
zoals even een stukje naar boven ook al werd gezegd... het verschil tussen de cores is niet alleen het 32/64 bit verschil...
Dat weet ik wel, maar tussen 667 Mhz en 1 Ghz zit toch nog wel een groot verschil.
En een P3 667 Mhz haalt echt niet hetzelfde aantal Mflops als de P4 of de Athlon.
De P4 en de Athlon hebben toch ook verschillende cores in vergelijking tot een P3 en een Itanium
En dat kunnen ze toch wel vergelijken.
Anders zou je deze hele test nutteloos kunnen noemen omdat de chips allemaal een verschillende core hebben.
Het is allemaal leuk en aardig die 64 bits proc's
maar als ze eindelijk voor de thuisgebruikers beschikbaar zijn (kwa prijs enz ) hoe lang duurt het dan nog dat alle software hiervoor wordt gemaakt
Lijkt mij teminste een hele klus.
nou DEX, die Itanium zul jij wel nooit je pc krijgen, laat staan in je handen. Die proc blijft toch alleen maar voor serverbakken. Die grote cache is voor pc's en workstations niet nodig, en daarvoor is ie ook veelste duur, en waarschijnlijk een Itanium mobo ook.
Dus ik denk dat je zult moeten wachten op een AMD ClawHammer. Die is bedoeld voor pc's en workstations.
Voor de AMD SledgeHammer geldt hetzelfde verhaal als de Itanium.
En dan nog als je die Itanium zou kunnen krijgen over een tijdje, dan kon je er waarschijnlijk nog weinig mee. Misschien dat het dan wel een beetje begint te lopen met 64-bit software (ligt ook aan de release van de Claw/SledgeHammer), maar je zult nog veel 32 bits software hebbe en die Itanium loopt dan in 32-bits emulatie modus, en dan is ie veeeel trager dan een gewone proc.
beetje scheve vergelijking, qua snelheid,
maar geeft wel potentie weer, eindelijk eens een beetje complexe dingen doen.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True