Intel en HP hebben op de supercomputerbeurs ISC2005 een demonstratie gegeven van een systeem met vier Itanium Montecito-processors. Het zou daar met de beperkte kloksnelheid van 1,6GHz en niet speciaal voor de processor geoptimaliseerde code een resultaat van 45,8 gigaflops hebben neergezet, grofweg de helft meer dan een systeem met dual-core Opterons haalt. Er zijn tegelijk een hoop interessante nieuwe feiten over de volgende generatie van de Itanium bekendgemaakt. Deze zullen verderop besproken worden, maar eerst voor degenen die het overzicht kwijt zijn geraakt een lijst met de basiseigenschappen:
Madison 9M | Montecito | |
---|---|---|
Procédé | 0,13 micron | 0,09 micron |
Cores | Single | Dual |
FSB | 400MHz per vier sockets 1,6GB/s per socket 1,6GB/s per core | 667MHz per twee sockets 5,4GB/s per socket 2,7GB/s per core |
L2-cache | 256KB (unified) | 256KB data (per core) 1MB instructies (per core) |
L3-cache | 9MB | 24MB (totaal) |
Multithreading | ![]() | ![]() |
Transistors | 592 miljoen | 1,72 miljard |
Die-size | 480 mm² | 596 mm² |
Kloksnelheid | 1,6GHz | 2,0GHz+ |
Stroomverbruik | 122 watt | 100 watt |
De Itanium Montecito is dus bepaald geen triviale verbetering op het bestaande ontwerp. Intel laat met de enorme core en de gigantische aantallen transistors die er voor gebruikt worden zijn spierballen op het gebied van productietechnologie zien. Meest indrukwekkend is echter niet het feit dat men twee cores en zoveel cache op een chip heeft weten te bouwen. Dat hij daarbij ook nog eens minstens 25 procent hoger geklokt kan worden terwijl de pipeline even lang is gebleven en ook de cache-latencies (in cycles) gelijk zijn aan die van de voorganger is al een heel stuk knapper, maar ook niet de grootste prestatie die hier wordt vertoond. Het meest belangrijke punt om op te merken is dat Intel dit allemaal gedaan heeft terwijl de chip nog significant zuiniger is geworden ook. Recent heeft het bedrijf de zogenaamde 'shmoo' voor de core vrijgegeven, waarop te zien is wat de maximale kloksnelheid en het gebruikte vermogen bij bepaalde voltages is.
![]() | ||||||
![]() | ![]() | |||||
![]() | ||||||
![]() | 1,30V | ![]() | 2,2GHz | ![]() | ![]() ![]() ![]() | ![]() |
![]() | ||||||
![]() | 1,25V | ![]() | 2,1GHz | ![]() | ![]() ![]() ![]() | ![]() |
![]() | ||||||
![]() | 1,20V | ![]() | 2,1GHz | ![]() | ![]() ![]() ![]() | ![]() |
![]() | ||||||
![]() | 1,15V | ![]() | 1,9GHz | ![]() | ![]() ![]() ![]() | ![]() |
![]() | ||||||
![]() | 1,10V | ![]() | 1,9GHz | ![]() | ![]() ![]() ![]() | ![]() |
![]() | ||||||
![]() | 1,05V | ![]() | 1,8GHz | ![]() | ![]() ![]() ![]() | ![]() |
![]() | ||||||
![]() | 1,00V | ![]() | 1,7GHz | ![]() | ![]() ![]() ![]() | ![]() |
![]() | ||||||
![]() | 0,80V | ![]() | 1,2GHz | ![]() | ![]() ![]() ![]() | ![]() |
![]() |
De 45,8 gigaflops die tijdens de demonstratie werden gehaald werden dus gerealiseerd met processors die minder dan 57 watt per stuk gebruikten. Het zou in theorie zelfs mogelijk zijn om een 1,2GHz Montecito te bouwen die nog zuiniger is dan de mobiele Pentium M. Het is dan ook niet verwonderlijk dat er al veel bedrijven enthousiast zijn over de core. Hoewel de introductie pas tegen het einde van dit jaar zal plaatsvinden schijnt Intel al meer bestellingen te hebben voor Montecito-processors dan er van de eerste twee generaties Itanium in totaal verkocht zijn. De bovengenoemde kloksnelheden zijn overigens slechts de basis. Alleen echt zwaar floating point-werk weet de core op honderd procent van zijn TDP te krijgen. De rest van de applicaties zweeft tussen de zestig en tachtig procent, en die ruimte wordt door een techniek die Foxton heet benut om de core maximaal 10% over te klokken.
Naast de details over het stroomverbruik heeft Intel ook een paar andere verbeteringen aan de core onthuld. Een tweede shift unit zou de prestaties van encryptiesoftware bijna kunnen verdubbelen, en de branch unit is geoptimaliseerd voor commerciële integersoftware. Verder levert het gesplitste L2-cache (in aparte delen voor data en code) voor dezelfde soorten code nog eens zeven procent betere prestaties op. TMT (Temporal Multithreading) zou database-toepassingen 15 tot 35 sneller kunnen laten lopen. Verder zijn er veel verbeteringen op het gebied van RAS (reliability, availability, serviceability) aangebracht. Zo ondersteunt Montecito een vorm van lockstep waarbij de twee cores elkaars resultaten controleren.
