AnandTech heeft een artikel gepubliceerd waarin de onlangs geïntroduceerde Sun UltraSparc T1-processor, beter bekend onder de naam 'Niagara', onder de loep wordt genomen. Deze nieuwe processor omschrijft de auteur van AnandTech als 'net iets minder dan een revolutie' aangezien de processor in staat is om op een kloksnelheid van 1,2GHz en met een stroomverbruik van 72 Watt prestaties neer te zetten die drie keer zo hoog zijn als vier Xeon-cores op een kloksnelheid van 2,8GHz en een energieconsumptie van 300W. Uiteraard zitten er wat haken en ogen aan de Sun-processor, aangezien deze topprestaties alleen bij een beperkt aantal specifieke toepassingen worden behaald en in bovengenoemd voorbeeld is dit SpecWeb2005.
De Sun UltraSparc T1 is geoptimaliseerd voor 'commerciële servers', waarmee met name webservers worden bedoeld. Deze systemen stellen in vergelijking met desktopsystemen of servers die worden gebruikt voor rekenintensieve toepassingen, duidelijk andere eisen aan de processor. Zo is de tijd dat de processor wordt belast op webservers aanzienlijk lager dan het geval is bij bijvoorbeeld een processor die een video aan het encoderen is. De voornaamste tijdbesteding van dergelijke servers bestaat namelijk uit het verplaatsen van data en het zogenaamde 'context switching' wat nodig is wanneer er van een thread wordt gewisseld. Precies op deze twee punten hebben de Sun-ingenieurs geprobeerd de T1-processor te laten schitteren.
De UltraSparc T1 beschikt over acht cores die allemaal vier threads tegelijk 'in leven kunnen houden' - in totaal dus 32 threads voor de hele processor. Alle acht de cores beschikken over 640 64-bit registers (5,7KB) waarin ze de gegevens van de vier threads kunnen opslaan. Deze relatief grote hoeveelheid registers kunnen in één klokcycle worden benaderd. Elke core heeft één pipeline die elke klokcycle een instructie verwerkt van één van de vier threads waar de core aan werkt. Elke kloktik wordt er aan een andere thread 'gewerkt' dan bij de vorige kloktik het geval was volgens een round-robin schema. Dit is een aanzienlijk andere situatie dan bij de huidige gangbare processors het geval is, aangezien het veranderen van een thread daarbij een zogenaamde contextswitch tot gevolg heeft, waarbij de registers van de oude thread moeten worden bewaard in het (cache)geheugen en de registers van de nieuwe thread moeten worden geladen. Zo'n contextswitch kost meerdere kloktikken, wat dus een aanzienlijk snelheidsverlies betekent in vergelijking met de Niagara.

Een voordeel van deze aanpak is dat wanneer één thread gegevens uit het geheugen wil laden, de Niagara dit kan doen zonder dat hiervoor de processor moet wachten tot het laden gereed is. Ondertussen kan hij namelijk gewoon werken aan de overgebleven drie threads, en de thread die gegevens wil laden 'overslaan'. Bij branches geldt precies hetzelfde; de Niagara heeft dan ook geen branch prediction aan boord, zoals de meeste andere gangbare processors. Om ervoor te zorgen dat de processorcores bezig blijven, is de Niagara uitgerust met 3MB L2-cache die wordt gedeeld tussen de acht cores. De toegang tot het werkgeheugen gebeurt via vier DDR-geheugencontrollers. De communicatie tussen de cores en het L2-cachegeheugen gebeurt via een high-speed cross-bar interconnect.
Nadelen heeft het ontwerp van de UltraSparc T1 uiteraard ook. Zo is door het 'eenvoudige' ontwerp de kloksnelheid beperkt tot 1,2GHz op 90nm, terwijl de concurrentie op kloksnelheden tussen 2 en 3GHz zit. De acht cores moeten slechts één Floating Point Unit (FPU) delen, waardoor de prestaties van de processor drastisch afnemen als meer dan één procent van de instructies uit floating-point-instructies bestaan. Ook beschikt elke core over een Modular Arithmetic Unit (MAU) die delingen en machtsverheffingen verwerken om de verwerking van SSL-encryptie te versnellen. De prestaties op dit gebied blijft ondanks deze MAU achter bij de concurrentie. AnandTech heeft geen eigen benchmarks gedraaid op de UltraSparc T1 processors en heeft daarom alleen de benchmarkresultaten die zijn vrijgegeven om de snelheid van het systeem te beoordelen. Ook gaat het artikel nog in op de virtualisatie in combinatie met de UltraSparc T1 en over de opvolger van de processor, de Niagara 2.