Bij Ace's Hardware is een interessant interview verschenen met Dr. Marc Tremblay, de Chief Architect voor de processor en network products group van Sun. Het interview gaat voornamelijk over CMP en CMT. CMP en CMT zijn beiden technieken om de prestaties van multithreaded applicaties te verhogen. CMP houdt in dat er fysiek meerdere processor core's aanwezig zijn voor het uitvoeren van meerdere threads terwijl je met CMT meerdere threads kan uitvoeren op één processor.
Sun is bezig met de ontwikkeling van verschillende CMP- en CMT-chips waaronder de Niagara. Deze chip krijgt de beschikking over acht cores die elk vier threads kunnen verwerken. Hiermee kan de chip gelijktijdig 32 threads uitvoeren. Het grote voordeel van dit ontwerp is dat de negatieve invloed van geheugenlatencies vrijwel wordt opgeheven. Als een thread data nodig heeft die niet aanwezig is kan er gewisseld worden naar een andere thread en pas als de gevraagde data gearriveerd is wordt er weer teruggewisseld.
Hierdoor wordt een latencyprobleem omgezet naar een bandbreedteprobleem. DRAM-chips die een voldoende lage latency hebben om een gigahertzprocessor bij te benen zijn er niet, maar meer bandbreedte leveren door bijvoorbeeld de busbreedte te vergroten is vrij simpel. Sun claimt dat de Niagara-chip vijftienmaal sneller is dan een 650MHz UltraSparc IIi chip. Tevens is Sun bezig met de ontwikkeling van een CMT-chip die circa zestigmaal zo snel wordt als de UltraSparc IIi en dertigmaal zo snel als de 1,2GHz UltraSparc III.

Typical Processor - 75% of Cycles Are Wasted

Single-core CMT Processor - Multiple Threads Compute During Memory Latency Times