Inleiding

English visitors: For your convenience, a translation has been made, which can be read
here.
Het eerste woord dat bij mensen te binnen schiet als iemand het woord "Intel" roept is "Pentium". Deze twee begrippen zijn in de loop der jaren zo aan elkaar verwant geraakt dat de gemiddelde leek niet eens meer weet wat het verschil is. Maar zoals het publiek hier ongetwijfeld wel weet doet Intel veel meer dan alleen chips voor desktops ontwerpen en produceren. Een groot deel van de winst van het bedrijf komt uit de servermarkt. De klanten die zichzelf tot deze doelgroep kunnen rekenen zijn niet in grote getallen aanwezig, over het algemeen praten we alleen over grote bedrijven en zelfs die hebben niet op elk bureau een server staan, waardoor de markt kwantitatief niet erg groot is. Hetgeen dat de servermarkt aantrekkelijk maakt zijn de klanten, die zeer hoge eisen aan de producten die ze kopen stellen en bereid zijn grof geld neer te tellen om te krijgen wat ze willen. Dat is één van de redenen waarom bedrijven als AMD zo graag willen binnenkomen in dit marktsegment, er is heel erg veel geld aan te verdienen. Zo veel zelfs, dat bedrijven als Compaq en IBM alleen maar aan serverprocessors doen.
Wat "Pentium" voor de thuisgebruikers betekent is "Xeon" voor de servermarkt. Na de originele Pentium chip ontwierp Intel een nieuwe core, maar deze bleek niet erg geschikt om oude software op te draaien. Daarom werd hij in de herfst van 1995 Pentium Pro gedoopt en gericht op servers. Tot dusver geen problemen, maar toen ongeveer twee jaar later de Pentium II uitkwam veranderde dat. Hoewel de verpakking anders was en het kleinere cache een stuk trager gebruikte de nieuwe desktopchip precies dezelfde technologie als de serverchip. Het bedrijf besloot daarom een groter onderscheid tussen de twee chips te maken door de nieuwere Slot 2 versies van de Pentium Pro voortaan Xeon te noemen. Het is echter altijd gebruikelijk gebleven om de naam van de desktopprocessor op welke hij het meeste lijkt erbij te noemen. Inmiddels zijn de Xeon processors voorzien van een core die het meest op de Pentium III lijkt en is de maximale snelheid 1GHz.

zonsondergang@foster.river (Foto: Rick) |
De toekomst van de serverserie ligt net als zes jaar geleden in de handen van een nieuwe core; Itanium. De verschillen tussen de x86 IA-32 architectuur en de EPIC IA-64 filosofie zijn echter zo groot dat een overstap in één keer simpelweg onmogelijk is. Uit onze vorige sneak preview is gebleken dat de Itanium niet bepaald goed is in het emuleren van zijn voorgangers, er is dus speciaal geschreven software nodig om gebruik te maken van de nieuwe generatie, iets wat bij de stap van Pentium naar Pentium Pro niet zo zeer vereist werd. Bovendien zullen de 64 bit processors in het begin zelfs voor high-end begrippen duur zijn. Intel blijft daarom nog een aantal jaar doorgaan met het ontwikkelen van serverchips gebaseerd op de oude vertrouwde x86 architectuur. De enige logische manier om de Xeon verder op te krikken is het gebruiken van de Pentium 4 core en dat is dan ook precies waar Intel al een tijdje mee bezig is. Onder de codenaam "Foster" werkt het bedrijf al een tijdje aan de volgende generatie Xeons.
Foster is zoals gezegd gebaseerd op de Pentium 4, maar kan zoals altijd met Xeons niet gebruikt worden op dezelfde moederborden als zijn desktopneefje. Men heeft voor een Socket 603 interface gekozen en de bijbehorende chipset is i860 Colusa, welke maximaal twee processors ondersteunt en werkt met Rambus geheugen. De officiële presentatie van Foster vindt pas over een aantal dagen plaats, tot dan kunnen we dus niet veel zeggen over eventuele nieuwe features van de nieuwe Xeon. Wel kunnen je op de volgende pagina's lezen wat we op grond van de historie en uitgelekte feiten kunnen verwachten.
Waarom Xeon?
Een blik in de pricewatch leert ons dat Xeon duidelijk duurder is dan de Pentium III en ook de Slot 2 moederborden zijn erg prijzig. Maar wat is nu het exacte verschil? Om eerlijk te zijn is dat steeds minder geworden. De originele Pentium Pro had een nieuwe core en was bovendien de eerste processor met fullspeed on-die L2 cache, tot 2MB daarvan zelfs. Bij de Pentium zat het cache, maximaal 512KB, op het moederbord en draaide op de snelheid van de FSB. Ook de Pentium II bood 512KB, maar slechts op de helft van de snelheid van de processor. Verder was de Xeon de eerste processor van Intel die 64GB geheugen kon aanspreken, zestien keer zoveel dan de processors op desktops.
Dit maakte hem geschikt voor extreem zware toepassingen, waar meteen het laatste belangrijke voordeel naar boven komt drijven; de Xeon was de enige Intel chip die zich met meer dan één broertje in een systeem liet plaatsen. Door de hoge prijzen van RISC chips was de mogelijkheid om zware x86 machines te bouwen een uitkomst voor veel bedrijven. De Xeon bood verder uitgebreide ECC features en hardware-monitor functies. Ondanks de - voor een normale sterveling - hoge kosten waren de klanten erg blij met de introductie van de Xeon.
De komst van 0.18 micron Pentium III Coppermine veranderde de situatie echter, met deze core gaf Intel de thuisgebruikers voor het eerst fullspeed on-die L2 cache, een feature dat voorheen exclusief voor Xeons was. Verder bleek dat Intel voortaan onderscheid ging maken tussen lichte en zware Xeons. De lichte zijn net als Coppermine voorzien van 256KB cache en bovendien niet in staat om met meer dan twee tegelijk te werken. De voordelen van de Xeon boven de normale Pentium III werden dus minimaal en dat blijkt ook uit de huidige prijs, die dichter bij de desktops ligt dan ooit. De echt zware Xeons bestaan echter ook nog, maar het aanbod is een stuk kleiner geworden. Wil je bijvoorbeeld een 4-way systeem bouwen kon je tot voor kort alleen kiezen tussen 550 en 700MHz versies, beide alleen leverbaar met 1 of 2MB cache. De nog niet zo lang geleden aangekondigde 900MHz versie is zelfs alleen met 2MB cache te krijgen.
De strategie verandert niet veel met de komst van Foster, hoewel Intel duidelijk meer moeite heeft gedaan om de lichte versie een eigen plek te geven. Helaas gaat dat ten koste van de Pentium 4, die niet in SMP opstelling kan draaien. Wie een dual systeem wil gebaseerd op de Pentium 4 core zal dus de lichte Foster DP's moeten kopen. DP staat voor Dual Processor en dat betekent dat ze maximaal met twee tegelijk kunnen werken. Bedrijven die daarmee geen genoegen nemen moeten de zwaardere MP (Multi-processor) versies aanschaffen. Deze onderscheiden zich ook door maximaal 4MB fullspeed L3 cache.
Over de precieze hoeveelheden L2 en L3 cache van de verschillende Foster versies kunnen we slechts speculeren. We weten alleen dat de eerst beschikbare DP modellen 256KB L2 cache zullen hebben. Verder zijn de meest genoemde getallen voor de hoeveelheid L3 cache van de MP versie 512KB en 1MB. Al dit cachegeweld moet zorgen voor betere performance bij applicaties die veelvuldig met dezelfde data werken, zoals databases. Verder kan cache een deel van de latency van het systeemgeheugen verbergen, iets wat zeker bij RDRAM geen overbodige luxe is. Het originele Pentium 4 ontwerp had dan ook L3 cache, maar dit is later door hogere machten geschrapt vanwege de hoge kosten, een factor die bij serverprocessors een stuk minder zwaar weegt.
De lichte versie van Foster komt volgens de laatste geruchten uit op 8 mei, met hetzelfde frequentiebereik als de Pentium 4; van 1,3 tot en met 1,7GHz. De zwaardere modellen komen enkele maanden later en zullen in het begin slechts tot en met 1,4GHz te krijgen zijn. Er zijn op dit moment drie chipsets met ondersteuning voor vier Fosters aangekondigd; Intel 870, ServerWorks Grand Champion en IBM Summit.
Naast de mogelijkheid op meer cache en SMP werden we door een stukje PowerPoint van Intel op de hoogte gesteld van nog een interessante feature van de Foster. Op de onderstaande dia zie je dat Jackson Technology wordt genoemd, met als onderschrift "On-Chip multi-threading support". Volgens diverse bronnen is Jackson Technology een vorm van SMT.
Simultaneous Multithreading
Over Jackson Technology zijn weinig gegevens bekend en uit het mysterieuze regeltje onder de naam wordt ook niemand veel wijzer. Er is uiteraard wel speculatie over, zo beweerde men bijvoorbeeld dat Foster uit meerdere processorcores op één chip zou bestaan. Gelukkig is er ook een meer realistische verklaring voor te bedenken, in de vorm van SMT. SMT staat voor Simultaneous Multithreading en is een technologie die ervoor moet zorgen dat de execution units van de processor op alle momenten optimaal gebruikt worden. Om te begrijpen wat SMT precies is zullen we hieronder met een aantal kleine stappen ernaartoe werken. We beginnen met een schematische voorstelling van een normale processor:
De kleine vierkantjes stellen execution units voor, de onderdelen van de processor die het rauwe rekenwerk doen. Deze denkbeeldige processor heeft er vier. De tijd in kloktikken loopt van links naar rechts, om een 1GHz chip een seconde te volgen zou het plaatje ongeveer 60 miljoen keer zo groot moeten zijn, maar we beperken ons voor het gemak even tot 17Hz
. Als een execution unit op een bepaald moment wordt gebruikt is het vakje gekleurd. De verschillende kleuren stellen programma's voor, met als speciale speler het - met grijs aangegeven - operating system.
De processor is zoals je ziet in staat om meerdere instructies tegelijk uit te voeren, maar je kunt ook zien dat een programma lang niet altijd optimaal gebruik maakt van de mogelijkheden van de processor. Het besturingssysteem heeft in deze situatie de taak om tussen twee threads te wisselen. Een thread kan een programma zijn, maar een programma kan ook uit meerdere threads bestaan. Zoals je ziet wordt er eigenlijk helemaal niet aan multitasking gedaan; de processor kan maar met één programma tegelijk bezig zijn en het besturingssysteem is nodig om een andere illusie te wekken.
De bovenstaande tekening ziet er al beter uit, methode die hier wordt gebruikt heet Coarse-Grained Multithreading. Een processor die op deze manier werkt heeft altijd meerdere threads in de hardware ingeladen. Mocht de actieve thread dan bijvoorbeeld gegevens uit het systeemgeheugen nodig hebben - iets wat relatief gezien een eeuwigheid duurt - wordt tijdens het wachten aan een andere thread gewerkt. Er hoeft hiervoor geen operating system meer aan te pas te komen, waardoor het snel en efficiënt gebeurt.
Bovenstaande afbeelding heeft iets weg van de vorige, maar toch is deze methode, Fine-Grained Multithreading, iets geavanceerder. Er wordt elke kloktik van thread gewisseld, waardoor de processor een stuk makkelijker te ontwerpen is dan de vorige, waarbij in principe onbekend is wanneer van thread gewisseld moet worden. Er zijn dan ook alleen geruchten over een processor die CGM gebruikt, terwijl dit FGM al in de praktijk is toegepast. Het grote nadeel van FGM komt echter naar voren als je met één enkele thread werkt. Deze zou in dit geval maar een kwart van de processortijd kunnen gebruiken.
Hier hebben we de ultieme vorm van thread-level parallellisme te pakken, SMT. Je zou het kunnen omschrijven als een trein; kleine groepjes mensen en eenzame reizigers staan op een trein te wachten die op vaste tijdstippen langskomt. Zodra de trein er is en de deuren open gaan zoekt iedereen een plekje dat nog niet bezet is, tot niemand meer wil instappen of de trein vol is. De beschikbare bronnen van de processor worden op deze manier optimaal gebruikt, hoewel het natuurlijk afhankelijk is van de hoeveelheid threads die een processor tegelijk ingeladen kan hebben, hoeveel instructies deze nodig hebben en de verdeling van die instructies. Ondanks deze beperkingen is het verschil met het eerste plaatje enorm.
SMT heeft geen effect op de performance van programma's die uit één thread bestaan of als de threads van een programma resultaten van elkaar nodig hebben. Omdat dit wel dingen zijn waarmee rekening gehouden moet worden bij het ontwerp van de software zal SMT in het begin niet opvallend aanwezig zijn, maar Intel heeft aangegeven dat er in 2002 zo'n twintig programma's moeten zijn die volledig gebruik maken van Jackson Technology. De huidige software zal waarschijnlijk niet merkbaar beter gaan draaien op Foster, hoewel tijdens zwaar multitasken de snelheid een stuk minder zou moeten afzakken. We weten echter nog niet of Jackson Technology ook door het besturingssysteem moet worden ondersteund.
Het systeem
Zoals jullie waarschijnlijk al vermoed hadden, gezien de titels van de pagina's (ja, jullie hebben vast al gespiekt, boefjes
) en het verschijnen van dit artikel, heeft Tweakers.net de kans gekregen om eens te experimenteren met een pre-productie systeem gebaseerd op deze Intel Foster processor. Zo kwam het dat wij (Wouter Tinus en Arjan van Leeuwen) op een koude woensdag in de trein zaten, op weg naar een streng geheime locatie, waarvan we nog net mogen zeggen dat het in Europa was. In de komende pagina's zullen wij uitgebreid uitleggen wat onze ervaringen met deze nieuwe processor zijn.
Het moederbord was natuurlijk gebaseerd op de Intel 860 Colusa chipset en bood in dit geval plaats aan twee processoren. Helaas was maar één van die twee sockets gevuld, dus we kunnen nog niets zeggen over de performance van een dual Foster systeem. Dit bood ons wel een groot voordeel; de Foster was nu erg makkelijk te vergelijken met een Pentium 4 systeem op gelijke snelheid, wat we dan ook veelvuldig zullen doen in deze review. Beide processoren liepen op een snelheid van 1,5GHz en hadden 256MB PC800 RDRAM tot hun beschikking.
De Intel 860 chipset in volle glorieDe processor zelf lijkt qua uiterlijk erg op zijn kleine broertje, de Pentium 4. Op de onderstaande foto zie je de twee naast elkaar liggen (Foster links, Pentium 4 rechts). Wat onmiddellijk opvalt aan de Foster zijn de blokjes aan de zijkant van het printplaatje waar de core op zit. Helaas weten we niet wat het nut van deze dingen is, evenmin als we weten waarvoor de twee kleine IC's zijn aan de bovenkant. Het vermoeden bestaat dat het iets met voltage regulering of hardware monitoring te maken heeft, maar dat is ook slechts een gok.
Aan de andere kant van beide processoren is de nieuwe pin-layout van de Foster te zien. Wat opvalt is dat het lijkt alsof het patroon van de 603 pinnetjes een negatief is van de onderkant van de Pentium 4. Dit zou makkelijk kunnen zijn voor Intel bij het produceren van beide processoren. De weerstandjes aan de onderkant zijn ook anders geplaatst, maar de chip lijkt nog steeds veel meer op zijn desktop broertje dan de vorige Xeons.
De Foster werd in zijn taken ondersteund door een nVidia GeForce2 GTS videokaart, waar de Pentium 4 het moest doen met een ATi Radeon. Hoewel dit verschil ervoor zou kunnen zorgen dat onze vergelijking tussen de twee spaak loopt, geloven wij niet dat dat hier het geval is; de door ons uitgevoerde benchmarks hebben allen veel meer met de verschillen tussen CPU en chipset te maken, dan met verschillen in prestaties van de videokaart. Beide systemen draaiden op Windows 2000 Professional met Service Pack 1 geïnstalleerd. Het opstarten van WCPUID op de Foster computer zorgde al gelijk voor de eerste verrassing. Hoewel het hier ging om een 1,5GHz systeem, gaf de CPU namestring iets heel anders aan:
Het bleek mogelijk te zijn om de multiplier van de chip te veranderen met een speciale diskette, die ook voor de Pentium 4 zou werken. Dit vonden we natuurlijk erg interessant om te horen en we hopen dan ook snel meer informatie te krijgen over dit trucje. Helaas was deze diskette niet beschikbaar en konden wij dus niet uitproberen of deze Foster werkelijk bedoeld was voor een snelheid van 1,8GHz. Volgens de laatste berichten zou de introductie op 1,7GHz plaats moeten vinden en het ziet er dus naar uit dat dat geen enkel probleem is. Verder valt te zien dat de Foster wordt herkend als een Pentium 4 door WCPUID, hoewel dat niet in de namestring staat. Onze Foster is uitgerust met een 256KB L2 cache, dezelfde hoeveelheid als een normale Pentium 4. Dit maakt onze vergelijking natuurlijk nog interessanter. Een blik op het cache info venster van WCPUID leert ons dat de caches precies hetzelfde ingedeeld zijn als bij een huis-, tuin- en keuken Pentium 4:
Het bekijken van de chipset info geeft ons, niet geheel onverwacht, dit alarmerende venster:
Intel's eigen Frequency ID programmaatje heeft het iets beter begrepen en identificeert onze processor als een Intel Xeon. Toch krijgen we een waarschuwing dat het niet om een productie processor gaat en dat alleen Intel chips worden ondersteund.
SysMark 2000 & SiSoft Sandra
Een goede benchmark om mee te beginnen is Bapco SysMark 2000. Het goede aan deze test is dat echte programma's worden gebruikt en echte vaak voorkomende taken worden verricht. Zo wordt bijvoorbeeld PowerPoint 2000 geïnstalleerd en zet computer vervolgens aan de hand van een script in razend tempo twee presentaties in elkaar, compleet met bewegende beelden en al. In totaal worden twaalf van dit soort dingen gedaan, waarna de computer een indexcijfer krijgt. Bij een index van 100 presteert het systeem gelijk aan een Pentium II 450MHz. Helaas was ons Foster systeem nog geen final ontwerp en vertoonde het bij deze benchmark een aantal rare hikjes, waardoor de scripts niet goed werden uitgevoerd. Zelfs na een aantal pogingen en een nieuwe installatie van de benchmark weigerden bepaalde tests uitgevoerd te worden. Gelukkig doet SysMark niet al te moeilijk bij het falen van één test; de rest kan gewoon doorgaan. Dit was het resultaat:
Dit was een redelijk verrassende uitkomst, want zou je een Pentium III 1GHz met een Xeon 1GHz vergelijken zou het verschil nihil zijn, terwijl we hier gemiddeld bijna 10% sneller werken met de Foster chip. In Photoshop zien we zelfs dat Foster 23% sneller is dan de Pentium 4 met gelijke kloksnelheid. De enige software die niet sneller draait op de Xeon is Excel, maar dit zou ook veroorzaakt kunnen worden door hetzelfde probleem dat ervoor zorgde dat CorelDraw, Paradox en Word niet werkten.
| Pentium 4 | Foster | Verschil | Bryce 4 | 222 | 237 | 6,8% | CorelDraw 9 | 416 | - | - | Elastic Reality 3.1 | 211 | 235 | 11,4% | Excel 2000 | 209 | 206 | -1,4% | NaturallySpeaking Pref 4.0 | 185 | 207 | 11,9% | Netscape Communicator | 205 | 245 | 19,5% | Photoshop 5.5 | 191 | 235 | 23,0% | Paradox 9.0 | 159 | - | - | PowerPoint 2000 | 193 | 205 | 6,2% | Premiere 5.1 | 135 | 136 | 0,7% | Word 2000 | 185 | - | - | Windows Media Encoder 4.0 | 287 | 302 | 5,2% | Gemiddelde * | 204 | 223 | 9,3% |
|
* = De tests die op het Foster systeem weigerden zijn bij de weging van de Pentium 4 ook weggelaten
De volgende test op ons lijstje was SiSoft Sandra 2001. Met dit programma meten we de rauwe rekenkracht van de processor en krijgen we een indicatie van de interne en externe bandbreedte. Eerst was de CPU benchmark aan de beurt. We zien duidelijk dat Foster het beter doet dan de Pentium 4, maar niet goed genoeg om de 1,6GHz versie van de Pentium 4 voorbij te fietsen, laat staan de Athlon 1,2GHz. Ook bij de multimedia benchmark is de situatie hetzelfde:
De echte verrassing komt echter bij de geheugentest, de i850 Tehama chipset trekt in de ALU en FPU tests respectievelijk 1201 en 1216MB/s. De nieuwe Colusa chipset voor Foster blijkt echter significant sneller; deze haalt 1394 en 1457MB/s. De 860 chipset is dus bijna 18% sneller en dat verklaart meteen waarom Photoshop het systeem zo lief vond
.
FlaskMPEG & ScienceMark
Het hercoderen van MPEG2 videobeelden naar het MPEG4 DivX formaat is één van de sterke punten van de Pentium 4, waarbij ook de eigenschappen van RDRAM goed naar voren komen. Het mooie van FlaskMPEG is dat verschillende methoden van coderen gekozen kunnen worden, zodat de effecten van uitbreidingen van de instuctieset zoals MMX en SSE2 zichtbaar gemaakt kunnen worden. Gemiddeld zien we dat de performance in frames per seconde met 5% toeneemt. De verhoogde bandbreedte van de Colusa chipset speelt hierin waarschijnlijk de grootste rol. Het valt op dat SSE2 met lage kwaliteit veel trager is dan middelmatige of hoge kwaliteit. Dit lijkt echter een bug in Flask zelf zijn, aangezien het ook op het Pentium 4 systeem gebeurde. Hieronder vindt je een tabel met de behaalde resultaten en een screenshot met het record:
Nu we weten dat Foster dankzij de 860 chipset meer bandbreedte heeft en door middel van Jackson Technology beter presteert dan de Pentium 4 kunnen we nog eens kijken naar een derde methode waarmee de snelheid van de chip opgeschroefd kan worden; optimalisaties. Intel heeft altijd beweerd dat speciaal gemaakte software significant beter zal draaien op de Pentium 4. Met 'speciaal gemaakt' bedoelen we in dit geval niet in assembly geschreven SSE2 routines, maar doodsimpele compiler-instellingen. Het is een zeer kleine moeite om die te gebruiken en ze zorgen ervoor dat de code die gegenereerd wordt toegespitst is op de sterke punten van de Pentium 4 en rekening houdt met de zwakkere.
Intel is al geruime tijd aan versie 5.0 van haar compilers en performance analyser aan het werken. Deze bieden naast speciale opties voor de Pentium 4 ondersteuning voor de IA-64 architectuur. Tim Wilkens, de maker van ScienceMark, was zo vriendelijk om ons te voorzien van speciale versies van zijn benchmark, gemaakt met de laatste beta-versie van deze nieuwe compiler. ScienceMark is een wetenschappelijke benchmark. Wat er precies gedaan wordt met de virtuele vloeibare Argon moleculen is ons niet helemaal duidelijk, maar dat is dan ook niet van levensbelang. Het feit dat een 1,5GHz Pentium 4 bijna twee minuten zoet is met het rekenwerk zegt genoeg over de complexiteit van de handelingen. De geoptimaliseerde executables verrassen ons echter positief:
We zien hier helemaal links het resultaat van de normale executable, die vrij te downloaden is. QxW en QaxW zijn geoptimaliseerde versies, gecompileerd door de laatste beta van de Intel 5.0 compiler. Ondanks het feit dat de broncode van de drie programma's exact gelijk is en ze dus allemaal hetzelfde werk verrichten zijn de geoptimaliseerde versies bijna twee keer zo snel klaar. Een snelheidswinst van bijna 100% door een simpele recompile belooft veel goeds voor de toekomst van de Pentium 4, maar helaas is het niet alleen maar rozegeur en maneschijn:
Dit moet pijn doen. Ondanks de geweldige resultaten van de compiler bij de ene test lijdt de tweede test zwaar. Het effect is hier zelfs omgedraaid, QaxW en QxW zijn bijna twee keer zo traag als de originele versie, die de Pentium III is geoptimaliseerd. De verklaring hiervoor is dat ScienceMark voor een compiler een erg raar programma is, met constructies die normaalgesproken zeer zelden voorkomen. Tim Wilkens werkt samen met Intel aan het verbeteren van de performance en het fixen van bugs. Hoewel een zeer recent uitgebrachte versie al beter werkt was de versie ten tijde van testen slechts in staat om twee van de vier belangrijke tests te compileren. Dat is ook de reden dat het originele programma een veel beter eindresultaat heeft als de geoptimaliseerde versies; deze missen een aantal tests:
 * = Ontbrekende tests veroorzaken lagere score |
De compiler is dus nog verre van af, maar heeft bewezen dat zeer indrukwekkende resultaten mogelijk zijn. Hoewel allerdaagse applicaties waarschijnlijk niet de enorme snelheidswinsten die bovenste grafiek van ScienceMark laat zien zullen halen is het verschil waarschijnlijk duidelijk te merken. Mensen die bang zijn dat optimalisatie voor de Pentium 4 hun Pentium III of Athlon systeem trager zal maken hoeven zich niet al te veel zorgen te maken. Hoewel QxW onmiddelijk crasht laat QaxW gelijksoortige performance-effecten zien als op de Pentium 4, alleen minder extreem. Bovendien heeft de compiler ook de mogelijkheid om voor de Athlon te optimaliseren.
Conclusie
Voor zover wij kunnen beoordelen is Foster een stap in de goede richting van de Xeon. Intel heeft duidelijk geleerd van de fouten die ten tijde van de Pentium III zijn gemaakt en heeft voor de nieuwe generatie Xeons een eigen plaats op de markt gecreëerd. Door de dual-processor mogelijkheden van de desktop chip af te nemen worden high-end workstations op de Xeon aangewezen, waardoor hij in grotere aantallen dan ooit over de toonbank geschoven zal worden. Hoewel de Foster uiteraard duurder dan de Pentium 4 zal zijn worden die extra centjes deels gerechtvaardigd door Jackson Technology en de snellere i860 chipset. Deze rechtvaardiging is ver te zoeken bij de huidige generatie. De verbeteringen van de Xeon boven de Pentium 4 zijn duidelijk aanwezig, maar we zijn er vrij zeker van dat deze in de toekomst een nog grotere rol gaan spelen, zeker als veelgebruikte serversoftware ervoor geoptimaliseerd wordt.
Wat de exacte prijs van de nieuwe Xeon zal zijn is nog niet bekend, maar omdat de prijs van de Pentium 4 op dit moment zo hard omlaag gaat is het goed mogelijk dat hij zodra hij uitkomt voor evenveel geld de deur uit gaat als de Pentium 4 op dit moment. Met grote namen als SuperMicro, Iwill en Tyan achter de moederborden zal het niet moeilijk zijn om bijvoorbeeld aantrekkelijke CAD/CAM workstations te bouwen gebaseerd op twee Fosters. Dit brengt ons meteen op een ander punt, want er is nog een bedrijf dat binnenkort een product introduceert voor dat soort toepassingen.
De AMD 760MP chipset zal tegelijk met de Palomino uitkomen, waarschijnlijk nog voor Foster en i860. Het is te verwachten dat een systeem met twee Palomino processors goedkoper is dan een dual Foster bak. Bovendien heeft Palomino ook verbeteringen aan de core ondergaan en zal dus procentueel iets beter presteren dan de huidige Athlon. De keuze van moederborden en chipsets aan de kant van Intel is echter groter en de grote bedrijven die nieuwkomers als AMD wantrouwen zullen ook niet in het voordeel van Palomino werken. AMD heeft bovendien nog lang niet de schaalbaarheid van Intel. Het ontwerpen van dual Socket A moederborden is al een lastige taak door de point-to-point bus, laat staan met twee of vier keer zoveel processors. We vragen ons nog steeds af wat de 760MPX chipset is, maar we weten ook dat Intel niet stil zit. Bovendien zijn er nog geen plannen bekend van AMD om een Athlon met grotere caches uit te brengen voor servers.
De toekomst van Foster bestaat onder andere uit de 870 chipset van Intel. Met deze chipset kunnen systemen gebouwd worden die uit maximaal 512 processors bestaan, in subclusters van vier. Deze chipset ondersteunt zowel DDR SDRAM als RDRAM. Rond dezelfde tijd dat Pentium 4 de Northwood core krijgt zal ook Foster een nieuw 0.13 micron jasje krijgen. Deze Prestonia core wordt tegelijk uitgebracht met de Plumas DDR chipset.
Natuurlijk gaat er een heleboel karma en dank richting onze anonieme bron, die ons met gevaar voor eigen leven geheel belangeloos naar dit systeem wilde brengen
. Thanks a lot and keep up the good work
.