Door Wouter Tinus

Intel Foster sneak preview

Inleiding

Foster sneak preview aankondiging

English visitors: For your convenience, a translation has been made, which can be read here.

Het eerste woord dat bij mensen te binnen schiet als iemand het woord "Intel" roept is "Pentium". Deze twee begrippen zijn in de loop der jaren zo aan elkaar verwant geraakt dat de gemiddelde leek niet eens meer weet wat het verschil is. Maar zoals het publiek hier ongetwijfeld wel weet doet Intel veel meer dan alleen chips voor desktops ontwerpen en produceren. Een groot deel van de winst van het bedrijf komt uit de servermarkt. De klanten die zichzelf tot deze doelgroep kunnen rekenen zijn niet in grote getallen aanwezig, over het algemeen praten we alleen over grote bedrijven en zelfs die hebben niet op elk bureau een server staan, waardoor de markt kwantitatief niet erg groot is. Hetgeen dat de servermarkt aantrekkelijk maakt zijn de klanten, die zeer hoge eisen aan de producten die ze kopen stellen en bereid zijn grof geld neer te tellen om te krijgen wat ze willen. Dat is één van de redenen waarom bedrijven als AMD zo graag willen binnenkomen in dit marktsegment, er is heel erg veel geld aan te verdienen. Zo veel zelfs, dat bedrijven als Compaq en IBM alleen maar aan serverprocessors doen.

Wat "Pentium" voor de thuisgebruikers betekent is "Xeon" voor de servermarkt. Na de originele Pentium chip ontwierp Intel een nieuwe core, maar deze bleek niet erg geschikt om oude software op te draaien. Daarom werd hij in de herfst van 1995 Pentium Pro gedoopt en gericht op servers. Tot dusver geen problemen, maar toen ongeveer twee jaar later de Pentium II uitkwam veranderde dat. Hoewel de verpakking anders was en het kleinere cache een stuk trager gebruikte de nieuwe desktopchip precies dezelfde technologie als de serverchip. Het bedrijf besloot daarom een groter onderscheid tussen de twee chips te maken door de nieuwere Slot 2 versies van de Pentium Pro voortaan Xeon te noemen. Het is echter altijd gebruikelijk gebleven om de naam van de desktopprocessor op welke hij het meeste lijkt erbij te noemen. Inmiddels zijn de Xeon processors voorzien van een core die het meest op de Pentium III lijkt en is de maximale snelheid 1GHz.


zonsondergang@foster.river
(Foto: Rick)

De toekomst van de serverserie ligt net als zes jaar geleden in de handen van een nieuwe core; Itanium. De verschillen tussen de x86 IA-32 architectuur en de EPIC IA-64 filosofie zijn echter zo groot dat een overstap in één keer simpelweg onmogelijk is. Uit onze vorige sneak preview is gebleken dat de Itanium niet bepaald goed is in het emuleren van zijn voorgangers, er is dus speciaal geschreven software nodig om gebruik te maken van de nieuwe generatie, iets wat bij de stap van Pentium naar Pentium Pro niet zo zeer vereist werd. Bovendien zullen de 64 bit processors in het begin zelfs voor high-end begrippen duur zijn. Intel blijft daarom nog een aantal jaar doorgaan met het ontwikkelen van serverchips gebaseerd op de oude vertrouwde x86 architectuur. De enige logische manier om de Xeon verder op te krikken is het gebruiken van de Pentium 4 core en dat is dan ook precies waar Intel al een tijdje mee bezig is. Onder de codenaam "Foster" werkt het bedrijf al een tijdje aan de volgende generatie Xeons.

Foster is zoals gezegd gebaseerd op de Pentium 4, maar kan zoals altijd met Xeons niet gebruikt worden op dezelfde moederborden als zijn desktopneefje. Men heeft voor een Socket 603 interface gekozen en de bijbehorende chipset is i860 Colusa, welke maximaal twee processors ondersteunt en werkt met Rambus geheugen. De officiële presentatie van Foster vindt pas over een aantal dagen plaats, tot dan kunnen we dus niet veel zeggen over eventuele nieuwe features van de nieuwe Xeon. Wel kunnen je op de volgende pagina's lezen wat we op grond van de historie en uitgelekte feiten kunnen verwachten.

Waarom Xeon?

Een blik in de pricewatch leert ons dat Xeon duidelijk duurder is dan de Pentium III en ook de Slot 2 moederborden zijn erg prijzig. Maar wat is nu het exacte verschil? Om eerlijk te zijn is dat steeds minder geworden. De originele Pentium Pro had een nieuwe core en was bovendien de eerste processor met fullspeed on-die L2 cache, tot 2MB daarvan zelfs. Bij de Pentium zat het cache, maximaal 512KB, op het moederbord en draaide op de snelheid van de FSB. Ook de Pentium II bood 512KB, maar slechts op de helft van de snelheid van de processor. Verder was de Xeon de eerste processor van Intel die 64GB geheugen kon aanspreken, zestien keer zoveel dan de processors op desktops.

Dit maakte hem geschikt voor extreem zware toepassingen, waar meteen het laatste belangrijke voordeel naar boven komt drijven; de Xeon was de enige Intel chip die zich met meer dan één broertje in een systeem liet plaatsen. Door de hoge prijzen van RISC chips was de mogelijkheid om zware x86 machines te bouwen een uitkomst voor veel bedrijven. De Xeon bood verder uitgebreide ECC features en hardware-monitor functies. Ondanks de - voor een normale sterveling - hoge kosten waren de klanten erg blij met de introductie van de Xeon.

De komst van 0.18 micron Pentium III Coppermine veranderde de situatie echter, met deze core gaf Intel de thuisgebruikers voor het eerst fullspeed on-die L2 cache, een feature dat voorheen exclusief voor Xeons was. Verder bleek dat Intel voortaan onderscheid ging maken tussen lichte en zware Xeons. De lichte zijn net als Coppermine voorzien van 256KB cache en bovendien niet in staat om met meer dan twee tegelijk te werken. De voordelen van de Xeon boven de normale Pentium III werden dus minimaal en dat blijkt ook uit de huidige prijs, die dichter bij de desktops ligt dan ooit. De echt zware Xeons bestaan echter ook nog, maar het aanbod is een stuk kleiner geworden. Wil je bijvoorbeeld een 4-way systeem bouwen kon je tot voor kort alleen kiezen tussen 550 en 700MHz versies, beide alleen leverbaar met 1 of 2MB cache. De nog niet zo lang geleden aangekondigde 900MHz versie is zelfs alleen met 2MB cache te krijgen.

De strategie verandert niet veel met de komst van Foster, hoewel Intel duidelijk meer moeite heeft gedaan om de lichte versie een eigen plek te geven. Helaas gaat dat ten koste van de Pentium 4, die niet in SMP opstelling kan draaien. Wie een dual systeem wil gebaseerd op de Pentium 4 core zal dus de lichte Foster DP's moeten kopen. DP staat voor Dual Processor en dat betekent dat ze maximaal met twee tegelijk kunnen werken. Bedrijven die daarmee geen genoegen nemen moeten de zwaardere MP (Multi-processor) versies aanschaffen. Deze onderscheiden zich ook door maximaal 4MB fullspeed L3 cache.

Over de precieze hoeveelheden L2 en L3 cache van de verschillende Foster versies kunnen we slechts speculeren. We weten alleen dat de eerst beschikbare DP modellen 256KB L2 cache zullen hebben. Verder zijn de meest genoemde getallen voor de hoeveelheid L3 cache van de MP versie 512KB en 1MB. Al dit cachegeweld moet zorgen voor betere performance bij applicaties die veelvuldig met dezelfde data werken, zoals databases. Verder kan cache een deel van de latency van het systeemgeheugen verbergen, iets wat zeker bij RDRAM geen overbodige luxe is. Het originele Pentium 4 ontwerp had dan ook L3 cache, maar dit is later door hogere machten geschrapt vanwege de hoge kosten, een factor die bij serverprocessors een stuk minder zwaar weegt.

De lichte versie van Foster komt volgens de laatste geruchten uit op 8 mei, met hetzelfde frequentiebereik als de Pentium 4; van 1,3 tot en met 1,7GHz. De zwaardere modellen komen enkele maanden later en zullen in het begin slechts tot en met 1,4GHz te krijgen zijn. Er zijn op dit moment drie chipsets met ondersteuning voor vier Fosters aangekondigd; Intel 870, ServerWorks Grand Champion en IBM Summit.

Naast de mogelijkheid op meer cache en SMP werden we door een stukje PowerPoint van Intel op de hoogte gesteld van nog een interessante feature van de Foster. Op de onderstaande dia zie je dat Jackson Technology wordt genoemd, met als onderschrift "On-Chip multi-threading support". Volgens diverse bronnen is Jackson Technology een vorm van SMT.

Simultaneous Multithreading

Over Jackson Technology zijn weinig gegevens bekend en uit het mysterieuze regeltje onder de naam wordt ook niemand veel wijzer. Er is uiteraard wel speculatie over, zo beweerde men bijvoorbeeld dat Foster uit meerdere processorcores op één chip zou bestaan. Gelukkig is er ook een meer realistische verklaring voor te bedenken, in de vorm van SMT. SMT staat voor Simultaneous Multithreading en is een technologie die ervoor moet zorgen dat de execution units van de processor op alle momenten optimaal gebruikt worden. Om te begrijpen wat SMT precies is zullen we hieronder met een aantal kleine stappen ernaartoe werken. We beginnen met een schematische voorstelling van een normale processor:

Foster - SMT uitleg - normaal

De kleine vierkantjes stellen execution units voor, de onderdelen van de processor die het rauwe rekenwerk doen. Deze denkbeeldige processor heeft er vier. De tijd in kloktikken loopt van links naar rechts, om een 1GHz chip een seconde te volgen zou het plaatje ongeveer 60 miljoen keer zo groot moeten zijn, maar we beperken ons voor het gemak even tot 17Hz . Als een execution unit op een bepaald moment wordt gebruikt is het vakje gekleurd. De verschillende kleuren stellen programma's voor, met als speciale speler het - met grijs aangegeven - operating system.

De processor is zoals je ziet in staat om meerdere instructies tegelijk uit te voeren, maar je kunt ook zien dat een programma lang niet altijd optimaal gebruik maakt van de mogelijkheden van de processor. Het besturingssysteem heeft in deze situatie de taak om tussen twee threads te wisselen. Een thread kan een programma zijn, maar een programma kan ook uit meerdere threads bestaan. Zoals je ziet wordt er eigenlijk helemaal niet aan multitasking gedaan; de processor kan maar met één programma tegelijk bezig zijn en het besturingssysteem is nodig om een andere illusie te wekken.

Foster - SMT uitleg - CMG

De bovenstaande tekening ziet er al beter uit, methode die hier wordt gebruikt heet Coarse-Grained Multithreading. Een processor die op deze manier werkt heeft altijd meerdere threads in de hardware ingeladen. Mocht de actieve thread dan bijvoorbeeld gegevens uit het systeemgeheugen nodig hebben - iets wat relatief gezien een eeuwigheid duurt - wordt tijdens het wachten aan een andere thread gewerkt. Er hoeft hiervoor geen operating system meer aan te pas te komen, waardoor het snel en efficiënt gebeurt.

Foster - SMT uitleg - FGM

Bovenstaande afbeelding heeft iets weg van de vorige, maar toch is deze methode, Fine-Grained Multithreading, iets geavanceerder. Er wordt elke kloktik van thread gewisseld, waardoor de processor een stuk makkelijker te ontwerpen is dan de vorige, waarbij in principe onbekend is wanneer van thread gewisseld moet worden. Er zijn dan ook alleen geruchten over een processor die CGM gebruikt, terwijl dit FGM al in de praktijk is toegepast. Het grote nadeel van FGM komt echter naar voren als je met één enkele thread werkt. Deze zou in dit geval maar een kwart van de processortijd kunnen gebruiken.

Foster - SMT uitleg - SMT

Hier hebben we de ultieme vorm van thread-level parallellisme te pakken, SMT. Je zou het kunnen omschrijven als een trein; kleine groepjes mensen en eenzame reizigers staan op een trein te wachten die op vaste tijdstippen langskomt. Zodra de trein er is en de deuren open gaan zoekt iedereen een plekje dat nog niet bezet is, tot niemand meer wil instappen of de trein vol is. De beschikbare bronnen van de processor worden op deze manier optimaal gebruikt, hoewel het natuurlijk afhankelijk is van de hoeveelheid threads die een processor tegelijk ingeladen kan hebben, hoeveel instructies deze nodig hebben en de verdeling van die instructies. Ondanks deze beperkingen is het verschil met het eerste plaatje enorm.

SMT heeft geen effect op de performance van programma's die uit één thread bestaan of als de threads van een programma resultaten van elkaar nodig hebben. Omdat dit wel dingen zijn waarmee rekening gehouden moet worden bij het ontwerp van de software zal SMT in het begin niet opvallend aanwezig zijn, maar Intel heeft aangegeven dat er in 2002 zo'n twintig programma's moeten zijn die volledig gebruik maken van Jackson Technology. De huidige software zal waarschijnlijk niet merkbaar beter gaan draaien op Foster, hoewel tijdens zwaar multitasken de snelheid een stuk minder zou moeten afzakken. We weten echter nog niet of Jackson Technology ook door het besturingssysteem moet worden ondersteund.

Het systeem

Zoals jullie waarschijnlijk al vermoed hadden, gezien de titels van de pagina's (ja, jullie hebben vast al gespiekt, boefjes ) en het verschijnen van dit artikel, heeft Tweakers.net de kans gekregen om eens te experimenteren met een pre-productie systeem gebaseerd op deze Intel Foster processor. Zo kwam het dat wij (Wouter Tinus en Arjan van Leeuwen) op een koude woensdag in de trein zaten, op weg naar een streng geheime locatie, waarvan we nog net mogen zeggen dat het in Europa was. In de komende pagina's zullen wij uitgebreid uitleggen wat onze ervaringen met deze nieuwe processor zijn.

Het moederbord was natuurlijk gebaseerd op de Intel 860 Colusa chipset en bood in dit geval plaats aan twee processoren. Helaas was maar één van die twee sockets gevuld, dus we kunnen nog niets zeggen over de performance van een dual Foster systeem. Dit bood ons wel een groot voordeel; de Foster was nu erg makkelijk te vergelijken met een Pentium 4 systeem op gelijke snelheid, wat we dan ook veelvuldig zullen doen in deze review. Beide processoren liepen op een snelheid van 1,5GHz en hadden 256MB PC800 RDRAM tot hun beschikking.

De Intel 860 chipset in volle glorie

De processor zelf lijkt qua uiterlijk erg op zijn kleine broertje, de Pentium 4. Op de onderstaande foto zie je de twee naast elkaar liggen (Foster links, Pentium 4 rechts). Wat onmiddellijk opvalt aan de Foster zijn de blokjes aan de zijkant van het printplaatje waar de core op zit. Helaas weten we niet wat het nut van deze dingen is, evenmin als we weten waarvoor de twee kleine IC's zijn aan de bovenkant. Het vermoeden bestaat dat het iets met voltage regulering of hardware monitoring te maken heeft, maar dat is ook slechts een gok.

Aan de andere kant van beide processoren is de nieuwe pin-layout van de Foster te zien. Wat opvalt is dat het lijkt alsof het patroon van de 603 pinnetjes een negatief is van de onderkant van de Pentium 4. Dit zou makkelijk kunnen zijn voor Intel bij het produceren van beide processoren. De weerstandjes aan de onderkant zijn ook anders geplaatst, maar de chip lijkt nog steeds veel meer op zijn desktop broertje dan de vorige Xeons.

De Foster werd in zijn taken ondersteund door een nVidia GeForce2 GTS videokaart, waar de Pentium 4 het moest doen met een ATi Radeon. Hoewel dit verschil ervoor zou kunnen zorgen dat onze vergelijking tussen de twee spaak loopt, geloven wij niet dat dat hier het geval is; de door ons uitgevoerde benchmarks hebben allen veel meer met de verschillen tussen CPU en chipset te maken, dan met verschillen in prestaties van de videokaart. Beide systemen draaiden op Windows 2000 Professional met Service Pack 1 geïnstalleerd. Het opstarten van WCPUID op de Foster computer zorgde al gelijk voor de eerste verrassing. Hoewel het hier ging om een 1,5GHz systeem, gaf de CPU namestring iets heel anders aan:

Het bleek mogelijk te zijn om de multiplier van de chip te veranderen met een speciale diskette, die ook voor de Pentium 4 zou werken. Dit vonden we natuurlijk erg interessant om te horen en we hopen dan ook snel meer informatie te krijgen over dit trucje. Helaas was deze diskette niet beschikbaar en konden wij dus niet uitproberen of deze Foster werkelijk bedoeld was voor een snelheid van 1,8GHz. Volgens de laatste berichten zou de introductie op 1,7GHz plaats moeten vinden en het ziet er dus naar uit dat dat geen enkel probleem is. Verder valt te zien dat de Foster wordt herkend als een Pentium 4 door WCPUID, hoewel dat niet in de namestring staat. Onze Foster is uitgerust met een 256KB L2 cache, dezelfde hoeveelheid als een normale Pentium 4. Dit maakt onze vergelijking natuurlijk nog interessanter. Een blik op het cache info venster van WCPUID leert ons dat de caches precies hetzelfde ingedeeld zijn als bij een huis-, tuin- en keuken Pentium 4:

Het bekijken van de chipset info geeft ons, niet geheel onverwacht, dit alarmerende venster:

Intel's eigen Frequency ID programmaatje heeft het iets beter begrepen en identificeert onze processor als een Intel Xeon. Toch krijgen we een waarschuwing dat het niet om een productie processor gaat en dat alleen Intel chips worden ondersteund.

Meer WCPUID en Intel FID screenshots
WCPUID main
WCPUID chipset information
WCPUID cache information
WCPUID feature flags
Intel FID Frequency test
Intel FID CPUID Data

SysMark 2000 & SiSoft Sandra

Een goede benchmark om mee te beginnen is Bapco SysMark 2000. Het goede aan deze test is dat echte programma's worden gebruikt en echte vaak voorkomende taken worden verricht. Zo wordt bijvoorbeeld PowerPoint 2000 geïnstalleerd en zet computer vervolgens aan de hand van een script in razend tempo twee presentaties in elkaar, compleet met bewegende beelden en al. In totaal worden twaalf van dit soort dingen gedaan, waarna de computer een indexcijfer krijgt. Bij een index van 100 presteert het systeem gelijk aan een Pentium II 450MHz. Helaas was ons Foster systeem nog geen final ontwerp en vertoonde het bij deze benchmark een aantal rare hikjes, waardoor de scripts niet goed werden uitgevoerd. Zelfs na een aantal pogingen en een nieuwe installatie van de benchmark weigerden bepaalde tests uitgevoerd te worden. Gelukkig doet SysMark niet al te moeilijk bij het falen van één test; de rest kan gewoon doorgaan. Dit was het resultaat:

Dit was een redelijk verrassende uitkomst, want zou je een Pentium III 1GHz met een Xeon 1GHz vergelijken zou het verschil nihil zijn, terwijl we hier gemiddeld bijna 10% sneller werken met de Foster chip. In Photoshop zien we zelfs dat Foster 23% sneller is dan de Pentium 4 met gelijke kloksnelheid. De enige software die niet sneller draait op de Xeon is Excel, maar dit zou ook veroorzaakt kunnen worden door hetzelfde probleem dat ervoor zorgde dat CorelDraw, Paradox en Word niet werkten.

Pentium 4
Foster
Verschil
Bryce 42222376,8%
CorelDraw 9416--
Elastic Reality 3.121123511,4%
Excel 2000209206-1,4%
NaturallySpeaking Pref 4.018520711,9%
Netscape Communicator20524519,5%
Photoshop 5.519123523,0%
Paradox 9.0159--
PowerPoint 20001932056,2%
Premiere 5.11351360,7%
Word 2000185--
Windows Media Encoder 4.02873025,2%
Gemiddelde *2042239,3%
* = De tests die op het Foster systeem weigerden zijn bij de weging van de Pentium 4 ook weggelaten

De volgende test op ons lijstje was SiSoft Sandra 2001. Met dit programma meten we de rauwe rekenkracht van de processor en krijgen we een indicatie van de interne en externe bandbreedte. Eerst was de CPU benchmark aan de beurt. We zien duidelijk dat Foster het beter doet dan de Pentium 4, maar niet goed genoeg om de 1,6GHz versie van de Pentium 4 voorbij te fietsen, laat staan de Athlon 1,2GHz. Ook bij de multimedia benchmark is de situatie hetzelfde:

De echte verrassing komt echter bij de geheugentest, de i850 Tehama chipset trekt in de ALU en FPU tests respectievelijk 1201 en 1216MB/s. De nieuwe Colusa chipset voor Foster blijkt echter significant sneller; deze haalt 1394 en 1457MB/s. De 860 chipset is dus bijna 18% sneller en dat verklaart meteen waarom Photoshop het systeem zo lief vond .

FlaskMPEG & ScienceMark

Het hercoderen van MPEG2 videobeelden naar het MPEG4 DivX formaat is één van de sterke punten van de Pentium 4, waarbij ook de eigenschappen van RDRAM goed naar voren komen. Het mooie van FlaskMPEG is dat verschillende methoden van coderen gekozen kunnen worden, zodat de effecten van uitbreidingen van de instuctieset zoals MMX en SSE2 zichtbaar gemaakt kunnen worden. Gemiddeld zien we dat de performance in frames per seconde met 5% toeneemt. De verhoogde bandbreedte van de Colusa chipset speelt hierin waarschijnlijk de grootste rol. Het valt op dat SSE2 met lage kwaliteit veel trager is dan middelmatige of hoge kwaliteit. Dit lijkt echter een bug in Flask zelf zijn, aangezien het ook op het Pentium 4 systeem gebeurde. Hieronder vindt je een tabel met de behaalde resultaten en een screenshot met het record:

Nu we weten dat Foster dankzij de 860 chipset meer bandbreedte heeft en door middel van Jackson Technology beter presteert dan de Pentium 4 kunnen we nog eens kijken naar een derde methode waarmee de snelheid van de chip opgeschroefd kan worden; optimalisaties. Intel heeft altijd beweerd dat speciaal gemaakte software significant beter zal draaien op de Pentium 4. Met 'speciaal gemaakt' bedoelen we in dit geval niet in assembly geschreven SSE2 routines, maar doodsimpele compiler-instellingen. Het is een zeer kleine moeite om die te gebruiken en ze zorgen ervoor dat de code die gegenereerd wordt toegespitst is op de sterke punten van de Pentium 4 en rekening houdt met de zwakkere.

Intel is al geruime tijd aan versie 5.0 van haar compilers en performance analyser aan het werken. Deze bieden naast speciale opties voor de Pentium 4 ondersteuning voor de IA-64 architectuur. Tim Wilkens, de maker van ScienceMark, was zo vriendelijk om ons te voorzien van speciale versies van zijn benchmark, gemaakt met de laatste beta-versie van deze nieuwe compiler. ScienceMark is een wetenschappelijke benchmark. Wat er precies gedaan wordt met de virtuele vloeibare Argon moleculen is ons niet helemaal duidelijk, maar dat is dan ook niet van levensbelang. Het feit dat een 1,5GHz Pentium 4 bijna twee minuten zoet is met het rekenwerk zegt genoeg over de complexiteit van de handelingen. De geoptimaliseerde executables verrassen ons echter positief:

We zien hier helemaal links het resultaat van de normale executable, die vrij te downloaden is. QxW en QaxW zijn geoptimaliseerde versies, gecompileerd door de laatste beta van de Intel 5.0 compiler. Ondanks het feit dat de broncode van de drie programma's exact gelijk is en ze dus allemaal hetzelfde werk verrichten zijn de geoptimaliseerde versies bijna twee keer zo snel klaar. Een snelheidswinst van bijna 100% door een simpele recompile belooft veel goeds voor de toekomst van de Pentium 4, maar helaas is het niet alleen maar rozegeur en maneschijn:

Dit moet pijn doen. Ondanks de geweldige resultaten van de compiler bij de ene test lijdt de tweede test zwaar. Het effect is hier zelfs omgedraaid, QaxW en QxW zijn bijna twee keer zo traag als de originele versie, die de Pentium III is geoptimaliseerd. De verklaring hiervoor is dat ScienceMark voor een compiler een erg raar programma is, met constructies die normaalgesproken zeer zelden voorkomen. Tim Wilkens werkt samen met Intel aan het verbeteren van de performance en het fixen van bugs. Hoewel een zeer recent uitgebrachte versie al beter werkt was de versie ten tijde van testen slechts in staat om twee van de vier belangrijke tests te compileren. Dat is ook de reden dat het originele programma een veel beter eindresultaat heeft als de geoptimaliseerde versies; deze missen een aantal tests:

* = Ontbrekende tests veroorzaken lagere score

De compiler is dus nog verre van af, maar heeft bewezen dat zeer indrukwekkende resultaten mogelijk zijn. Hoewel allerdaagse applicaties waarschijnlijk niet de enorme snelheidswinsten die bovenste grafiek van ScienceMark laat zien zullen halen is het verschil waarschijnlijk duidelijk te merken. Mensen die bang zijn dat optimalisatie voor de Pentium 4 hun Pentium III of Athlon systeem trager zal maken hoeven zich niet al te veel zorgen te maken. Hoewel QxW onmiddelijk crasht laat QaxW gelijksoortige performance-effecten zien als op de Pentium 4, alleen minder extreem. Bovendien heeft de compiler ook de mogelijkheid om voor de Athlon te optimaliseren.

Conclusie

Voor zover wij kunnen beoordelen is Foster een stap in de goede richting van de Xeon. Intel heeft duidelijk geleerd van de fouten die ten tijde van de Pentium III zijn gemaakt en heeft voor de nieuwe generatie Xeons een eigen plaats op de markt gecreëerd. Door de dual-processor mogelijkheden van de desktop chip af te nemen worden high-end workstations op de Xeon aangewezen, waardoor hij in grotere aantallen dan ooit over de toonbank geschoven zal worden. Hoewel de Foster uiteraard duurder dan de Pentium 4 zal zijn worden die extra centjes deels gerechtvaardigd door Jackson Technology en de snellere i860 chipset. Deze rechtvaardiging is ver te zoeken bij de huidige generatie. De verbeteringen van de Xeon boven de Pentium 4 zijn duidelijk aanwezig, maar we zijn er vrij zeker van dat deze in de toekomst een nog grotere rol gaan spelen, zeker als veelgebruikte serversoftware ervoor geoptimaliseerd wordt.

Wat de exacte prijs van de nieuwe Xeon zal zijn is nog niet bekend, maar omdat de prijs van de Pentium 4 op dit moment zo hard omlaag gaat is het goed mogelijk dat hij zodra hij uitkomt voor evenveel geld de deur uit gaat als de Pentium 4 op dit moment. Met grote namen als SuperMicro, Iwill en Tyan achter de moederborden zal het niet moeilijk zijn om bijvoorbeeld aantrekkelijke CAD/CAM workstations te bouwen gebaseerd op twee Fosters. Dit brengt ons meteen op een ander punt, want er is nog een bedrijf dat binnenkort een product introduceert voor dat soort toepassingen.

De AMD 760MP chipset zal tegelijk met de Palomino uitkomen, waarschijnlijk nog voor Foster en i860. Het is te verwachten dat een systeem met twee Palomino processors goedkoper is dan een dual Foster bak. Bovendien heeft Palomino ook verbeteringen aan de core ondergaan en zal dus procentueel iets beter presteren dan de huidige Athlon. De keuze van moederborden en chipsets aan de kant van Intel is echter groter en de grote bedrijven die nieuwkomers als AMD wantrouwen zullen ook niet in het voordeel van Palomino werken. AMD heeft bovendien nog lang niet de schaalbaarheid van Intel. Het ontwerpen van dual Socket A moederborden is al een lastige taak door de point-to-point bus, laat staan met twee of vier keer zoveel processors. We vragen ons nog steeds af wat de 760MPX chipset is, maar we weten ook dat Intel niet stil zit. Bovendien zijn er nog geen plannen bekend van AMD om een Athlon met grotere caches uit te brengen voor servers.

De toekomst van Foster bestaat onder andere uit de 870 chipset van Intel. Met deze chipset kunnen systemen gebouwd worden die uit maximaal 512 processors bestaan, in subclusters van vier. Deze chipset ondersteunt zowel DDR SDRAM als RDRAM. Rond dezelfde tijd dat Pentium 4 de Northwood core krijgt zal ook Foster een nieuw 0.13 micron jasje krijgen. Deze Prestonia core wordt tegelijk uitgebracht met de Plumas DDR chipset.

Natuurlijk gaat er een heleboel karma en dank richting onze anonieme bron, die ons met gevaar voor eigen leven geheel belangeloos naar dit systeem wilde brengen . Thanks a lot and keep up the good work .

Reacties (43)

Wijzig sortering
Anoniem: 20674
23 april 2001 20:40
And again by IA-64 :+

Graag gedaan jongens, en veel plezier met jullie toekomstige aankoopplannen.... ;)

Wouter Bedankt ;)
Bravo en proficiat met deze primeur! Goed verhaal Wouter :). Dit moet natuurlijk ook in het engels vertaald en geplaatst worden. Ik durf alleen niet te denken aan wat daarvan de consequenties zullen zijn voor T.nets server, als de halve hardware wereld zich daar op storten gaat :P.

Ik krijg bijna een 'erection' van die 'Jackson' :D (ieder verband met bestaande artiesten of T.net/GoT users berust op louter toeval }>). Hopelijk zullen bepaalde applicaties (ik denk hierbij persoonlijk graag aan het renderen in 3ds Max) die multithreading ondersteunen, er ook al voordeel bij hebben zónder dat ze daarvoor speciaal aangepast zijn. Jammer dat daar nog geen voorbeelden en benches van zijn. Die compiler optimalisaties zien er ook veelbelovend uit. Bijna 100% extra snelheid en de i860 chipset met Xeon doet het ook nog's 10% sneller dan i850 met P4 Willamette. Kun je nagaan wat er kan gebeuren als je een applicatie hierop gaat draaien die én gecompiled is én SMT ondersteunt :P.

Nou maar afwachten of het prijsverschil met P4 niet al te groot wordt. Uit de prijsvergelijking PIII met PIII Xeon valt niet iets consistents te halen. Alle PIII Xeon 256KB kosten bijna allemaal hetzelfde, ongeacht de frequentie: ong. f 1.300,- tot f 1.400,-. De PIII's lopen op dit moment uiteen (van 600MHz tot 1GHz) van f 400,- tot f 700,-.
__________________________________
Update: Ik zie net dat dit artikel ookal in het engels is neergegooid :). Well done! Succes ermee en maak je borst maar nat, want t.net gaat nu waarschijnlijk plat :D.
:(

;)


edit:

0 Overbodig? niveau 1 lijkt me netjes voor deze posting. Of je ziet de relatie met bovenstaand bericht niet, of je hebt geen gevoel voor humor.. :)
Naast de mogelijkheid op meer cache en SMP werden we door een stukje PowerPoint van Intel op de hoogte gesteld van nog een interessante feature van de Foster. Op de onderstaande dia zie je dat Jackson Technology wordt genoemd, met als onderschrift "On-Chip multi-threading support". Volgens diverse bronnen is Jackson Technology een vorm van SMT.
Helaas, achterhaald door de meest recente nieuwsberichten: http://www.tweakers.net/nieuws/16666

" Géén Jackson technologie in Foster processor "

Maar verder feliciaties voor deze mooie primeur!
Precies, misschien een ideetje om even een *Update* te plaatsen bij het artikel? Staat internationaal ook een beetje knullig anders :)
Heerlijk weer zo'n primeur :7

Alleen heb ik wel een klein foutje gezien:
Er zijn dan ook alleen geruchten over een processor die CGM gebruikt, terwijl dit FGM al in de praktijk is toegepast. Het grote nadeel van FMG komt echter naar voren als je met één enkele thread werkt.
Waarschijnlijk moet het zo: ;)
Er zijn dan ook alleen geruchten over een processor die CGM gebruikt, terwijl dit FGM al in de praktijk is toegepast. Het grote nadeel van FGM komt echter naar voren als je met één enkele thread werkt.
Verders een zeer bruut stukje leesvoer!
Ik wil niet lastig doen, maar een PPRO met 2mb cache? ik denk het niet hoor ;)
Officieel is de PPRO er alleen in 150, 166, 180 en 200 MHz met 256, 512 kb of 1 mb chache.

En in Single, Dual en Quad... ik heb gehoord dat ze er ook met 6 op 1 mobo zijn.. maar hier heb ik nooit wat over in het echt gezien.<div class=r>[Reaktie gewijzigd door [eNeRGy]]</div><!-- end -->
ik heb gehoord dat ze er ook met 6 op 1 mobo zijn.. maar hier heb ik nooit wat over in het echt gezien
't Is een beetje off-topic, maar toch: er zijn wel degelijk bordjes geweest voor 6 PPro's, en wel van ALR. Deze werden afgelopen jaar in de VS nog aangeboden (nieuw in doos, overjarig natuurlijk) vooor $50 per stuk, met PPro 200's erbij à $12,50 zonder fan :). Met name in distributed.net-kringen werd toen nogal druk gedaan over die dingen. Een link kan ik je helaas niet geven, wat ik hier heb werkt niet (meer).
hmmmm.. die wil ik hebben :)

Ik ben een grote PPRO fan (jaja, je kan een proc leuk vinden :)) En heb nu thuis een single PPRO 180@210 256kb en een dual PPRO 200@233 512kb.. mijn volgende wens is om ook nog een quad PPRO te verkrijgen, en als die er is (wat zo lijkt te zijn) ook nog een 6-proc systeem.. hoe heet dat eik? Hexa ? :)
Er zijn zelfs wel octal en nog grotere dingen geweest :)

2 MB trouwens voor zover ik weet inderdaad niet. Er zijn wel een (zeer klein aantal, preproductie, nooit echt op de markt geweest, etc. -- zeg maar de huidige status van itanium) 233/1 MB geweest, althans, dat wil men ons doen laten geloven :)

Als je een beetje wilt zoeken naar die hex dingen dan meot je op zoek naar "ALR Revolution 6x6".
http://www.ready.it/news/alrnews971106.htm
En voor plaatjes zul je in hier even doorheen moeten klikken.
Ik heb inderdaad al heel veel nieuwsberichten gezien vanochtend over die 6 PPRO's... alleen nergens te koop ofzo :(

Iemand ??????????

<font color=#786562>* [eNeRGy] in the quest for the HEXA-PPRO 200... now live @ tweakers.net</font>
Er is wel degelijk een 2mb versie geweest, met een toen scrikbarende prijs. Ook zijn er muliprocessor sytemen tot 64 stuks mogelijk met de ppro
n8w8 heeft ook zo'n systeem! en heeft er een hele site aan gewaagd. Ben ff de url kwijt alleen
er zijn een aantal 2mb PPRO's geproduceerd hoor..niet enorme aantallen maar ze zijn er - albeit schaars .
er zijn een aantal 2mb PPRO's geproduceerd hoor..niet enorme aantallen maar ze zijn er - albeit schaars .
Ik heb er een tijdje geleden naar gezocht op de site van Intel en daarop komt een 2 Mb cache versie niet voor. Lijkt me dan dus niet dat er een PPro met 2 Mb cache is geweest.
Prima review.
Alleen vind ik het weer triest van Intel dat ze straks ook de Pentium ongeschrikt gaan maken voor dual processing (dat begreep ik uit je verhaal, correct me if I'm wrong
Door de dual-processor mogelijkheden van de desktop chip af te nemen worden high-end workstations op de Xeon aangewezen, waardoor hij in grotere aantallen dan ooit over de toonbank geschoven zal worden.
)
Probleem is dat de concurrentie met een goedkopere versie komt, waarvan zelfs de budget processor dual aankan. Intel moet niet perse dit product door de strot willen duwen, door de processors te saboteren.
Ik begrijp niks meer van Intel (behalve dat ze alles doen om maar meer geld voor hetzelfde product te kunnen vragen). Geen wonder dat AMD marktaandeel wegkaapt.
Anoniem: 9308
@Glottis23 april 2001 09:05
dat ze straks ook de Pentium ongeschrikt gaan maken voor dual processing
Dat is dus nú al het geval: de Pentium 4 is niet geschikt voor dual processing, en er zal ook nooit een versie van de P4 komen die SMP-enabled is. Wie multi-processing wil koopt dus maar Xeon/Foster!
ik denk dat je bedoelt, in het geval van tweakers "Wie SMP wil koopt maar Athlon!" }>
Wie SMP wil koopt maar Athlon!
En dan? Koop ik twee Athlons, geheugen, de hele meuk........heb ik toch nog wèl even een probleem: waar is 't geschikte moederbord? Nergens dus, nóg niet althans :)! Natuurlijk weet ik dat de 760MP in aantocht is, maar voorlopig blijft 't toch echt behelpen met één AMD hoor!
HuH wist ikniet, kan je in de toekomst geen twee p4 op één moederbplankje prikken?? Wel met de northwood chip??? Gekke stap voor de dual thuisgebruiker. Zal VIA of SiS wel wat op bedenken :)
Ik heb hem ff bij /. aangemeld als article, wellicht lopen zometeen je servers al naar de koffiemokken te zoeken, so be prepared ;)

Het artikel is erg goed, goede info, goede benchmarks, vooral die experimentele met de intel compiler is juist in dit soort reviews een extraatje. De engelse versie had soms een aardig Zerowing gehalte, maar goed, we zijn dan ook met klompen aan geboren en niet met een stars n stripes in de hand ;)
Anoniem: 15120
@EfBe23 april 2001 13:35
Heb net even op /. gekeken, maar ik zie 'm niet staan hoor? Zullen ze 't nie geloven ofzo. Lijkt me sterk dat iemand dit als een hoax ziet, daar is 't artikel net even te uitgebreid voor en t.net te geloofwaardig....

* 786562 muabdhib
Ze hebben waarschijnlijk een redelijk grote newsqueue. En ik weet niet waar de /. admins wonen, maar als dat in Amerika is zijn ze waarschijnlijk nu nog aan het slapen :)
Anoniem: 10031
@EfBe23 april 2001 11:37
humz, gaat t.net weer zwaar geslashdot worden.. :/
tis natuurlijk wel een premiere he :)
Deze review zag ik op slashdot in een van de comments:
www.lostbrain.com/p4/pentium4.html

Is wel grappig.. ;)
mmm wat wil je doen een t.net effect veroorzaken.. :P

for some silly reason I don't think we have the power to accomplish that.
Never underestimate the power of tweakers.net. ;)
Dit stukje snap ik niet helemaal, kan dat toegelicht worden?:
Het grote nadeel van FMG komt echter naar voren als je met één enkele thread werkt. Deze zou in dit geval maar een kwart van de processortijd kunnen gebruiken.
Hoezo een kwart? Als je met één enkele thread werkt wordt hij toch 100 % gebruikt? Of bedoel je één aktieve thread, terwijl er vier open staan?
Bij FGM moet de processor elke kloktik van draad wisselen. Als er geen andere draden zijn wordt dus maar 1/4 van de capaciteit gebruikt (bij een FGM processor die max. 4 draden heeft)
Hmmmh duurt lang voor dat het internet deze scoop oppikt. Het staat er toch al een tijdje.......
Gepost door /. Maandag 23 April 2001 - 12:31 Score: 2 (Interessant)
Great article.

The submission to Slashdot is in progress.
Keep up the good work!

dat duurt niet lang meer BikkelZ
Re...re.....reageren.....*Koffie drinken*......wo....word....wordt...*Met gebak*........st......s.....ste......................stee......steeds........moe.. .....m.....mmmm.....*30 tantes op visite*.....moe......moeilijk.......m.......moeilijker.......

Kies score Let op: Beoordeel reacties objectief. De kwaliteit van de argumentatie is leidend voor de beoordeling van een reactie, niet of een mening overeenkomt met die van jou.

Een uitgebreider overzicht van de werking van het moderatiesysteem vind je in de Moderatie FAQ

Rapporteer misbruik van moderaties in Frontpagemoderatie.



Op dit item kan niet meer gereageerd worden.


Nintendo Switch (OLED model) Apple iPhone SE (2022) LG G1 Google Pixel 6 Call of Duty: Vanguard Samsung Galaxy S22 Garmin fēnix 7 Nintendo Switch Lite

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2022 Hosting door True

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee