De Pentium 4 is een maand geleden gereleased, maar vooral door de enorme hoeveelheid artikelen en discussies die er de laatste tijd zijn verschenen op Tweakers.net, lijkt het al een stuk langer geleden. De meeste van deze discussies gingen over de performance van de Pentium 4 vergeleken met de Athlon. De conclusie die we al zoveel keer hebben moeten aanhoren is meestal dat de Pentium 4 inderdaad in een aantal applicaties (soms veel) sneller presteert, maar dat vooral vanwege de prijs de nieuwe processor voor de meeste mensen nog geen oplossing is. Deze hoge prijs is mede te danken aan het Rambus geheugen, op dit moment het enige geheugen dat gebruikt kan worden in samenwerking met de Pentium 4. Naast de kosten van het geheugen, is ook de i850 (Tehama) chipset van Intel ongelooflijk duur.
Veel mensen kijken daarom ook uit naar de eerste SDRAM chipset van Intel voor de Pentium 4: codenaam Brookdale. Intel verwacht dat de Pentium 4 met deze chipset, die in het derde kwartaal van 2001 moet uitkomen, een groot deel van de mainstream markt kan overwinnen. Later, in 2002, zal ook ondersteuning van DDR SDRAM toegepast worden. Maar hoe aantrekkelijk zijn de prestaties van een Pentium 4 met SDRAM eigenlijk? Wat moeten we daarvan verwachten?
Anand Lal Shimpi deed deze week een zeer interessante ontdekking. In de eerdere review van de Pentium 4 die hij geschreven had, liet hij ook de Linpack geheugen benchmark los op verschillende processoren. Hieronder is het resultaat daarvan te zien. Deze benchmark is vooral geschikt om te laten zien hoe een processor kan presteren in applicaties die veel geheugenbandbreedte nodig hebben. Wij concentreren ons op het deel waarbij de datagrootte groter is dan het cachegeheugen van de processor, waar duidelijk te zien is dat de prestaties steeds meer naar een rechte lijn toegaan.
Het valt natuurlijk gelijk op dat de Pentium 4 hier superieure prestaties levert. In eerste instantie is de gedachte dat dit ligt aan het RDRAM geheugen. Dual channel PC800 RDRAM heeft namelijk een data-overdrachtssnelheid van (0,800 * 2 * 2) = 3,2GB/s (de eerste * 2 komt door het 2 bytes brede Rambus kanaal, de tweede doordat er twee kanalen gebruikt worden). Dit sluit perfect aan bij de quad pumped 100MHz bus van de i850, die ook voor een bandbreedte van 3,2GB/s zorgt. Anand wees die theorie echter af, omdat het verschil met de AMD760 met DDR geheugen dan ook veel kleiner zou moeten zijn (ook daar heeft het geheugen een grotere data-overdrachtssnelheid dan normaal gebruikt, en sluiten chipset en geheugen perfect op elkaar aan). Daarom zou dit verschil volgens Anand door de geavanceerde branch prediction van de Pentium 4 komen en is het niet zo afhankelijk van het RDRAM.
In zijn bespreking van de VIA KT133A chipset deze week spreekt hij echter zichzelf tegen. Er wordt niet zoveel over gezegd, aangezien het hier over de Athlon gaat, maar dit keer heeft Anand ook een PC600 RIMM tot zijn beschikking. Een klein rekensommetje leert ons dat dit geheugen met (0,600 * 2 * 2) = 2,4GB/s data kan doorvoeren. Dat is dus, logischerwijs, 25% minder dan bij het PC800 geheugen. Volgens Anand's eerdere theorie zou het effect hiervan op de Linpack benchmarks niet zo verschrikkelijk groot zijn. Maar de performance daalt met dit geheugen bijna 20%! Dit laat dus wel zien dat de Pentium 4 verschrikkelijk afhankelijk is van de geheugenbandbreedte bij deze tests. Als we even door redeneren: PC133 SDRAM heeft een data-overdrachtssnelheid van 1GB/s. Vergeleken met PC800 RDRAM is dat zo'n 69% minder. Een voorzichtige schatting is dan dat de Linpack performance met minimaal 50% daalt (t.o.v. het PC800 RDRAM, en dat lijkt mij nog een zeer optimistische schatting). Teken deze lijn in de nieuwste grafiek van Anand, en het wordt duidelijk dat deze combinatie het qua Linpack performance zelfs in de meest optimistische situatie verliest van de AMD Athlon op de AMD760 en VIA KT133A chipsets. Het komt zelfs verdacht dicht in de buurt bij de Pentium III op een i815 chipset.
In ogenschouw genomen dat in toekomstige applicaties steeds meer geheugenbandbreedte zal worden gebruikt, en dat bijvoorbeeld in Tom's laatste blik op de Pentium 4 wordt gezegd dat het sneller zijn van de P4 bij het coderen van MPEG4 met FlaskMPEG - geoptimaliseerd voor SSE2 - vooral te danken is aan de geheugenbandbreedte, is het veilig om te zeggen dat één van de grote voordelen en prestatie-booster van de Pentium 4 wegvalt bij het gebruik van SDRAM. Heeft de Pentium 4 echt RDRAM nodig om zijn kwaliteiten te laten zien? JA.
Dat maakt in mijn ogen de markt voor de Brookdale chipset erg klein. Er zijn hogere kloksnelheden mogelijk dan met de Pentium III, maar dat moet ook lukken met de nieuwe 0,13micron revisie van de P3. Er is ondersteuning voor SSE2, maar het is nog maar de vraag of dat voor een grote performance boost kan zorgen zonder het snelle Rambus geheugen. De P4 is duidelijk ontworpen om gebruik te maken van die enorme geheugenbandbreedte die zij tot haar beschikking heeft en - sorry, anti-Rambus-mensen - dat zorgt ervoor dat de Pentium 4 gewoon niet tot zijn recht kan komen met SDRAM.
Mijn verwachting is dan ook dat de Rambus-prijzen, ondanks alle perikelen hieromheen, toch sterk zullen gaan dalen dankzij de push van Intel, omdat het kopen van een Pentium 4, ook als er wél SDRAM chipsets beschikbaar zijn, eigenlijk alleen maar zin heeft met RDRAM modules. Als later de DDR SDRAM versie van Brookdale uitkomt kan dat nog een verschil maken, maar reken zelf maar uit wat het verschil in performance t.o.v. Rambus PC800 zal zijn met de 2,1GB/s pieksnelheid die DDR geheugen op het moment bereikt. Behalve als de DDR DIMM's ook spectaculair in prijs gaan dalen, is PC600 dan nog aantrekkelijker bij de Pentium 4. Omwille van de concurrentie hoop ik dat AMD een processor kan ontwikkelen die ook goed gebruik kan maken van een grotere geheugenbandbreedte, want het is duidelijk dat de huidige Athlon niet echt veel met het DDR SDRAM doet.
Disclaimer: Velen zullen als kritiek op dit stukje hebben dat er alleen wordt gekeken naar slechts één, ook nog eens theoretische, benchmark. Maar het is juist de bedoeling dat we hier kijken naar de toekomst en in de toekomst komen zeer waarschijnlijk meer applicaties uit die erg blij zijn met wat meer geheugenbandbreedte (zoals bijvoorbeeld Quake 3). De Linpack benchmark laat erg goed zien hoe processoren gebruik maken van deze bandbreedte bij het doen van floating point berekeningen.