Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 23 reacties

Xeon MP aankondiging Het is ruim een jaar geleden dat Intel de 3GHz Xeon MP met 4MB L3-cache introduceerde. De chip voor servers met vier of meer processors had het qua performance al direct moeilijk tegenover zijn relatief nieuwe concurrent, de Opteron. Het gebrek aan 64-bit extenties, de beperkte bandbreedte en hoge kosten werden veelal aangewezen als zwakke punten van de Xeon MP. Intel compenseerde dat wel met extra RAS-features en een solide reputatie die zijn concurrent (nog) niet had, maar niettemin vroeg met name het technische publiek zich af hoe het bedrijf zou gaan antwoorden op de verwoede pogingen van AMD om het segment van 4-way servers 'open te breken'. Vandaag introduceert Intel dat antwoord in de vorm van Truland, een nieuw platform bestaande uit de E8500 Twin Castle-chipset en de nieuwe 90nm Xeon MP-cores Cranford en Potomac. In deze feature zullen we beschrijven op welke manieren Intel heeft geprobeerd om het gat met de concurrentie te dichten en welke mogelijkheden er in de toekomst nog benut kunnen worden om bij te blijven.

Een van de belangrijkste dingen die Intel aan moest pakken was de hoeveelheid beschikbare bandbreedte. Binnen het oude Xeon MP-platform is het namelijk zo dat tot vier processors een enkele 400MHz FSB moeten delen. Er is in die configuratie dus een schamele 800MB/s per processor aan bandbreedte beschikbaar, waarover niet alleen de communicatie met het geheugen, maar ook die met andere processors moet lopen. De eerste beslissing die Intel heeft genomen om daar verbetering in te brengen is om niet langer vier, maar slechts twee processors op een bus te plaatsen. Om toch nog vier processors per chipset te kunnen ondersteunen werd vervolgens een tweede FSB toegevoegd, waardoor de bandbreedte al direct verdubbeld werd. Bijkomend voordeel van deze beslissing was dat kortere bussen met minder belastingspunten ook hoger te klokken zijn, en dus kon men van 400 naar 667MHz gaan. In totaal is de bandbreedte hierdoor ruim verdrievoudigd naar 2,7GB/s per processor. Dit is nog steeds (veel) minder dan de Xeon DP en Opteron tot hun beschikking hebben, maar toch een grote stap in de goede richting, die een van de fundamentele bottlenecks van Intels serverplatform behoorlijk zou moeten verzachten.

Bandbreedte per processor (GB/s)
Pentium 4 XE 8,5
Opteron 8xx 6,4
Opteron 2xx 6,4
Pentium 4 6,4
Xeon DP (2006) 6,4
Xeon DP (2004) 3,2
Xeon MP (2005) 2,7
Xeon MP (2002) 0,8
Bandbreedte totaal
Opteron 8xx 25,6
Opteron 2xx 12,8
Xeon DP (2006) 12,8
Xeon MP (2005) 10,7
Pentium 4 XE 8,5
Xeon DP (2004) 6,4
Pentium 4 6,4
Xeon MP (2002) 3,2

Om de bandbreedte ook aan de andere kant van de pijp te kunnen vullen maakt de E8500-chipset gebruik van vier externe geheugencontrollers, de zogenaamde XMB (eXternal Memory Bridge) chips. Dit is een opvallende beslissing, want in plaats van het geheugen dichterbij de processor te brengen zoals AMD gedaan heeft, komt het bij E8500 dus juist een stap verder weg te zitten. Wat voor invloed deze architectuur heeft op de latency is niet bekendgemaakt, maar dat deze achteruit gaat is eigenlijk onvermijdelijk, zeker ook omdat er overgestapt wordt van DDR- naar DDR2-modules. De bandbreedte gaat er wel duidelijk op vooruit: iedere XMB ondersteunt dual-channel DDR2-400, en in totaal zijn er dus acht kanalen (oftewel 25,6GB/s) beschikbaar. Dit kan overigens niet volledig benut worden, want de zogeheten IMI-verbinding (Independent Memory Interface) die tussen de northbridge en de controllers zit ondersteunt maar 5,3GB/s. Hierdoor wordt het totaal beperkt tot 21,3GB/s, maar dat is nog steeds het dubbele van wat de FSB kan verwerken.

Intel E8500 Twin Castle geheugenbord
Extern geheugenbord voor Twin Castle-server

In het onderstaande diagram is te zien dat door de IMI-verbindingen dubbel zo snel gelezen als geschreven kan worden. Om het elektrisch ontwerp van het moederbord niet verder te compliceren en de ontwikkelkosten van de chipset te drukken is deze interface vermoedelijk gebaseerd op PCI Express. Deze standaard is unidirectioneel, wat betekent dat er voor communicatie van punt A naar punt B een andere lijn gebruikt wordt dan voor berichten in tegenovergestelde richting. Standaard PCI Express-slots zijn opgebouwd uit een aantal lanes (x1, x4, enzovoorts), waarbij iedere lane uit twee fysieke verbindingen bestaat. Als IMI werkelijk op PCI Express gebaseerd is dan zou het verschil in bandbreedte makkelijk te verklaren zijn door meer verbindingen upstream dan downstream. Wat voor gevolgen deze keuze heeft voor de prestaties is niet duidelijk, maar aangezien de meeste applicaties (veel) meer lezen dan schrijven en ook geheugenmodules over het algemeen minder snel kunnen schrijven dan lezen, zal het in veel gevallen waarschijnlijk niet eens te merken zijn.

Intel E8500 Twin Castle diagram



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True