Tweakers.net zal binnenkort beginnen met het configureren van een nieuwe database-server voor het forum. De upgrade is onderdeel van een plan waarbij het huidige aantal van twee database-servers zal worden uitgebreid naar drie machines. Het derde systeem zal gaan dienen als backup en spare server. De afgelopen maanden hebben we aan den lijve kunnen ondervinden hoe kwetsbaar Tweakers.net is als er een ernstig probleem op één van de twee database-servers optreedt. In de huidige situatie kunnen defecten niet op een adequate wijze ondervangen worden. Enerzijds omdat er geen vervangende hardware beschikbaar is die voldoende performance heeft om de taak van Tweakers.net of GoT database-server te vervullen en anderzijds omdat we niet verzekerd kunnen zijn van een snelle levering van spareparts. Uiteraard is dit probleem op te lossen door een flinke hoeveelheid SLA in te kopen, maar aangezien wij goed in staat zijn om onze eigen servers te servicen is het economischer om wat componenten in reserve te houden.
Vanwege een sterke toename van de disk I/O op de Apollo (database-server van het forum) en onopgeloste problemen met het adresseren van meer dan 4GB geheugen is gekozen voor een oplossing waarbij Apollo wordt vervangen door een nieuw en beter presterend systeem en de huidige configuratie om te bouwen tot reserve-server. Tot op heden zijn we er niet in geslaagd om Apollo betrouwbaar met meer dan 4GB te laten werken. Het probleem wordt mogelijk veroorzaakt door de door ons gebruikte combinatie van moederbord, processor en RAID-adapter. Het vinden van een oplossing is nauwelijks mogelijk zolang de machine in productie is. Door een nieuw systeem te bouwen kan er zonder druk worden gezocht naar een oplossing.
Tweemaal Appro 2128Hs
De nieuwe Apollo, geleverd door onze huisleveranciers Melrow en Informatique, zal evenals zijn collega's gebaseerd zijn op een Appro 2128Hs barebone, en wel het nieuwe model met 4+4 in plaats van 4+2 DIMM-slots. Hiermee kan een maximum van 8GB geheugen worden geadresseerd bij gebruik van 1GB DIMMs, wat op de forumdatabase zeker geen kwaad kan. De Appro-behuizing zal bevolkt worden door twee Opteron 244-processors, acht 1GB DIMMs, een LSI MegaRAID 320-2X en een achttal Seagate schijven. Zodoende ontstaat de volgende configuratie:
- Dual AMD Opteron 244 (1,8GHz)
- 8GB PC2700 ECC Registered DDR SDRAM
- Tyan Thunder K8S Pro
- LSI Logic MegaRAID SCSI 320-2X
- LSI BBU3 battery backup unit
- 512MB PC2100 ECC DDR SDRAM cache
- LSI BBU3 battery backup unit
- 2x Seagate Cheetah 10K.6 36GB 10.000rpm (RAID 1 voor boot)
- 6x Seagate Cheetah 15K.3 36GB 15.000rpm (RAID 5 + hotspare voor data)
- Appro 2128Hs barebone
- SuSE Linux 9 AMD64

De nieuwe server is inmiddels gearriveerd op kantoor. Inmiddels hebben we gemerkt dat de bijgeleverde riser, die niet passend is voor de Appro 2128Hs, ervoor zorgt dat de Intel SRCU42X (geOEMde MegaRAID 320-2X van Intel) niet optimaal functioneert, ongeacht de kloksnelheid van de PCI-bus. Een passende en hopelijk beter functionerende riser zal toegestuurd worden zodra deze beschikbaar is. De prestaties van de 320-2X / SRCU42X met zes Cheetah 15K.3-harde schijven in RAID 5 zijn wel bizar goed. Deze setup haalt een sequentiële read transfer rate van 375MB/s tot 260MB/s aan het begin tot het eind van de array. De write transfer rates liggen rond de 200MB/s. De read transfer rate schaalt lineair met het aantal schijven: 75MB/s * (6 - 1) = 375MB/s. Wie nu nog zegt dat RAID 5 niet presteert heeft

Een meevaller is dat het bijgeleverde geheugen door de processors als DDR400 CL3 in plaats van DDR333 CL2.5 herkent blijkt te worden. Hiermee ligt de geheugenbandbreedte op circa 5,1GB/s in 32-bit Windows XP. Onder een 64-bit NUMA-geoptimaliseerd besturingssysteem moet meer dan 10GB/s mogelijk zijn.

Na enige tijd van stilte weer een update. In de afgelopen weken hebben we nogal wat te stellen gehad met de nieuwe server. Het blijkt dat de standaard 500 watt power supply niet voldoende is om een server die tot de nok is volgestampt met hardware stabiel te houden. De beschikbare stroomsterkte op de 3.3V en 5V-lijnen is aan de lage kant en dat uit zich onder zware belasting in vreemde symptomen zoals het spontaan uitvallen van één van de SCSI-schijven en bij bepaalde tests zelfs compleet uitschakelen van de server. Hoewel Appro's tech support bij hoog en bij laag blijft ontkennen dat de oorzaak bij de voeding zou liggen bleken de problemen na het plaatsen van een tweede voeding opgelost (dit enigszins tegen de verwachting in omdat deze voeding normaliter enkel voor redundancy zorgt). De vervangende riser zal als alles goed gaat morgen arriveren, waarmee we hopelijk het configureren zo snel mogelijk af kunnen ronden.