Sinds begin dit jaar zorgt database-server Apollo regelmatig voor problemen. Door een nog onbekende oorzaak (hardware dan wel software) is de machine soms enige dagen erg onstabiel waarna de server weer lange tijd goed draait. Daarnaast is met het oog op de toekomst een prestatieverbetering niet ongewenst en begint bovendien de hoeveelheid beschikbare ruimte in ons rack krap te worden. De drie database-servers, Artemis, Apollo en Alicia, zijn ieder gehuisvest in een redelijk huge-ass 4U CI-Design RS4100 rackmount. Op termijn willen we deze gaan vervangen door 2U-machines. Onze zoektocht naar vervangende database-hardware startte aldus met de volgende eisen:
- Maximaal 2U
- Minimaal 30% meer processorkracht ten opzichte van huidige configuratie
- Ruimte voor minimaal 5 hotswap SCSI-schijven
- Ruimte voor eigen RAID-controller

Omdat een volledig prebuilt-server met de door ons gewenste configuratie vrijwel onbetaalbaar is (bij € 5000,- beginnen we pas te praten) moest een keuze gemaakt worden tussen traditionele zelfbouw en het zelf afbouwen van een barebone. Zelfbouw heeft als voordeel dat de kosten laag zijn, maar als grootste nadeel dat je altijd tegen onverwachte problemen oploopt. Zelfs bij een uitvoerige voorbereiding zorgt Murphy er altijd voor dat (bijvoorbeeld) een bepaalde schijf net niet op de juiste manier past wat weer tot gehannes met houtje-touwtje bevestigingen leidt. Daar hadden we geen zin in en gezien het feit dat we in het verleden goede ervaringen hebben opgedaan met Appro-barebones besloten we bij hen te gaan winkelen. De schaarse zelfbouwoplossingen die volledig aan onze wensen voldeden, bleken bovendien nauwelijks goedkoper dan een Appro-barebone.
Vervolgens moest er een platform gekozen worden. Onze huidige database-servers zijn gebaseerd op de AMD Athlon MP, maar gezien het feit dat dit platform al eeuwen niet meer wordt ontwikkeld waren er feitelijk maar twee kandidaten: Intel's Xeon en de AMD Opteron. Met het eerste platform hebben we al ruime ervaring. Maar liefst tien Xeon-processors doen dienst in het Ace's Hardware presteerde de Opteron 244 onder 32-bit Linux veruit het snelst in MySQL (34 procent sneller dan een dual Xeon 2,8GHz). Onder 64-bit Linux met 64-bit MySQL kunnen de prestaties dankzij de extra registers van de AMD64-architectuur nog zo'n tien tot twintig procent beter zijn. Vanwege deze goede prestaties, die naar verwachting nog verder kunnen verbeteren in Linux 2.6 met NUMA-support, hebben we uiteindelijk besloten het Opteron-platform een kans te geven.
De 64-bit geheugenadressering van de Opteron zal meteen door ons benut kunnen worden. MySQL kan onder 32-bit Linux namelijk niet meer dan 2GB geheugen gebruiken, waardoor de resterende hoeveelheid geheugen op dedicated MySQL-machines met meer dan 2GB RAM alleen door de diskcache benut kan worden. 64-bit Linux kent dit probleem niet, waardoor we efficiënter gebruik kunnen maken van de beschikbare hoeveelheid geheugen (4GB tot 6GB) in onze database-servers.
Als basis voor de nieuwe Apollo dient een Appro 2128HS 2U barebone. De Appro is voorzien van een Tyan Thunder K8S moederbord en biedt plaats aan acht hotswap SCSI-schijven. De barebone werd door onszelf voorzien van een tweetal AMD Opteron 244 (1,8GHz) processors. De 240 (1,4GHz) is te langzaam voor ons doel terwijl de 242 (1,6GHz) nauwelijks goedkoper is dan de 244. De keuze voor het (op dit moment) snelst verkrijgbare model is dan ook een logische. Voor de komende upgrade van Artemis zal waarschijnlijk gebruik gemaakt gaan worden van de nieuwe 246-processor.
De storage wordt verzorgd door een drietal 36,7GB Seagate Cheetah 10K.6 schijven die in RAID 5 aan een LSI MegaRAID Elite 1600 met 128MB cache en Battery Backup Unit worden geknoopt. Omdat er in de Appro-kast geen ruimte is voor een IDE-bootschijf wordt Apollo voorzien van twee 9,1GB Seagate Cheetah SCSI-schijven die in RAID 1 samen de boottaken zullen verzorgen. Tenslotte wordt de niet aflatende honger naar geheugen gestild door de server te voorzien van 6GB PC2100 ECC Registered geheugen. PC2700 behoort ook tot de mogelijkheden, maar omdat 6GB PC2100 net zo duur is als 4GB PC2700 is de keuze op het eerste gevallen.
Afhankelijk van de snelheid waarmee het geheugen binnenkomt hopen we Apollo binnen nu en twee weken te kunnen plaatsen. Enige downtime is daarvoor onvermijdelijk, maar we zullen er natuurlijk alles aan doen om dat tot een minimum te beperken. Beperking van de downtime is ook één van de redenen waarom we geen componenten uit de huidige Apollo-configuratie in de nieuwe machine willen recyclen.