Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Je kunt ook een cookievrije versie van de website bezoeken met minder functionaliteit. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , reacties: 142, views: 1.719 •

Zaterdag 20 december zal de langverwachte upgrade van Apollo, de database-server van het forum, plaatsvinden. De huidige dual Athlon MP-configuratie lijdt sinds enkele maanden aan een instabiliteitskwaal waardoor deze afhankelijk van zijn humeur eens in de paar weken tot een aantal keren per week op zijn plaat gaat, met downtime en corrupte databases als gevolg. De nieuwe machine bestaat uit een Appro 2128Hs barebone met twee Opteron 242-processors, 6GB RAM en zes 10.000rpm SCSI harde-schijven. De vervanging van Apollo zal in de middag uitgevoerd worden en tot gevolg hebben dat het forum enige tijd onbereikbaar zal zijn. Bij een succesvolle upgrade zal de downtime ongeveer twee uur bedragen.

Appro 2128H rackmount (klein)Apollo III is in grote lijnen gelijk aan de nieuwe database server van de frontpage die in november in bedrijf werd genomen. Verschillend zijn de snelheid van de processors (1,6GHz in plaats van 2,0GHz), de hoeveelheid geheugen (6GB in plaats van 4GB) en de snellere bootschijven (2x 36,7GB Cheetah 10K.6 in plaats van 2x 9,2GB Cheetah 18XL). Beide servers hebben twee schijven in RAID 1 als boot array, drie schijven in RAID 5 voor data en een zesde schijf als hotspare.

De configuratie van Apollo liep enige vertraging op door problemen met de beta van SuSE Linux 8 voor het AMD64-platform en een slecht werkende MegaRAID-driver onder SuSE Linux 9. De machine draait inmiddels stabiel onder SuSE Linux 9. Onze eerste benchmarks wijzen uit dat de MySQL performance van Apollo III ondanks zijn lagere kloksnelheid niet slechter is dan van Artemis III. Waarschijnlijk is dit te danken aan de recentere SuSE-versie op Apollo III.

Apollo IApollo IIApollo III
Ingebruikname15-06-200131-08-200220-12-2003
Processors2x PIII-10002x Athlon MP 1900+2x Opteron 242
Geheugen2GB PC1333,5GB PC21006GB PC2100
MoederbordAsus CUV4X-DTyan Tiger MPTyan Thunder K8S
ChipsetVIA Apollo Pro 133AAMD 760MPAMD-8000
RAID-adapterAdaptec 3200SAdaptec 3200SLSI MegaRAID Elite 1600
Harde schijven2x 18,4GB Atlas 10K II1x 20GB ATA
5x Cheetah 36XL 36,7GB
6x Cheetah 10K.6 36,7GB
Behuizing Antec U3U20ATX300 3UCI-Design RS4100 4UAppro 2128Hs 2U

Voortgang van de werkzaamheden:

  • 15:40: Kees en Femme zijn gearriveerd in TeleCity. Artemis II (die nog in het rack draaide) is net down gehaald na 450 dagen uptime. Naast de bovengenoemde werkzaamheden zal vandaag tevens gepoogd worden om de database-server van Fok! een upgrade te geven van dual PIII 1GHz naar dual Athlon MP 1600+ en is het de bedoeling dat Aphrodite (webserver van Fok!) wordt vervangen door een dual Opteron 240.

  • 16:00: De database van Apollo wordt gekopieerd naar de nieuwe server. Dit zal enige tijd duren (~2 uur) in verband met de grootte van de database en het feit dat de oude server geen gigabit ethernet heeft. In de tussentijd is het forum onbruikbaar.

  • 16:30: De mailserver (Arethusa) is downgehaald wegens vervanging van een schijf die nodig is voor de nieuwe Aphrodite.

  • 17:20: De harde schijf in de mailserver is vervangen. Mail en IRC zijn weer online.

  • 17:50: De databases zijn gekopieerd naar Apollo III. De server is op zijn plaats gezet en het forum draait weer. Er zal nu begon worden met de ontmanteling van Apollo II zodat Alicia kan worden geupgrade naar dual Athlon MP.

  • 0:20: Apollo gedraagt zich helaas nog niet helemaal naar behoren. De oorzaak is nog onduidelijk. Apollo zal om die reden voorlopig met 4GB geheugen gaan draaien. Uit de restanten van Apollo II, Artemis II en de storage hardware van Alicia wordt een nieuwe super-Alicia gecreeërd.

  • 1:04: Alicia is weer online na transplantatie van een Thunder K7, twee Athlon MP 1900+, 3GB DDR SDRAM en de 20GB bootdrive van Apollo II.

  • 2:40: Rond 01:45 hebben Femme en Kees na 10 uur zwoegen TeleCity-2 verlaten, een instabiele Apollo achterlatend. Om onverklaarbare reden crasht Apollo soms al binnen een half uur, vele nachten testen, proefdraaien en benchen ten spijt. Daarbij wordt de volgende warning in het syslog achtergelaten:
    Dec 20 22:35:00 apollo kernel: Unable to handle kernel paging request at virtual address 00000103c003a644
    Dec 20 22:35:00 apollo kernel: printing rip:
    Dec 20 22:35:00 apollo kernel: ffffffff80148b29
    Dec 20 22:35:00 apollo kernel: PML4 8063 PGD 0
    Op dit moment hebben we geen idee wat de oorzaak is en we raadplegen uiteraard alle bronnen die ons aan een oplossing zouden kunnen helpen. Hierdoor is het onmogelijk een prognose te geven hoelang de problemen nog voort zullen duren.

  • 16:00: Vandaag om 14:30 was Roelant ter plaatse om Apollo wederom wat bemoedigende woordjes toe te spreken. Na de nodig fsck's durfde Apollo het weer aan om normaal te booten en maakte ACM van de gelegenheid gebruik om de kernel bij te werken en wat instellingen te wijzigen. Het lijkt er op dat alles nu naar behoren functioneert, maar we willen nog even wachten met juichen tot het een paar uur stabiel draait.

  • 23:35: Apollo draait nu zo'n 8,5 uur zonder problemen en suggereert daarmee weer stabiel te zijn. Daarmee mag het onderhoud van 20 (en 21) december definitief als 'ten einde' worden beschouwd.
Apollo III tijdens databasecopy
Apollo III tijdens het kopiëren van de databases
Tweakers.net Appro serverfarm
Onze Appro serverfarm met van boven naar beneden Apollo, Artemis en de vier webservers

Reacties (142)

Reactiefilter:-11420141+1112+224+33
1 2 3 ... 7
Dat wordt 2 uurtjes op een houten stokje bijten, maar voor een stabiele server heb ik dat wel over.
* 786562 Spi-Man
Tijd om de hekje 1 foutmeldingen weer uit de kast te trekken...
Ik zie dat de kast ook een stuk kleiner geworden is! :)
Hebben jullie ruimte tekort in jullie rack ofzo? (dacht dat ik ergens gelezen had dat het vol zit)
Dat was een tijdje terug. Inmiddels zijn veel van de 4U kasten vervangen door 2U's :)
De vervanging van Apollo zal in de middag uitgevoerd worden en tot gevolg hebben dat het forum enige tijd onbereikbaar zal zijn.
Nog technische redenen om dit 's middags te doen, of hebben jullie geen zin om ter meerdere ere van GoT 's nachts aan het werk te gaan? :)
Zo vangen de normaal gesproken GoTtende nerds weer wat zonlicht op natuurlijk ;)
Nou, ik denk dat er vandaag, uit het raam kijkend, niet veel kans is op een glimpje zonlicht ;)
Ik denk dat Kees en Femme gewoon een dataum hebben gekozen die het dichtste bij lag waarop ze allebei konden. En dan is 's-nachts erg vervelend werken als je net als Kees een gewone baan hebt. Daarbij zijn ze vanuit TrueServer en als helemaal niet vanuit TeleCity2 blij met nachtelijke upgrades...
Waarom zou True of TC2 niet blij zijn met die upgrades? :D Ze zijn 24/7/365 open. 's Nachts is alleen maar beter, dan vervelen ze zich niet zo bij de bewaking :Y) :).
Ze vervelen zich nu natuurlijk helemaal, omdat de Fok! en T.Net forums down zijn ;)
Wat is dat nu voor onzin.
Wij doen per voorkeur al het onderhoud 's nachts en ben nog nooit iemand van TS of Telecity tegengekomen die daar moeilijk over doet.
Overdag upgraden komt gewoon veel beter uit. Als je 's middags begint is het geen probleem als de werkzaamheden een paar uurtjes uitlopen. Zou je 's nachts werken, dan ben je bij wat vertragingen pas om 7:00u 's ochtends of nog later klaar. Bovendien wonen ik en Kees in het oosten van het land. Het kost mij bijna twee uur om in Amsterdam te komen.
Hmm, geef anders die servers volgende keer gewoon even mee als ik weer naar TC moet. Ik zal er heeeeel goed op passen :P ;)

Binnen twee uur van Ruurlo naar Amsterdam vind ik trouwens al rap. Hoewel het met de auto natuurlijk beter te doen is dan met de Openbare Vertraging.
Ik kom uit het oosten (Didam) en doe er naar Telecity 55 minuten over. Femme, volgens mij ga je over groningen als je er 2 uur over doet ;).
130 kilometer, 1 uur 42 minuten, volgens de routeplanner.
Is er ook al bekend wanneer de database server van fok vervangen wordt? Ik vind het zielig voor ze dat ze de search moesten uitschakelen omdat ze anders te veel 'load' hebben.

Hij schijnt het nu wel te doen, maar ze hebben wel een verschrikkelijke load.
Ik geloof dat ze hardware gaan rouleren, dus misschien komt er wat beters bij Fok te staan.
Het Fok!-serverpark zal ook zo snel mogelijk verblijd worden met de aanwezigheid van twee dual Opteron machines.
Het forum van Fok is nu (20-12 16u45) al een kwartier compleet in paniek, ze vrezen downtime. :z

@veldmuis: Waarom dan nu toch nog 0 - Overbodig?? ;)
En die downtime die Fok vreesde was niet geheel onterecht :+
een Appro 2128Hs barebone
Bedoel je niet een rackmount?
nee, het is een barebone. Appro verkoopt barebone servers, je moet er dus nog wel zelf de ram, ... en dergelijke instoppen.

Net zoals een Shuttle barebone. Die Appro barebones zitten nu eenmaal in een rackmount ;)
Dan rest mij eigenlijk nog een vraag...
waaneer wordt de Userbase van GoT nu gemerged met die van de Frontpage?
Dit is voor zover ik weet nog altijd niet zeker. Feit is wel dat dit door de vervanging van beide database-servers dichterbij is gekomen.

Wacht maar gewoon af, het komt vanzelf wel een keer langs ;)
Op GoT staat in het MF precies het zelfde artikel, alleen staat Kees er bij als poster, en een half uur later gepost. Kortom, Kees loopt gewoon een beetje artikelen over te tikken:-P Kan natuurlijk niet zomaar.
Wordt nou ook de AMD64 versie van MySQL gedraaid gecompiled met gcc 3.3.2?

Ben benieuwd hoe hij dan gaat presteren aangezien het met gcc 3.2.2 nogal tegenviel. Is dit al getest?

Is de Suse versie volledig AMD64 geoptimaliseerd?

Zomaar een paar vraagjes :)

Zijn jullie trouwens niet bang voor stabiliteitsproblemen op Alicia ivm de problemen met Apollo? Zou het niet handiger zijn Artemis II te strippen?

Misschien dat het verstandig is om een standaardservertje mee te nemen naar de colo, zodat het forum iig draait. Misschien niet heel erg snel, maar het draait tenminste. Moet op zich te doen zijn, aangezien Apollo niet extreem snelle cpu's nodig heeft (max wat de MP's deden lag op zo'n 35%). Geheugen is misschien een probleem, maar een langzaam forum is beter dan geen forum en dan hebben jullie de tijd om de boel te debuggen :)

Waarom een score van 0? Dit zou getest worden hoor dus zulke stomme vragen zijn het niet....
We verwachten ook PICS!! van de upgrade :+
De eerste pic kwam al langs in #devschuur op irc.tweakers.net:
http://picserver.student.utwente.nl/getpicture.php?id=582064
:P
Huh, irc.tweakers.net is hier heel erg down?

Ik vraag me trouwens af of het zou lukken om gewoon de klus te klaren in de geschatte tijd, zou welhaast uniek zijn 8-)
Ja dat stond al op irc je kan connecten via osiris.parse.nl ;)
Nee dus. Maar zo gaat dat met alles wat met ICT te maken heeft.
Lol en dat nog wel op mijn verjaardag :D feestje :7 :9~
nee hoor, op de mijne :P
Ook gefeliciteerd dan maar ;) Je bent ook nog op psies dezelfde dag geboren als ik ook :O
1 2 3 ... 7

Op dit item kan niet meer gereageerd worden.



Populair:Apple iPhone 6Samsung Galaxy Note 4Apple iPad Air 2FIFA 15Motorola Nexus 6Call of Duty: Advanced WarfareApple WatchWorld of Warcraft: Warlords of Draenor, PC (Windows)Microsoft Xbox One 500GBSalaris

© 1998 - 2014 Tweakers.net B.V. Tweakers is onderdeel van De Persgroep en partner van Computable, Autotrack en Carsom.nl Hosting door True

Beste website van het jaar 2014