Het ligt eraan. WhatsApp maakt voor de normale functionaliteit voor zover ik weet geen gebruik van de bekende cloud services... “Gewoon even bijschalen” is op eigen hardware lang niet altijd zover mogelijk; al heeft WhatsApp wel een flinke overcapaciteit, spares en redundante hardware beschikbaar uiteraard - daar wordt niet veel op bezuinigd. Maar “onbeperkt” schalen is puur luxe eigenlijk

Je spullen in eigen beheer houden is voor veel bedrijven, zeker zij die bewust zijn van de veiligheidsaspecten, heel erg belangrijk - en dan lever je wat in op gebruiksgemak en hoe snel je kan reageren op spontane grote problemen.
Uiteraard hebben ze een eigen cluster waar een cloud-like environment op draait. En die is voor zover bekend maar weinig indrukwekkend qua specs, maar bijzonder indrukwekkend qua performance. 2 jaar geleden draaide het voor puur het messaging gedeelte op slechts 150 chatservers + spares. Dat is verrekte weinig voor zo’n grote dienst, maar heel raar is het niet gezien destijds één enkele server (2x2690v2, 64GB RAM) al met gemak minstens 5 miljoen connecties tegelijk kon hebben. (Aangepaste FreeBSD stack en ‘t hele zooitje draait op Erlang) In de tussentijd zal dit wel flink gegroeid zijn, want de userbase en mensen die het dagelijks gebruiken zijn fors gestegen. Plus allerlei extra diensten zoald (video)bellen, etc etc. (Al wordt daar FBCDN voor geleveraged)
Enfin, WhatsApp is niet je default setup maar heeft uiteraard opschalingsmogelijkheden die snel ingezet kunnen worden (en wie weet is dat wat ze vandaag ook gedaan hebben maar duurde het een kwartiertje voordat het klaar was); maar gezien het allemaal bare-metal is kan dat niet zo ver noch per definitie instantly als bij sommige cloud providers waar je even zomaar zelfs 10.000 cores kan bijschakelen zonder probleem als je maar dokt.
Dat gezegd hebbende... De “cloud” is natuurlijk niet heilig. Ook bij clouds kunnen storingen optreden. Hardware maar vooral ook software. Als jij iets uitrolt waar blijkt een bug in te zitten die enkel onder heel specifieke situaties triggert: dan kan je nog zoveel capaciteit hebben: dan raakt het boeltje alsnog overbelast en lazert uit. That’s the nature of computer systems. En dan is er ook nog een stukje kosten. Etc. Etc.
Ja zelfs in je meest luxe cloud met een enorme stapel cash kan je hele omgeving offline donderen als domino steentjes. Zo lag heel AWS pas geleden plat.
https://www.recode.net/20...n-error-incorrect-command
Door één foutje van een medewerker die aan iets irrelevants werkte ontstond een chaos van jewelste en ging het hele zooitje plat; met als gevolg dat duizenden websites en een aantal hele grote diensten (zoals Netflix) enorme problemen hadden. Zit je dan met je cloud, maar dan kan je dus ook niet “even bijschalen”; en is ook useless want je hele omgeving ligt plat...
Wat dat betreft heeft WhatsApp het zelfs nog goed, want die zijn niet afhankelijk van één third-party dienst maar enkel van zichzelf en in meerdere datacentra.
Cloud kan fijn zijn als je capaciteitsproblemen hebt, maar is niet altijd je redding.
En hoe dan ook: ik dénk niet dat de storing van vandaag een issue was met de capaciteit.
[Reactie gewijzigd door WhatsappHack op 22 juli 2024 15:23]