Twitter vervangt zijn MySQL-backend door Cassandra, een opensourceproject van de Apache Software Foundation. Cassandra is ontwikkeld door Facebook en zou beter in staat zijn om grote datavolumes te verdelen binnen clusteromgevingen.
Met de geplande overstap van MySQL naar Cassandra volgt Twitter het voorbeeld van drukbezochte websites als Facebook en Digg, zo meldt InformationWeek. Ryan King, softwareontwikkelaar bij Twitter, stelt in een interview met het MyNoSQL-blog dat zijn bedrijf een database-omgeving nodig had die de snelle groei van Twitter kon bijbenen. Zo groeide de microbloggingdienst in 2009 van 2 miljoen naar 50 miljoen berichten per dag. Ook zou het database-systeem redundanter van opzet en daarmee robuuster moeten worden; downtime is voor Twitter een regelmatig terugkerend verschijnsel.
De distributed database Cassandra zou de groeistuipen van Twitter moeten opvangen. Cassandra werd oorspronkelijk door Facebook-ontwikkelaars gebouwd en moest vooral beter schaalbaar zijn dan MySQL. In 2008 werd de code via de Apache Foundation onder een opensourcelicentie beschikbaar gemaakt.
In tegenstelling tot MySQL-systemen kan een Cassandra-cluster zonder tussenkomst van een beheerder met nieuwe nodes worden uitgebreid. Daarbij zal een nieuwe node direct de bestaande databases repliceren, wat de kans op uitval verkleint. Andere voordelen zouden zijn dat Cassandra voor leesacties is geoptimaliseerd en dat het aantal velden in een record realtime kan worden aangepast.
Cassandra en andere distributed databases kennen ook de nodige nadelen ten opzichte van 'klassieke' databases. Zo worden transacties niet ondersteund, zodat niet met zekerheid kan worden vastgesteld of een transactie geslaagd is. Ook kan Cassandra niet overweg met joins, waarmee data uit meerdere tabellen dynamisch wordt gecombineerd.