Google heeft details prijsgegeven over zijn Spanner-databasetechnologie. Spanner maakt gebruik van de zogenaamde true time-api waarbij data voorzien is van een tijdstempel. Vervolgens wordt de data verspreid over zoveel mogelijk datacenters.
De Spanner database-technologie wordt door Google in een gepubliceerde paper omschreven als een globally-distributed database waarbij data continu wordt gerepliceerd over de diverse datacenters die de zoekgigant wereldwijd in gebruik heeft. Dit replicatieproces tussen duizenden computers en zelfs datacenters verloopt volgens Google vrijwel volautomatisch om zo de reactietijden te verlagen en de load balancing te optimaliseren. Spanner zou schaalbaar zijn tot miljoenen servers over honderden datacenters, zo claimen de ontwikkelaars.
Om het replicatieproces op mondiale schaal goed te laten werken, is de true time-api ontwikkeld. Daarbij wordt elk stukje data in de database voorzien van een tijdstempel die wordt gegenereerd op basis van een atoomklok en de gps-tijdklok. Google heeft dan ook gps-ontvangers en atoomklokken in zijn datacenters staan.
Spanner is geoptimaliseerd voor applicaties die veel data lezen maar relatief weinig wegschrijven; onder andere Googles F1-advertentieplatform maakt volop gebruik van Spanner. Voor het benaderen van de database is een op sql gelijkende querytaal ontwikkeld. Verder kunnen applicaties aan Spanner aangeven in welke datacenters informatie beschikbaar moet zijn en waar niet.
Google gebruikt op grote schaal eigen technologieën, zoals het distributed file system gfs. Ook maakt het gebruik van MapReduce, een op gfs aansluitend framework dat zorg draagt voor distributed computing. Door nu ook inzicht te geven in de werking van Spanner kunnen mogelijk ook ontwikkelaars van opensource-databases hun technologie verder verfijnen.