De afgelopen jaren zijn steeds meer nationale overheden data over hun inwoners gaan verzamelen en analyseren. Privacygroeperingen en verontruste burgers zijn hier over het algemeen niet erg over te spreken, omdat hun privacy hierdoor in het geding kan komen. Computerwetenschappers zijn daarom begonnen aan de ontwikkeling van software die grote hoeveelheden data doorzoekbaar maakt voor overheden, veiligheidsdiensten en andere organisatie, terwijl het onmogelijk is persoonlijke gegevens direct uit de data te halen. Om dit te bereiken wordt gebruikgemaakt van cryptografie. Informatie wordt via een hashfunctie omgezet in een reeks letters en cijfers, waarbij de hashfunctie iedere keer een ander resultaat oplevert. Door die gegevens vervolgens te vergelijken met de gehashte variant van gezochte gegevens, is het mogelijk een match te vinden. Bij een match kunnen de echte gegevens na toestemming worden vrijgegeven voor nader onderzoek.
Het anonimiseren en hashen van data is noodzakelijk, omdat onderzoek heeft uitgewezen dat op basis van slechts geslacht, de postcode en een geboortedatum van 87 procent van de Amerikanen kan worden nagegaan om welke persoon het gaat. Om dit te voorkomen, moet uit een dataset dus behoorlijk wat meer data geanonimiseerd worden dan alleen namen, adressen en telefoonnummers. Om het desondanks toch mogelijk te maken dat data kan worden teruggeleid, is een oplossing gevonden in het hashen van gegevens. Het onbegrijpbaar maken van data is niet nieuw en wordt door overheden al langer toegepast bij het voorkomen van het uitlekken van geheime informatie over een land. Het ontwikkelen van nieuwe technologie is echter slechts een deel van de oplossing. Zo is het ook van belang om gebruikers te bewegen geëncrypteerde gegevens te versturen, omdat de angst voor het lekken van gegevens onverminderd groot blijft.