Beveiligingsonderzoekers hebben een database gevonden met informatie over 1,2 miljard personen. In de database zitten geen gevoelige gegevens zoals creditcardnummers of wachtwoorden, maar wel informatie over de profielen die zij hebben. Ook staan er telefoonnummers en e-mailadressen in.
De database werd gevonden door onderzoekers Bob Diachenko en Vinny Troia. Zij zochten via Shodan naar andere informatie en stuitten als het ware per toeval op de database. Die is in totaal vier terabyte groot, en bevat meer dan vier miljard gebruikersaccounts van 1,2 miljard unieke personen. In de records zitten ook vijftig miljoen unieke telefoonnummers en 622 miljoen unieke e-mailadressen. De data stond op een Elasticsearch-server op de Google Cloud. De onderzoekers schakelden na hun vondst de FBI in. Die haalde de server kort daarna offline.
De data lijkt afkomstig van vier verschillende databases die bij elkaar zijn gezet. Drie daarvan zijn vermoedelijk afkomstig van een databedrijf uit San Francisco genaamd People Data Labs. Dat schrijft op zijn website dat het een database heeft van 1,5 miljard unieke gebruikers. Het verkoopt die gegevens aan bedrijven of adverteerders. De vierde database is hoogstwaarschijnlijk afkomstig van Oxydata. De nu uitgelekte database is niet van hen afkomstig, maar waarschijnlijk van een van hun klanten. "De eigenaar van deze server heeft waarschijnlijk een van onze producten gebruikt, in combinatie met andere producten", zegt de eigenaar van People Data Labs tegen Wired. "Zodra een klant toegang heeft tot onze data, staat die op hun servers en zijn die klanten verantwoordelijk voor de beveiliging ervan."
De grote hoeveelheden data zijn waarschijnlijk geaggregeerd van socialemediaprofielen zoals Twitter, Facebook en LinkedIn. Databedrijven doen dat soort aggregatie om die gegevens vervolgens door te verkopen aan andere bedrijven die er advertentieprofielen mee kunnen opstellen. Met zulke data enrichment kunnen kopers van de dataset veel informatie over een persoon vinden aan de hand van slechts één of twee records. Een naam of telefoonnummer kan dan leiden tot alle andere bekende info over die persoon. Volgens de onderzoekers kan de data makkelijk misbruikt worden om identiteitsfraude te plegen.
Er worden de laatste tijd wel vaker enorme databases online gevonden. Die ontstaan vaak door meerdere databronnen aan elkaar te knopen. In januari verscheen bijvoorbeeld een database online met in totaal meer dan 2,2 miljard accountnamen, inclusief hun wachtwoorden. Die waren samengevoegd uit andere grote datalekken.