Een groep wetenschappers van de universiteit van Melbourne hebben met een openbare database met medische gegevens de identiteit van verschillende mensen kunnen herleiden, nadat de database was ontdaan van identificerende gegevens.
De wetenschappers waarschuwen dat het verwijderen van die gegevens niet voldoende is als de database gedetailleerde gegevens over personen bevat, aldus The Register. In de bijbehorende paper schrijven de auteurs dat het opnieuw identificeren van personen in de dataset mogelijk is voor 'iedereen met de technische vaardigheden van een student computerwetenschappen'. Bij de dataset ging het om medische gegevens van 2,9 miljoen Australiërs die als open data zijn gepubliceerd door het ministerie van Volksgezondheid.
De database bevat gegevens over patiënten, zoals betaalgegevens, recepten en medische dossiers. Daarbij heeft elke patiënt een versleuteld identificatienummer, en zijn geboortedatum en geslacht gekoppeld, aldus de onderzoekers. Daarnaast waren alle behandeldata willekeurig gewijzigd binnen een maximale periode van twee weken voor of na de behandeling. Daarom is de data niet volledig geanonimiseerd, maar gaat het volgens de wetenschappers om de-identification.
Het onderzoek toont volgens hen aan dat het niet moeilijk is om de identiteit van personen in een dergelijke dataset opnieuw te achterhalen. Zo waren ze in staat om zeven bekende Australiërs te identificeren op basis van publiek beschikbare gegevens. De onderzoekers zeggen dat een kwaadaardige partij ook andere, misschien uitgelekte, databases kan combineren om meer personen te identificeren. Daardoor zou een 'sterke database' van nu in de toekomst wellicht meer informatie blootgeven in combinatie met nieuwe gegevens.
Ten slotte schrijven de wetenschappers dat hun bevindingen geen op zichzelf staande resultaten zijn, maar dat al langer duidelijk is dat het opnieuw identificeren van individuen in grote datasets tot de mogelijkheden behoort. Ze vermelden dat er verschillende aanbevelingen bestaan om dit soort gegevens op een veilige manier te publiceren. Daarbij verwijzen ze onder meer naar een EU-rapport dat vorig jaar uitkwam. Volgens The Register is in Australië momenteel een wet in de maak die onderzoek naar heridentificatie van individuen in datasets verbiedt.