RvS wil duidelijkheid voor overheidsinstanties die anonieme persoonsdata delen

De Raad van State wil dat de Nederlandse regering duidelijker aangeeft wat overheidsinstanties moeten doen om te voorkomen dat anonieme persoonsgegevens alsnog worden herleid tot personen. De regering moet volgens de RvS een wetsvoorstel hierover aanvullen of toelichten.

De Nederlandse regering wil de Wet hergebruik van overheidsinformatie, ofwel Who, aanpassen, waarbij hergebruik van overheidsinformatie onder meer goedkoper en makkelijker moet worden. Het wetsvoorstel gaat ook over het hergebruiken van geanonimiseerde persoonsgegevens. De Raad van State waarschuwt dat met deze wet onduidelijk is wat van overheidsorganisaties wordt verwacht om te voorkomen dat deze gegevens alsnog herleidbaar worden tot personen.

Deze waarschuwing volgt nadat de Autoriteit Persoonsgegevens eerder waarschuwde voor het gevaar van dergelijke geanonimiseerde data. Betere software en krachtigere hardware zouden dergelijke data in de toekomst herleidbaar kunnen maken naar personen, aldus de toezichthouder. Het kabinet plaatste daarna een toelichting bij het wetsvoorstel waarin het dit gevaar erkende. Hierin werd ook gezegd dat anonimisering een vorm van gegevensverwerking is en dat overheidsorganisaties structureel in de gaten moeten blijven houden of eerder verstrekte data door technologische ontwikkelingen misschien niet meer anoniem zijn.

Volgens de Raad van State is het nu echter onduidelijk wat precies van overheidsorganisaties wordt verwacht om te voorkomen dat dergelijke data toch herleidbaar wordt. De Raad van State 'hecht eraan dat deze verplichtingen, en de mogelijke kosten die deze met zich meebrengen, worden verduidelijkt en dat tevens wordt aangegeven hoe - en door wie - hierop effectief toezicht zal worden gehouden'.

De AP had eerder ook klachten over het wetsvoorstel, omdat overheidsinstanties zouden mogen beslissen welke persoonsgegevens wel of niet hergebruikt mogen worden. Die keuze zou bij de burgers zelf moeten komen te liggen, stelt de Autoriteit. De Raad van State zegt over dit deel van de wet dat niet duidelijk is hoe dit zich verhoudt tot andere nationale en Europese wetgeving.

Het wetsvoorstel moet nog bij de Tweede Kamer worden ingediend, maar wat de Raad van State betreft doet het kabinet dit nog niet. Het wetsvoorstel zou inbreuk maken op rechten van wetenschappers, omdat er wordt gesproken over een verplichting om gegevens uit wetenschappelijk onderzoek openbaar te maken en beschikbaar te stellen voor hergebruik als dit onderzoek is gefinancierd met publiek geld. Onderzoekers kunnen daardoor niet zelf bepalen welke gegevens ze openbaar maken, wat volgens de Raad van State wel zou moeten. Dit deel van het wetsvoorstel kan volgens de Raad van State beter geschrapt worden.

Door Hayte Hugo

Redacteur

24-10-2022 • 15:56

21

Submitter: Anonymoussaurus

Reacties (21)

Sorteer op:

Weergave:

Hoe lastig kan het zijn: deel geen data?
Want dan kan het ook nooit mis gaan, is privacy nooit in het geding.

Kennelijk vinden bedrijven en overheden het delen van data de normaalste zaak van de wereld, zonder zich ook maar af te vragen of het nou echt nodig is... Vaak is het niet de data die nodig is, maar hooguit de analyze op de data, al is zelfs dat vaak niet echt noodzakelijk.
Soms heb je gewoon data nodig. Hoe kan je beleid maken zonder cijfers? En als de data te abstract is heb je de kans dat je er met beleid finaal naast komt te zitten. Simpel voorbeeld: stel dat je voor de zorg gaat kijken hoeveel er voor eigen risico wordt betaald. In het extreemste geval heb je dat zo geanonimiseerd dat er 1 getal op tafelt ligt, het gemiddelde van alle Nederlanders. Daar kan je dan helemaal niets mee.
Vandaar dat ik zeg: heb je dan de data nodig, of de analyze?
Bedoel, je kunt gewoon aan de collega's die de data hebben vragen om een bepaalde analyze.
Dan heb je de data niet nodig, en dus ook niet dit soort geneuzel dat het toch niet anoniem genoeg bleek.
Een analyse is uiteindelijk ook data... die deel je dan dus ook.

We willen allemaal dat onze overheid beter werkt, sneller werkt, meer doet en het liefste met minder mensen en minder geld. Dan moet er dus gezocht gaat worden naar verbeteringen op efficientie en effectiviteit. Het hergebruiken van data is daar een onderdeel van.

Het vraagstuk wat er nu ligt is valide en ik juich het ook toe. Wat nu anoniem is zou in de toekomst middels meer datapunten en nieuwe data alsnog tot een relatie kunnen leiden met andere profielen en zo afbreuk doen aan de anonimiteit. Als er vast komt te liggen wat daarin de spelregels zijn (tot op welk niveau gaan we anonimiseren) en daarop periodiek blijven toetsen dan ben je denk ik veel discussies voor.
Een andere discussie is de grondslag voor het delen, als dat ook altijd vanuit een vastgesteld kader kan worden opgepakt is enkel de toetsing tegen het kader belangrijk en is het niet elk keer opnieuw het wiel uitvinden.
edit - beter lezen :-)

[Reactie gewijzigd door gevoelig op 2 augustus 2024 03:24]

Het probleem wat je dan hebt is dat je er van uit moet kunnen gaan dat degene die de analyse gedaan heeft ook 100% betrouwbaar is. Niet alleen voor de overheid die op basis van die analyse beleid maakt, maar ook voor burgers en journalisten die op basis van een WOB-verzoek wil weten of alles wel eerlijk en rechtvaardig gebeurt.

Het is wel vaker gebeurt dat er beleid wordt gemaakt op basis van een analyse van een overheidsinstelling waarbij achteraf blijkt dat deze niet klopte met de data.
Daarvoor zijn ook andere oplossingen zoals bijv. in de wetenschap al gewoon is om een dubbel-blind peer-review toe te passen.
Wordt daarbij ook altijd de hele dataset meegegeven? Dus echt alles, ook alle testpersonen wiens data er uit gehaald is omdat ze om de een of andere reden niet geschikt waren voor het onderzoek?
Dat is een goede vraag; en daar heb ik eerlijk gezegd geen direct antwoord op. Maar ik kan me indenken dat als er gerede twijfel over de zuiverheid van data is, hier wel procedures voor zullen zijn.

Ander principe wat je toe zou kunnen passen, is het basale drie-wijzen principe.
Drie organisaties individueel onderzoek laten doen. (Niet twee; want dan heb je geen tie-breaker.)

[Reactie gewijzigd door R4gnax op 2 augustus 2024 03:24]

100% offtopic:
Wat heeeeeeeeeeerlijk om gewoon eens iemand te zien schrijven "daar heb ik eerlijk gezegd geen direct antwoord op". Zero sarcasm, gewoon heerlijk dat we blijkbaar niet geheel verstoten zijn van mensen die het niet altijd wél pretenderen te weten.

HULDE.

[Reactie gewijzigd door magic45 op 2 augustus 2024 03:24]

Thanks voor je antwoord. Dat drie wijzen principe klinkt mooi, zou fijn zijn als dat meer toegepast werd.
Dit klinkt ook erg goed - wat jij zegt heeft een hoge 'gezichts validiteit'. Maar hebben wij ook een overheid die dit doet? En hebben wij een overheid die mogelijk ook andere dingen met deze data doet? Hoe gaat onze overheid eigenlijk om met data?
Hoeveel willen wij eigenlijk dat onze overheid door data wordt gedreven? Hoort hier niet een laag tussen, zoals bijvoorbeeld wetenschap?

Ik ben het zeker niet met je stelling oneens, maar ik vraag me af of het betrekking heeft op de wereld waarin wij zouden willen leven, of die waarin we daadwerkelijk leven.

Nog los van de vraag of je de overheid hier mee moet willen vertrouwen, maar dat komt een beetje neer op het argument van pOZORjED hieronder.
In de ogen van (niet alleen) onze overheid is data en AI de oplossing voor alles.
Alles opslaan, je weet nooit waar het in de toekomst goed voor is.

Gelukkig is in het verleden niet gebleken hoe fout het kan gaan....
Waarom niet anonieme data delen, die is vaak wel nodig voor analyses te kunnen maken, want anders heb je sowieso geen data nodig.
Ik vraag me dan ook af wat er bij deze data geanonimiseerd wordt en hoe die anonieme data anders weer terug te leiden is naar een persoon. IMHO is het toch lastig te herleiden naar een persoon als je sowieso geen NAW/BSN/telefoonnummer/bankrekening hebt.
Het probleem is niet de wil om anoniem data te delen, maar de gebrek aan inzicht om dat werkelijk anoniem te doen. Waarbij het vertrouwen in eigen inzicht zomaar hoog lijkt inschatten om te verplichten dat de personen om wie het gaat dat maar massaal moeten accepteren.

Als het delen van gegevens normaal moet worden zal er voldoende inzicht moeten blijken dat de gegevens niet herleidbaar zijn en de personen om wie het gaat werkelijk geen controle horen te hebben over wat anderen met hun persoonlijke gegevens doen aan anonimiseren.

Ik vermoed dat de bedenkers van dit plan niet makkelijk kunnen onderbouwen dat gegevens werkelijk niet herleidbaar zullen zijn, en dus maar beter iedereen kunnen informeren waar de persoonsgegevens verwerkt worden en iedereen weet of de eigenaren achter de gekozen anonimisering staan. Dan is er namelijk zowel het inzicht waar de gegevens zijn, wat men er mee wil, hoe men dat wil en een mogelijkheid van keuze.
Het delen van data is essentieel voor een gedegen dienstverlening aan de burger. Anonieme data over de burgers die te herleiden is beslaat een te kleine populatie of is onvdoende geanonimiseerd.

Idealiter zou je als burger met een opt-in jouw geanonimiseerde gegevens hiervoor willen verstrekken en je eigen data uit de brongegevens kunnen halen. Aangezien verificatie een belangrijk onderwerp is in de wetenschap is het nodig om brondata te bewaren. Anders kan niemand jouw conclusies verifiëren. Tussenoplossing: In het brondata van het onderzoek komt een vermelding te staan dat X mensen hun data uit de bron hebben gehaald. Daarmee is het inzichtelijk hoeveel van de brondata nog beschikbaar is en weten andere onderzoekers hoe verifieerbaar het onderzoek nog is.
Het wetsvoorstel zou inbreuk maken op rechten van wetenschappers, omdat er wordt gesproken over een verplichting om gegevens uit wetenschappelijk onderzoek openbaar te maken en beschikbaar te stellen voor hergebruik als dit onderzoek is gefinancierd met publiek geld. Onderzoekers kunnen daardoor niet zelf bepalen welke gegevens ze openbaar maken,
Je doet iets met publiek geld, dan ben ik van mening. Dat het ook alle gegevens openbaar moet.
Ik ben in principe met je eens dat wetenschappers hun data niet af moeten schermen. Zo kunnen we veel betere wetenschap bedrijven.

Alleen als ik mee doe aan een onderzoek, wil ik wel dat mijn persoonlijke en mogelijk herleidbare data wel afgeschermd wordt.

Het lijkt me moeilijk om de juiste grens te bepalen tussen openbaarheid zodat de wetenschap meer vooruit kan en privacy zodat de deelnemers beschermd blijven.
Het delen van data is noodzakelijke om te voorkomen dat instanties keuzes maken op foutieve, achterhaalde en/of onvolledige data. Daarnaast scheelt het de burger bakken met werk om overal telkens weer zijn/haar gegevens bij elkaar te moeten zoeken en te overhandigen. Veel van deze gegevens zijn niet eens in het bezit van de burger en zullen eerst moeten worden opgevraagd bij andere (overheids)organisaties.

Dat alle instanties hun eigen gegevensbeheer hebben is een erfenis uit de jaren 60-80 toen alles gedecentraliseerd moest worden maar we nog niet de hedendaagse techniek hebben. Elke instantie was gedwongen om hun eigen archiefkasten te vullen. Tegenwoordig zijn de archiefkasten digitaal maar verlopen de processen nog steeds op basis van hun eigen digitale archiefkasten.

De oplossing is er al namelijk in de vorm van een digitale kluis (een soort wallet voor de blockchain'ers onder ons) waarin al jouw gegevens staan. Hiermee heb je nog geen schrijf- of aanpassingsrechten op jouw data, dat zou de datakwaliteit in het geding brengen. Wat je wel hebt is autorisatieverlening dat instanties bij jouw gegevens mogen, inzage in welke instantie wanneer waarom jouw gegevens heeft ingezien en kan je instanties informeren wanneer je onjuistheden in jouw data ziet.

Het gevolg is niet alleen dat instanties niet meer met eigen databases of caches mogen werken, deze datakluizen (waar de basisregistraties een federatieve vorm van kunnen zijn) de vele duizenden (?) calls per seconde moeten kunnen verwerken en elke overheidsapplicatie moet worden aangepast.

We hebben nog een lange weg te gaan maar stapje voor stapje kunnen we er heen
Onderzoekers kunnen daardoor niet zelf bepalen welke gegevens ze openbaar maken, wat volgens de Raad van State wel zou moeten.
Voor zover ik begrijp wordt hier niet gedoeld op privacy-gevoelige data.
Wat is er dan tegen om alle onderzoeksresultaten te publiceren daar waar het onderzoek is gefinancieerd met publieke gelden, i.p.v. cherry-picking?
Ik dacht dat de term anonimiseren inhield dat het een onomkeerbaar proces is waarbij je persoonsgegevens nooit meer kan afleiden. In elk ander geval is er toch geen sprake van anonimiseren maar hooguit pseudonimiseren?

De AP schrijft er wel wat over in haar brief:
Als een persoon kan worden geïdentificeerd in een aanvankelijk anoniem geachte gegevensset, dan kan dat grote gevolgen hebben voor betrokkene. Dat geldt in het bijzonder als er sprake is van gevoelige persoonsgegevens, zoals gezondheidsgegevens. Door de almaar toenemende rekenkracht van computers en de opmars van machine learning, zal het risico dat geanonimiseerde gegevens toch herleidbaar zijn in de loop van de tijd bovendien alleen maar toenemen.17 Ook de toenemende beschikbaarheid van hergebruikbare gegevens vergroot dat risico. In de overwegingen van de richtlijn staat dan ook dat Lidstaten moeten zorgen ‘voor de bescherming van persoonsgegevens, ook wanneer informatie in een individuele dataset geen risico inhoudt dat een natuurlijke persoon kan worden geïdentificeerd of er wordt uitgepikt, maar die informatie mogelijk wel een dergelijk risico inhoudt wanneer zij wordt gecombineerd met andere beschikbare informatie.’

Op dit item kan niet meer gereageerd worden.