Promovenda Elisa Costante van de TU Eindhoven bouwde een tool waarmee privacygedrag van websites in kaart gebracht wordt. De algoritmes analyseren de privacy-policy en berekenen de 'privacykosten' van de website. Ook wordt 'abnormaal gedrag' gedetecteerd in databases.
Het werk van Costante bestaat vooralsnog alleen als een losstaand algoritme en nog niet als een volwaardige applicatie. De broncode is beschikbaar voor onderzoekers. Een daadwerkelijke plug-in voor een webbrowser is er dan ook nog niet, zegt Costante tegen Tweakers. Costante hoopt dat er na de publicatie van het onderzoek geïnteresseerden daadwerkelijk met de code aan de slag gaan.
De onderzoekstool waarschuwt vooraf hoe een site omgaat met persoonlijke gegevens. De software geeft de websites een cijfer, waarbij geldt: hoe hoger, hoe beter het met de privacy is gesteld. Voor het doorspitten van de eula's van websites wordt nu nog alleen gebruik gemaakt van Engelstalige termen, waardoor in principe elke website met een terms of service in die taal gescand kan worden.
Voor de berekening van het privacycijfer, kijken de algoritmes onder andere naar de gevoeligheid van de opgeslagen gegevens en hoe lang de privacygevoelige data bewaard worden. Ook wordt rekening gehouden met de koppeling aan andere webdiensten, die vaak ook elk hun eigen privacy-policy hebben.
Als voorbeeld wordt in het onderzoek van Costante een 'orkestratiemodel' van een reiswebsite genoemd. Die site maakt gebruik van hotelwebsites, autoverhuursites en Google Maps. De tool werkt in stappen: eerst kijkt hij in hoeverre het privacybeleid onderwerpen afdekt, dan naar de betekenis en vervolgens naar de ernst van het gebruik van de data door de provider.
Voor haar promotieonderzoek nam Costante de hele cyclus van onlinedataverkeer onder de loep om oplossingen te bedenken voor zwakke punten. Zo blijkt in het laatste deel van haar onderzoek dat databases waar providers persoonlijke gegevens opslaan, niet goed beveiligd zijn. Ze hebben wel toegangscontrole, maar houden niet in de gaten wat de gebruikers van de desbetreffende data doen als ze binnen zijn.
Daarom ontwikkelde Costante ook een tool om afwijkend gedrag in databases op te sporen. Deze tool staat los van hoe een normale internetgebruiker een website gebruikt. De software controleert de achterliggende database, maar kijkt niet naar het netwerkverkeer. De door een gebruiker ingevoerde data komt ten slotte terecht in een database die kan worden ingezien door bijvoorbeeld een werkgever of een systeembeheerder. In die systemen zitten volgens de onderzoekster veel potentiële datalekken.
In het onderzoek wordt geclaimd dat het de eerste tool is die relatief weinig valse alarmen afgeeft en het dataverkeer niet merkbaar vertraagt. Het bedrijf SecurityMatters, een spin-off van de TUe en de Universiteit Twente, gaat de resultaten van Costante's werk aanbieden in een product. Het proefschrift zal binnenkort te vinden zijn in de publicatie-repository van de universiteit.
Voorbeeld van een orkestratiemodel