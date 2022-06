Tijdens Operatie Volt, het online event waarin Defensie en de politie de IT-aspecten van hun werkzaamheden laten zien, verzorgt Dominique Roest (politie) een presentatie over forensische data-analyse. Hoe vind je een speld in een digitale hooiberg?

Als coördinator forensische data-analyse werkt Dominique voor de politie in Amsterdam, waar ze leidinggeeft aan een team IT-specialisten. Hun missie? Om collega’s in de ‘operatie’ te ondersteunen en zo meer rendement te halen uit de data die de Politie veiligstelt. Deze data zijn ontzettend divers, legt Dominique uit. “Denk aan foto’s en teksten, maar bijvoorbeeld ook aan gegevens uit telefoonmasten of routers. Alles wat data bevat, is relevant. Al die data uit verschillende bronnen samen hebben de kenmerken van big data. Het is veel, divers, ongestructureerd en vluchtig, en de betrouwbaarheid is soms lastig in te schatten. Denk bij dat laatste aan de opkomst van deep fakes, wat een grote uitdaging zal gaan vormen voor het politiewerk.”

Snelle conclusies uit grote datavolumes

Voor nu levert vooral een andere uitdaging een flinke kluif op, namelijk de snel toenemende hoeveelheden data. “Neem bijvoorbeeld de PGP-chats van EncroChat-gebruikers. Als politie kun je miljoenen onderschepte berichten niet zomaar even in beslag nemen om ze eens rustig uit te gaan lezen. Terwijl daar misschien wel relevante data tussen staan, bijvoorbeeld over een op handen zijnde liquidatie. Daarom zetten we AI-modellen in om sneller zo’n speld in de digitale hooiberg te vinden.”

Het streven bij deze zoekacties is iets wat Dominique ‘dataserendipiteit’ noemt. “Daarmee bedoel ik dat je dingen vindt waar je niet per se naar op zoek was, maar die wel relevant zijn voor een zaak. Een collega noemde het laatst ook ‘toevalsgarantie’. Met die dataserendipiteit wil je bereiken dat je als politieagent suggesties krijgt over wat er in die data zit, waarna je zelf kunt bepalen wat relevant is. Dan kom je uit op Recommender Systems. Zo’n AI-systeem goed inrichten is nog niet zo eenvoudig. Hoe zorg je namelijk dat je niet in een soort filter-bubble terechtkomt?”

Waarheidsvinding staat centraal

Het uitgangspunt in elke zaak is waarheidsvinding, zegt Dominique. “We willen allemaal dat de politie handelt op basis van feiten en reconstrueert wat er precies gebeurd is. Om dat te doen, is het extreem belangrijk dat je niet alleen maar naar bevestigende informatie zoekt. De toeslagenaffaire bij de Belastingdienst heeft iedereen wel laten zien hoe belangrijk dat is. Onderzoeken moet je zo breed mogelijk insteken en als je datascience toepast, moet je data goed interpreteren en steeds de juiste betekenis geven.”

In deze laatste uitdaging schuilt meteen een belangrijke motivatie voor Dominique om een sessie tijdens Operatie Volt te verzorgen. “Wij hebben mensen nodig die dat goed kunnen. Neem een gps-bolletje op een kaart. Dat kan zowel betekenen dat een telefoon op een bepaalde plek is geweest, als dat iemand een plaats bekeken heeft op Google Maps. Een wereld van verschil als het gaat om bewijsvoering. Daar willen we alert op zijn. We hebben sowieso een breed palet van specialismen nodig: mensen die hardcore kunnen programmeren en algoritmes schrijven, maar ook mensen die de uitkomsten van die algoritmes kunnen interpreteren en in staat zijn de vertaalslag te maken naar de operatie.”

Koppeling tussen techniek en traditioneel politiewerk

Het team van Dominique maakt naar eigen zeggen “heel praktische datascience-toepassingen”. Het idee is om gebruiksvriendelijke applicaties te ontwikkelen waarmee collega’s in de operatie snel en zelfstandig uit de voeten kunnen. De reden hierachter is simpel: “IT’ers zijn schaars en we missen de mankracht om alle forensische analyses zelf uit te voeren. Daarbij is het ook zo dat we onze kennis over big data willen koppelen met de kennis van de operatie. Daar zitten immers mensen die bijvoorbeeld uitstekend weten hoe crimineel gedrag eruitziet en daardoor met een andere blik kijken dan wij.”

Naast datascience-modellen heeft de politie ook tooling nodig. "Waar we nu naartoe bewegen, is het bouwen van microservices en het neerzetten van een pipeline. Daar is ook engineering power voor nodig, zodat we modellen overal in onze organisatie in kunnen zetten. Vanuit deze overwegingen hebben wij echt ingezet op verschillende specialismen die samenwerken in multi-talented teams, met daarin back-end developers, front-end- en UX-designers en datascientists.''

Voorbeelden van vraagstukken

In haar talk tijdens Operatie Volt zal ze - om voor de hand liggende redenen - geen operationele data delen, maar wel voorbeelden geven van vraagstukken waar de politie tegen aanloopt. "Dan gaat het er bijvoorbeeld om hoe je uit grote hoeveelheden beeldmateriaal een bepaald wapen, voertuig of bonnetje automatisch kunt herkennen. We werken daarvoor ook samen met universiteiten. Zo loopt er momenteel een onderzoek naar hoe je aan de hand van de achtergrond op een foto kunt bepalen op welke locatie hij is gemaakt. Ook loopt er een onderzoek naar het samenvatten van teksten met natural language processing. Voor dit soort toepassingen bestaan al algoritmes, maar politiedata zijn anders dan de generieke datasets waarop deze getraind zijn.”

Ook in het kader van het trainen van modellen is het belangrijk een goede samenwerking te hebben met de collega’s in de operatie. "Dat blijkt ook wel weer uit het voorbeeld van EncroChat. Zij moeten berichten labelen om het taalmodel te trainen. Dat kunnen wij niet alleen, zonder de operationele kennis hebben we geen idee welke data relevant zijn. Die wisselwerking is belangrijk.”

Succes op verschillende manieren meetbaar

Hoeveel zaken worden er nu eigenlijk opgelost dankzij het werk van Dominique en haar team? “Zo moet je dat niet zien”, zegt ze. “We zijn immers bezig met waarheidsvinding, wat niet altijd hetzelfde is als het oplossen van een zaak. Bewijs vinden dat scenario’s weerlegt is net zo relevant als bevestigend bewijs vinden. Maar om op de vraag terug te komen: we merken dat rechercheurs met onze tools het handmatig werk enorm kunnen verminderen. Bijvoorbeeld het bekijken van videobeelden, waar ze normaal gesproken drie weken over zouden doen, kan nu in twee uur. Daardoor vinden ze sneller relevante informatie, of kunnen ze sneller verder met het onderzoek als er geen extra informatie in de beelden is te vinden. Ook heeft het gebruik van combinaties van onze tools geleid tot doorbraken in onderzoeken naar crimineel verkregen vermogen en konden wij aan de hand van grote hoeveelheden bel- en chatinformatie uit telefoons herleiden wie sleutelfiguren waren in criminele bendes.”

