Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie
Advertorial

Door Tweakers Partners

Operatie Volt: Politie zoekt ‘toevalsgarantie’ met AI-modellen in opsporing

23-02-2021 • 08:00

27 Linkedin

Tijdens Operatie Volt, het online event waarin Defensie en de politie de IT-aspecten van hun werkzaamheden laten zien, verzorgt Dominique Roest (politie) een presentatie over forensische data-analyse. Hoe vind je een speld in een digitale hooiberg?

Registreer je gratis.

Klik hier om een ticket te bemachtigen.

Als coördinator forensische data-analyse werkt Dominique voor de politie in Amsterdam, waar ze leidinggeeft aan een team IT-specialisten. Hun missie? Om collega’s in de ‘operatie’ te ondersteunen en zo meer rendement te halen uit de data die de Politie veiligstelt. Deze data zijn ontzettend divers, legt Dominique uit. “Denk aan foto’s en teksten, maar bijvoorbeeld ook aan gegevens uit telefoonmasten of routers. Alles wat data bevat, is relevant. Al die data uit verschillende bronnen samen hebben de kenmerken van big data. Het is veel, divers, ongestructureerd en vluchtig, en de betrouwbaarheid is soms lastig in te schatten. Denk bij dat laatste aan de opkomst van deep fakes, wat een grote uitdaging zal gaan vormen voor het politiewerk.”

Snelle conclusies uit grote datavolumes

Voor nu levert vooral een andere uitdaging een flinke kluif op, namelijk de snel toenemende hoeveelheden data. “Neem bijvoorbeeld de PGP-chats van EncroChat-gebruikers. Als politie kun je miljoenen onderschepte berichten niet zomaar even in beslag nemen om ze eens rustig uit te gaan lezen. Terwijl daar misschien wel relevante data tussen staan, bijvoorbeeld over een op handen zijnde liquidatie. Daarom zetten we AI-modellen in om sneller zo’n speld in de digitale hooiberg te vinden.”

Het streven bij deze zoekacties is iets wat Dominique ‘dataserendipiteit’ noemt. “Daarmee bedoel ik dat je dingen vindt waar je niet per se naar op zoek was, maar die wel relevant zijn voor een zaak. Een collega noemde het laatst ook ‘toevalsgarantie’. Met die dataserendipiteit wil je bereiken dat je als politieagent suggesties krijgt over wat er in die data zit, waarna je zelf kunt bepalen wat relevant is. Dan kom je uit op Recommender Systems. Zo’n AI-systeem goed inrichten is nog niet zo eenvoudig. Hoe zorg je namelijk dat je niet in een soort filter-bubble terechtkomt?”

Waarheidsvinding staat centraal

Het uitgangspunt in elke zaak is waarheidsvinding, zegt Dominique. “We willen allemaal dat de politie handelt op basis van feiten en reconstrueert wat er precies gebeurd is. Om dat te doen, is het extreem belangrijk dat je niet alleen maar naar bevestigende informatie zoekt. De toeslagenaffaire bij de Belastingdienst heeft iedereen wel laten zien hoe belangrijk dat is. Onderzoeken moet je zo breed mogelijk insteken en als je datascience toepast, moet je data goed interpreteren en steeds de juiste betekenis geven.”

In deze laatste uitdaging schuilt meteen een belangrijke motivatie voor Dominique om een sessie tijdens Operatie Volt te verzorgen. “Wij hebben mensen nodig die dat goed kunnen. Neem een gps-bolletje op een kaart. Dat kan zowel betekenen dat een telefoon op een bepaalde plek is geweest, als dat iemand een plaats bekeken heeft op Google Maps. Een wereld van verschil als het gaat om bewijsvoering. Daar willen we alert op zijn. We hebben sowieso een breed palet van specialismen nodig: mensen die hardcore kunnen programmeren en algoritmes schrijven, maar ook mensen die de uitkomsten van die algoritmes kunnen interpreteren en in staat zijn de vertaalslag te maken naar de operatie.”

volt-element

Koppeling tussen techniek en traditioneel politiewerk

Ben jij expert in IT? Maak er politiewerk van.

Als IT ergens topprioriteit heeft, dan is het wel bij de politie. Iedereen binnen deze organisatie draagt bij aan een succesvolle uitvoering van de politietaak, met een veiliger Nederland als doel. En dat geldt zeker ook voor de IT'ers. Klik hier voor de openstaande vacatures.

Het team van Dominique maakt naar eigen zeggen “heel praktische datascience-toepassingen”. Het idee is om gebruiksvriendelijke applicaties te ontwikkelen waarmee collega’s in de operatie snel en zelfstandig uit de voeten kunnen. De reden hierachter is simpel: “IT’ers zijn schaars en we missen de mankracht om alle forensische analyses zelf uit te voeren. Daarbij is het ook zo dat we onze kennis over big data willen koppelen met de kennis van de operatie. Daar zitten immers mensen die bijvoorbeeld uitstekend weten hoe crimineel gedrag eruitziet en daardoor met een andere blik kijken dan wij.”

Naast datascience-modellen heeft de politie ook tooling nodig. "Waar we nu naartoe bewegen, is het bouwen van microservices en het neerzetten van een pipeline. Daar is ook engineering power voor nodig, zodat we modellen overal in onze organisatie in kunnen zetten. Vanuit deze overwegingen hebben wij echt ingezet op verschillende specialismen die samenwerken in multi-talented teams, met daarin back-end developers, front-end- en UX-designers en datascientists.''

Voorbeelden van vraagstukken

In haar talk tijdens Operatie Volt zal ze - om voor de hand liggende redenen - geen operationele data delen, maar wel voorbeelden geven van vraagstukken waar de politie tegen aanloopt. "Dan gaat het er bijvoorbeeld om hoe je uit grote hoeveelheden beeldmateriaal een bepaald wapen, voertuig of bonnetje automatisch kunt herkennen. We werken daarvoor ook samen met universiteiten. Zo loopt er momenteel een onderzoek naar hoe je aan de hand van de achtergrond op een foto kunt bepalen op welke locatie hij is gemaakt. Ook loopt er een onderzoek naar het samenvatten van teksten met natural language processing. Voor dit soort toepassingen bestaan al algoritmes, maar politiedata zijn anders dan de generieke datasets waarop deze getraind zijn.”

Ook in het kader van het trainen van modellen is het belangrijk een goede samenwerking te hebben met de collega’s in de operatie. "Dat blijkt ook wel weer uit het voorbeeld van EncroChat. Zij moeten berichten labelen om het taalmodel te trainen. Dat kunnen wij niet alleen, zonder de operationele kennis hebben we geen idee welke data relevant zijn. Die wisselwerking is belangrijk.”

Succes op verschillende manieren meetbaar

Hoeveel zaken worden er nu eigenlijk opgelost dankzij het werk van Dominique en haar team? “Zo moet je dat niet zien”, zegt ze. “We zijn immers bezig met waarheidsvinding, wat niet altijd hetzelfde is als het oplossen van een zaak. Bewijs vinden dat scenario’s weerlegt is net zo relevant als bevestigend bewijs vinden. Maar om op de vraag terug te komen: we merken dat rechercheurs met onze tools het handmatig werk enorm kunnen verminderen. Bijvoorbeeld het bekijken van videobeelden, waar ze normaal gesproken drie weken over zouden doen, kan nu in twee uur. Daardoor vinden ze sneller relevante informatie, of kunnen ze sneller verder met het onderzoek als er geen extra informatie in de beelden is te vinden. Ook heeft het gebruik van combinaties van onze tools geleid tot doorbraken in onderzoeken naar crimineel verkregen vermogen en konden wij aan de hand van grote hoeveelheden bel- en chatinformatie uit telefoons herleiden wie sleutelfiguren waren in criminele bendes.”

Meld je aan!

Meer weten over forensische data-analyse bij de politie? Mis dan de talk van Dominique Roest niet! Voor het programma van - en inschrijven voor - het online event Operatie Volt, dat op 27 maart zal plaatsvinden, kun je klikken op onderstaande buttons.

Operatie Volt Meer info

Wat vind je van dit artikel?

Geef je mening in het Geachte Redactie-forum.

Reacties (27)

Wijzig sortering
Presentaties zoals deze gaan voornamelijk over de techniek. Bij Machine Learning toepassingen in deze sector is de techniek absoluut zwaar ondergeschikt aan de menselijke maat. En daar gaat het bij dit soort initiatieven nagenoeg altijd mis.

De toeslagenaffaire is niet voort gekomen uit het gebruik van Machine Learning. Hij is voort gekomen uit de menselijke factor. Een combinatie van sterke drang vanuit de hoogste top om zoveel mogelijk fraudeurs te vinden gecombineerd met te weinig beschikbare tijd met als gevolg het denken dat het algoritme de waarheid verkondigt.

Bij de politie is dat niet anders; ook daar is er een sterke drang vanuit de top en te weinig beschikbare tijd. Ook daar ligt dit zelfde gevaar op de loer. Zolang we die combinatie niet aanpakken is het algoritme helemaal niet interessant. Het is echter wel aan de schrijvers van het algoritme om zich te houden aan de ethiek van de sector en daarmee te zorgen dat de randvoorwaarden voor zinnig gebruik in place zijn voordat het in gebruik genomen wordt.

Mijn vraag aan Dominique zou dan ook vooral zijn: Hoe gaat ze er voor zorgen dat deze tooling niet op de verkeerde manier gebruikt gaat worden? En dat is geen technisch vraagstuk.......
Daar dacht ik ook meteen aan. Er is wel een verschil tussen "wijs mij foto's aan waar misschien iets op gebeurt, zodat ik de rest niet hoef te bekijken" en "welke mensen vind je verdacht".
Maar dat is tegelijk een glijdende schaal.
Als je de administratie van een crimineel in beslag hebt genomen gaat het om het eerste geval - waarschijnlijk.
Maar tegelijk wijst de administratie naar leveranciers en klanten - en daar kan het wel misgaan.
Maar ook bij het handmatig doornemen van materiaal speelt dit. De persoon met de opvallende naam komt vaker naar boven, lijkt me ("alweer die? Goh").
Ik vind het heel jammer dat ik geen talks op het programma zie staan die expliciet ingaan op de (juridische) waarborgen. Het zou heel leerzaam zijn om ook iets te horen over de risico-analyses vooraf en bijvoorbeeld hoe de voorafgaande raadplegingen (art. 33a Wpg) verlopen. Ook ben ik benieuwd hoe de Politie omgaat met beperkingen zoals het alleen mogen verwerken als het noodzakelijk is voor specifieke onderzoeken (art. 11 Wpg) terwijl er ook een behoefte is om de systemen te ontwikkelen/testen. Zeker wanneer het gaat om de data-analyses die afhankelijk zijn van complexe eigenschappen van de data die lastig in fictieve test-data te stoppen is.
Het streven bij deze zoekacties is iets wat Dominique ‘dataserendipiteit’ noemt. “Daarmee bedoel ik dat je dingen vindt waar je niet per se naar op zoek was
Vroeger noemden we dit onrechtmatig verkregen bewijsmateriaal, maar denk dat dataserendipiteit het beter doet bij de doelgroep.

Ik bedoel dit als grapje, natuurlijk is het niet per sé onrechtmatig. Ik krijg wel een beetje een naar gevoel bij hoe weinig aandacht er is voor de rechten van verdachten en hun contacten (die mogelijk niet eens verdachte zijn) bij dit soort grootschalige dataprojecten. Natuurlijk moet het mogelijk zijn soms ver te gaan bij de bestrijding van georganiseerde criminaliteit, maar waar liggen de waarborgen?
in de VS is er een juridisch concept genaamd Fruit of the poisonous tree wat betekend dat onrechtmatig verkregen bewijs niet gebruikt kan worden in een rechtzaak. In Nederland kennen we dat niet. Illegaal verkregen bewijs is nog steeds bewijs. Natuurlijk kan de politie een onderzoek instellen naar zijn eigen medewerker en deze vervolgen, maar als verdachte in een strafzaak heb je daar natuurlijk weinig aan.
In Nederland zal de rechter het ook mee moeten nemen als het bewijs onrechtmatig verkregen is. Normaal gesproken zal er dan bewijsuitsluiting toegepast worden. In de praktijk zie je dat dat niet altijd gebeurt, maar het is wel de basis in Nederland.
De focus is veelal op de ontwikkeling van Machine Learning modellen, maar men ziet vaak over het hoofd dat het grootste gedeelte hiervan het ontwikkelen van de productie pipeline is. Een veelgehoorde klacht bij data scientists: "Ik heb binnen een maand een goed model werkend, maar het duurde een jaar om het in productie te nemen".
Het (snel(ler)) in productie nemen van nieuwe ML modellen en nieuwere versie van bestaande ML modellen, wordt ook wel MLOps genoemd (https://en.wikipedia.org/wiki/MLOps) als gespecialiseerde vorm van DevOps. Dat zie je ook terugkomen in de vacatures al wordt er niet specifiek om "MLOps" specialisten gevraagd.
Lijkt er meer op dat de politie wat reclame heeft gekocht op tweakers om wat meer IT experts te werven.
Waarschijnlijk hebben Dominique en zijn mensen nog nooit gehoord van "analyst notebook", IBM software die doet wat in het artikel beschreven wordt. Een licentie is niet goedkoop maar vele malen minder duur dan een hobby project waar heel veel uren in worden gestopt.

https://www.dataexpert.nl...bm-i2-analyst-s-notebook/
IBM i2 Analyst’s Notebook is wereldwijd de standaard software oplossing voor operationele criminaliteits-analyse en visualisatie, met als doel het creëren van relevante inlichtingen uit grote hoeveelheden data.

Diverse soorten gestructureerde gegevens (email, telefoongesprekken, transacties, IP-adressen etc.) worden over elkaar gelegd en gevisualiseerd door middel van heatmaps, relaties, histo- en diagrammen etc. Relationele netwerken, geografische en chronologische weergave worden in één oogopslag duidelijk. De gegevens worden meestal in een relationele IBM i2 iBase database of in IBM i2 Enterprise Insight Analysis (Big Data) verwerkt en opgeslagen.

Naast Analyst’s Notebook kunnen analisten beschikken over verschillende add-ons die de mogelijkheden van het programma verrijken. Hiermee kan specifieke data zoals OSINT, Cyber of ongestructureerde data beter geaggregeerd en geanalyseerd worden.

[Reactie gewijzigd door (id)init op 23 februari 2021 11:30]


Om te kunnen reageren moet je ingelogd zijn


Apple iPhone 12 Microsoft Xbox Series X LG CX Google Pixel 5 Sony XH90 / XH92 Samsung Galaxy S21 5G Sony PlayStation 5 Nintendo Switch Lite

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2021 Hosting door True