Het Nederlands Forensisch Instituut heeft een deeplearningmodel ontwikkeld dat een grote hoeveelheid berichten kan scannen en berichten filtert die een serieuze bedreiging bevatten. De politie gebruikte het model bij het Encrochat-onderzoek.
Het Forensische Big Data Analyse-team van het NFI maakte het neurale netwerk door dit eerst te trainen op 'generiek taalbegrip'. Het team liet het model eerst bijvoorbeeld krantenartikelen of Wikipedia-artikelen lezen, zodat het model begrijpt hoe de Nederlandse taal werkt. Later werden daar berichten van criminelen aan toegevoegd, zodat het model leerde hoe criminelen onderling communiceren.
Ondertussen maakten NFI-medewerkers samen met politierechercheurs woordenlijsten met signaalwoorden. De politiediensten zochten specifiek naar woorden die criminelen kunnen gebruiken om duidelijk te maken dat ze iemand willen mishandelen, ontvoeren of vermoorden, of dat ze willen dat een ander hiervoor zorgt. Het gaat om woorden als dood, slapen, poppen, afknallen en verdwijnen. Hiervoor werkten het NFI en de politie samen met de internationale politiedienst Europol, om vergelijkbare lijsten in het Frans en het Engels te kunnen maken.
Toen de woordenlijst klaar was, kon deze worden ingeladen in het model en kon het model zoeken naar de signaalwoorden in berichten. Het NFI wilde geen simpel zoekmodel; aan de hand van de context moet te bepalen zijn hoe bedreigend een resultaat is. Het woord slapen kan immers betekenen dat iemand omgelegd moet worden, maar ook simpelweg dat iemand gaat slapen. Het NFI wilde voorkomen dat het model irrelevante berichten als bedreigend bestempelde.
NFI-medewerkers verzamelden daarom tienduizenden zinnen die door het model waren gevonden en gaven aan of het bedreigende of niet-bedreigende zinnen waren. Daardoor kan het model inschatten hoe bedreigend een bericht is, op een schaal van nul tot 1, schrijft het instituut. De resultaten worden gecheckt, gelabeld op de 'bedreigendheid' en weer ingeladen in het model. Zo wordt het algoritme volgens het NFI steeds slimmer en kan het berichten steeds beter inschatten. Tegelijkertijd zegt het instituut wel dat het model nooit 100 procent klopt en dat het slechts een hulpmiddel is.
Het NFI-model was op tijd klaar om gebruikt te worden in het Encrochat-onderzoek. Hierbij kraakten Nederlandse en Franse politiediensten de cryptotelefoondienst en werden er 25 miljoen berichten onderschept. Het politieteam Threat To Life gebruikte het model om de berichten te kunnen doorzoeken op levensbedreigende berichten. Hierdoor zijn volgens de politie tientallen mensen gewaarschuwd omdat ze mogelijk vermoord, zwaar mishandeld of ontvoerd zouden worden.
Vermoedelijk gaat de politie het model bewaren om het in te kunnen zetten bij volgende onderzoeken, al meldt het NFI dat niet. Het is niet voor het eerst dat het instituut een dergelijk model maakt; eerder werd er een model gemaakt om aan drugs gerelateerde berichten te kunnen herkennen.