Volgens het Expertisebureau Online Kindermisbruik zijn door een menselijke fout afbeeldingen door de HashCheckService foutief als kinderporno aangemerkt. De organisatie overweegt met externe audits en een soort toegang op maat te gaan werken.
Door een menselijke fout was er een verkeerde lijst aangezet bij HashCheckService, zegt directeur Gerkens van het Expertisebureau Online Kindermisbruik tegen Tweakers. Daardoor kon het gebeuren dat hashes van onschuldige standaardafbeeldingen van WordPress-installaties in de database kwamen en hostingbedrijven die aangesloten zijn op de HashCheckService onterecht waarschuwingen kregen. TransIP stopt tijdelijk met de dienst vanwege het voorval.
Gerkens: "We kregen in april een nieuwe toeleverancier van hashes, de Canadese politie. Die werken met vier categorieën: baseline, strafbaar, onderzoeksmateriaal en overige materiaal. Bij 'overig' is het fout gegaan, die had bij ons niet aangevinkt mogen worden." Volgens de directeur is het in de twee jaar dat de dienst bestaat, vier keer voorgekomen dat er een false positive aan het licht kwam. "Dan ging het bijvoorbeeld om een auto die in een onderzoek voorkwam, of een logo van een website met illegaal materiaal."
Volgens Gerkens komen er extra checks op de lijsten, maar ze erkent ook dat het systeem nooit 100 procent waterdicht wordt. Daarom zet de EOKM erop in om met audits te gaan werken, zodat een externe partij de werkwijze met toeleveranciers en lijsten van hashes onder de loep kan nemen. Dit zou een onderdeel worden van een project met PwC om te onderzoek of meer hashdatabases in te zetten zijn bij het opsporen van afbeeldingen van seksueel kindermisbruik. Dit project loopt tot augustus 2022.
"Het zou ook goed zijn als de klant kan kiezen 'ik wil alleen op de baselinecategorie checken', terwijl een andere kan bepalen 'ik wil alles'. We zijn bezig om dat aan te kunnen bieden." Baseline is de categorie van hashes die op onmiskenbare kinderporno betrekking hebben.
De HashCheckService krijgt de lijsten van hashes aangeleverd van de Nederlandse politie, Interpol, de Canadese politie en het Amerikaanse meldpunt voor online kinderporno. Providers kunnen zich via een api aansluiten en waarschuwingen ontvangen als de dienst een match met hashes van opgeslagen bestanden maakt, om deze te kunnen verwijderen. Er zijn 26 bedrijven aangesloten, zoals imagehosters.
Volgens Gerkens zijn de beperkingen van het werken met md5- en sha1-hashes bekend bij de politiediensten en werken de partijen aan verbeteringen. De EOKM zelf werkt daarom aan de inzet van PhotoDNA van Microsoft. Deze technologie werkt op basis van machinelearning en kan kinderporno ook als zodanig herkennen als afbeeldingen aangepast worden. De organisatie nam daarvoor begin deze maand een speciale server in gebruik. Volgens Gerkens dient een bepaalde foutmarge geaccepteerd te worden bij het flaggen van de afbeeldingen, maar is die marge wel in te stellen.
Vorig jaar heeft de hashcheckdienst 18,2 miljard afbeeldingen gecheckt, wat bijna 7,4 miljoen hits opleverde, staat in het jaarverslag van de EOKM. De aantallen zijn volgens de organisatie hoog doordat veel aangesloten bedrijven in het begin al hun materiaal in één keer lieten checken op illegale afbeeldingen. De verwachting is dat het aantal hits in de toekomst daalt.