LeaseWeb bekritiseert laksheid KLPD bij filtering kinderporno

LeaseWeb bekritiseert de afwachtende houding van het KLPD om de hash-database van het kinderpornofilter vrij te geven voor het efficiënter preventief filteren op afbeeldingen met kinderporno. Het KLPD zegt ermee bezig te zijn.

LeaseWeb nam een jaar geleden als eerste hostingbedrijf in Nederland een eigen kinderpornofilter in gebruik. Hoewel dit een pilot betrof, is LeaseWeb te spreken over de resultaten. Het filter werkt op basis van md5-hashing en het Zweedse bedrijf NetClean levert de achterliggende filtertechnologie.

Het systeem vergelijkt de hash van een te uploaden afbeelding met een voorlopig door NetClean beheerde database, die ook door de Zweedse politie wordt gebruikt. Als er een hash wordt ontdekt die op de lijst met verdachte hashes staat, kan de bewuste afbeelding niet worden geüpload. De pilot zou een jaar duren en werd uitgevoerd bij een van de grotere uploadwebsites die door LeaseWeb worden gehost. Deze site zou ongeveer 40 miljoen plaatjes hosten.

"Net als voorgaande jaren zijn het voornamelijk uploadwebsites die veel meldingen van kinderpornoplaatjes bij onze helpdesk genereren", zegt Alex de Joode, Security Officer van LeaseWeb en tevens medeoprichter van Meldpunt Kinderporno Nederland. "We zouden het aantal meldingen van kinderporno op dergelijke websites graag terugbrengen, maar dat is alleen mogelijk als onze filteringoplossing met up-to-date gegevens van bij de politie bekende kinderpornoplaatjes wordt gevoed. Die gegevens heeft het KLPD in hash-databases."

Volgens LeaseWeb is het KLPD nog niet met die database over de brug gekomen. Het Ministerie van Justitie had vorig jaar echter aangegeven bij gebleken succes de door LeaseWeb ingezette technologie op bredere schaal te willen aanbieden aan webhosters. "Nu is het KLPD aan zet", vervolgt De Joode. "Wij vinden het jammer dat het zo lang moet duren voordat er bij het KLPD een beslissing wordt genomen over het beschikbaar stellen van hun kinderpornodatabases. Daar zou wel iets meer vaart achter gezet mogen worden."

"LeaseWeb heeft de oplossing gedurende het afgelopen jaar ontwikkeld en getest", stelt De Joode. "Na verschillende hindernissen in de ontwikkeling genomen te hebben, alsook de nodige finetuning, blijkt het filter technologisch gezien goed te werken. Wij hopen dat het KLPD binnenkort alsnog medewerking verleent."

Het KLPD stelt in een reactie tegenover Tweakers.net dat de Nederlandse politie graag meewerkt en dat er achter de schermen al druk wordt gewerkt om het mogelijk te maken. "Het KLPD beheert deze database van de Nederlandse politie", zegt Ed Kraszewski, zegsman van het KLPD. "We willen graag dat dit systeem gaat werken en daar zijn we mee bezig. Er ligt al een conceptvoorstel waarover nu gesproken wordt."

De reden dat het niet over één nacht ijs gaat, is volgens Kraszewski dat het om 'complexe materie' gaat. "De wil is er, maar het moet wel goed gebeuren. We moeten dus rekening houden met zaken als beveiliging en de juridische implicaties."

Overigens stelt LeaseWeb zijn filtertechnologie in de toekomst mogelijk uit te breiden met het door Microsoft ontwikkelde Photo DNA. Ook hiervoor heeft het hostingbedrijf echter toegang tot de database van het KLPD nodig.

Door Wilbert de Vries

25-03-2010 • 10:47

96

Reacties (96)

96
95
76
1
0
12
Wijzig sortering
(...) Als er een hash wordt ontdekt die op de lijst met verdachte hashes staat, kan de bewuste afbeelding niet worden geüpload.
MD5 hashes zijn toch beïnvloedbaar? Voeg een paar nutteloze tekens toe in een hex-editior, of maak de afbeelding groter en plak er een regenboog onder bijvoorbeeld. Als je toch zo graag kinderporno wilt sharen lijkt me dat een kleine moeite.
En dat is 1 van de redenen waarom dit soort filters compleet nutteloos zijn.
Het kan ook nog voor komen dat jou vakantie foto toevallig dezelfde hash heeft als een kinderporno foto.
Die kans is wel heel erg klein :
ongeveer 1 op 63340000000000000000000000000000000000000000000000
Bij mijn weten is dit niet helemaal correct; dit is de kans dat 2 plaatjes dezelfde hash hebben. De kans dat jouw plaatje dezelfde hash heeft als 1 uit een set van x miljoen (waarbij x de grootte van de hash-database), is alweer aanzienlijk groter. Niet groot, maar wel groter. Zeker naargelang de database groeit.

Een schaalbare oplossing is het dus m.i. niet.
Je vergeet daarbij dat je te maken krijgt met het "birthday problem" (http://en.wikipedia.org/wiki/Birthday_problem) waardoor de kans dat één van jouw foto's overeen komt met één van de hashes in de database behoorlijk veel groter is.
Tja.... er zitten maar 365 dagen in 1 jaar... (soms 366)
Ieder jaar worden er in NL iets van 320.000-350.000 kinderen geboren.
De kans dat er iemand op dezelfde dag geboren is als jij is als je het even plat doorreken kom je op 876,7 - 958,9 kinderen die op één dag geboren worden.

De kans dat mijn foto dezelfde MD5-hash zal opleveren als die van een kp afbeelding is wel degelijk niet in die vergelijking op te trekken.

Theoretsich is er ook een kans dat er iemand op deze wereldbol rondloopt met extact dezelfde DNA als jij of ik.
Ga jij 'm ff zoeken?

Beetje kort door de bocht, maar I'll get your point.
en toch zou het je zomaar kunnen overkomen.
Anoniem: 80466 @tehsojiro25 maart 2010 11:35
Je zou ook 100 keer op 1 dag door de bliksem getroffen kunnen worden.
De kans daarop lijkt groter
hashing is inderdaad nooit 100% zekerheid.
MD5 heeft 128 bits, dus 2^128 mogelijkheden, dat zijn er eigenlijk al vrij veel. (een getal van 38 cijfers volgens mijne calculator)
om het nog beter te maken zou er meerdere type hash waardes gebruikt kunnen worden. De kans dat MD5 en SHA1 overeenkomt tussen 2 verschillende afbeeldingen is enorm veel kleiner.
En als die hash overeenkomt word je ook direct zonder enige vorm van proces in de boeien geslagen en chemisch gecastreerd...
Het meest stupide aan jouw opmerking is de stelligheid: "compleet nutteloos". Als een filter op een bepaald bestand aanslaat, wordt er gewoon eventjes met het menselijke oog geverifieerd. Zo'n filter pretendeert ook niet de allesomvattende oplossing te zijn, het is 1 van de middelen. Ik kan me ook voorstellen dat afbeeldingen met optische herkenningssoftware worden vergeleken, voor het geval er bijvoorbeeld een randje is afgecropt. En zo zullen er waarschijnlijk nog wel meer hulpmiddelen zijn.
Anoniem: 135756 @mu-sick25 maart 2010 12:13
Ja, ja, natuurlijk is het beinvloedbaar en het is te omzeilen.
Omdat een afbeelding uniek is, krijg je de hash in kwestie.
Pas de afbeelding aan en de hash is ook al anders. Maar hoeveel moet anders zijn voor een andere hash? hoeveel mag overeenkomen? ik denk dat toch wel veel overeen mag komen. (plak een watermerk in de afbeelding en ik denk dat de hash nog steeds werkt)

Maar laten we niet meteen azijnpissen.
Hiermee kan je al heel veel tegenhouden en wellicht zelfs gebruiken voor vervolging.
Mathematische hash algoritmes behoren aan de eis te voldoen dat als 1 bit anders is je een compleet ander resultaat krijgt.
Als ze md5, en dat staat in het artikel, gebruiken geeft de kleinste verandering al een andere hash.
Precies, het werkt voor de mensen die er niet veel verstand van hebben. De echte "experts" zullen toch nog gewoon up kunnen loaden, alleen zoals ik al zei lijkt het me lastig om de inhoud goed te controleren. Moet je er maar een fikse delay op zetten en mensen die plaatjes laten bekijken..
ook dat is niet waterdicht natuurlijk, als je 2 frame gifs neemt en ze hernoemt worden ze wel weergegeven, maar alleen het eerste frame, degenen die dan de echte afbeeldingen willen hebben kunnen deze alsnog bekijken
ook dat is niet waterdicht natuurlijk, als je 2 frame gifs neemt en ze hernoemt worden ze wel weergegeven, maar alleen het eerste frame, degenen die dan de echte afbeeldingen willen hebben kunnen deze alsnog bekijken
Die MD5-hashes zijn dus niet van het JPEG-bestand in kwestie, maar van de pixels _in_ de afbeelding. Waarschijnlijk geschaald naar een standaardformaat en kleurdiepte, zodat er niet een of andere creatieveling de boel denkt te omzeilen door het zwart-wit te maken of te resizen. Het is juist de vorm van de foto (wat er afgebeeld wordt) wat er toe doet.
Anoniem: 225842 @MMaI25 maart 2010 13:15
Tja je kunt ze natuurlijk ook een encrypten... alles kan.
"Beïnvloedbaar" is misschien wel een understatement: door een willekeurig getalletje in bv de EXIF-gegevens (of een waardeloos block ergens anders) te plakken krijg je al (bijna) gegarandeerd een compleet andere hash. En binnen de kortste keren hebben de aanbieders SSL ofzo ontdekt, waardoor het compleet onherkenbaar is.

[Reactie gewijzigd door Bacchus op 26 juli 2024 04:58]

Anoniem: 80466 @Bacchus25 maart 2010 11:36
SSL heeft geen invloed op de filtering door een hoster die het plaatje fysiek host.
Anoniem: 26447 @mu-sick25 maart 2010 12:16
IK zou zeggen ga maar even oefenen met stukken tekst b.v. op http://www.md5decrypter.com/ :)
Heeft iemand hier dan details over hoe die hashes berekend worden? Iedereen zegt hier wel van.. 1 pixel veranderen en je hebt een andere hash. Ik verwacht eigenlijk dat de hashes niet over het bestand worden berekend, maar dat er eerst wat met het bestand gebeurd er bepaalde kenmerken uitgehaald worden en dat daar de hash over berekend wordt ofzo?
Ik verwacht eigenlijk ook dat de klpd dus eerst de hashes op dezelfde manier moet berekenen en dat e.a. afgestemd moet worden voor dat ze de database met hashes kunnen delen.
Waarschijnlijk hebben ze dus de plaatjes en de hashes die op een bepaalde manier berekend zijn, zodat ze snel kunnen zien in een inbeslaggenomen data set of daar kp in voor komt. Maar als de hash berekening van LeaseWeb anders is dan de klpd software zal die database toch eerst opnieuw berekend moeten worden. Dat zal niet zomaar gedaan zijn, aangezien je dan de orginele kp nodig hebt enzo lijkt me.
Kijk hier maar eens: http://nl.wikipedia.org/wiki/MD5

MD5 is een standaard dus je kan het niet op een andere manier berekenen ;)
Nee dat snap ik.
Het gaat erom WAAROVER je ehm berekend. Gedeelte van het plaatje
Plaatje dat altijd omgezet wordt naar jpeg zwartwit en dan 200x200 pixels?
Dat soort dingen.
En bij het uploaden worden misschien wel 3 hashes berekend. (een van het gewone plaatje 1 van de inverse van het plaatje, 1tje van de zwart-wit en als 1 dan matched met die van de kp database... wordt de upload geweigerd.)

Daar heb ik het over :)

[Reactie gewijzigd door air2 op 26 juli 2024 04:58]

hash wordt berekend over het hele bestand, en heeft geen weet vd content.
hash wordt berekend over het hele bestand, en heeft geen weet vd content.
Je kan natuurlijk ook het plaatje uncompressen, naar een bekend formaat resizen, zwart-wit maken, opnieuw opslaan en dat hashen. Zo ben je in ieder geval creatieve resize-artiesten die hun plaatjes met 1 pixel vergroten en opnieuw oploaden een stap voor.
Anoniem: 135756 @air225 maart 2010 12:25
1 pixel veranderen en je hebt een andere hash
Dat is inderdaad zo, maar wellicht een (te filteren) deel van de hash.
Ik neem aan dat je een bepaalde `threshold´ kan zetten.
Nope, dat gaat niet met hashes. De enige oplossing zou het downscalen en quantizeren van plaatjes zijn, en daar een hash van maken. Maar dat kost heel veel rekenkracht
Nope, dat gaat niet met hashes. De enige oplossing zou het downscalen en quantizeren van plaatjes zijn, en daar een hash van maken. Maar dat kost heel veel rekenkracht
Dat hoef je alleen te doen bij het aanmaken van de database, en bij het uploaden.

En wat doen veel bekende image-sites van zichzelf al...?

Juist, ze maken thumbnails! :+
Hij erkent dat filters als deze een voor de hand liggende zwakke plek hebben. 'Als iemand in een bestand ook maar een pixel wijzigt, zullen de hashes van het origineel en de kopie niet meer overeenkomen. Dan zal de software niet aanslaan.'
[...]
Dan is het filter van zichzelf dus al inherent niet-functionerend. Als ik één foto pak, met 32 bits-per-pixel kleurinformatie, dan kan ik in principe 232 unieke versies van dat bestand maken, die allemaal een andere hash produceren, zonder dat het me veel moeite kost. En dat is door één pixel te wijzigen, met 4 verschilende pixels door het bestand heen kom je al op 2128 unieke versies van 1 specifieke foto, en dat komt wel akelig in de buurt van collisions met andere foto's.

Gezien KP toch al via botnets wordt verspreid, is het een fluitje van een cent om geautomatiseerd zoveel mogelijk verschillende versies van 1 foto te verspreiden. Als het KLPD die állemaal moet gaan flaggen, dan is de kans op false positives nagenoeg 1.
Anoniem: 164019 @air225 maart 2010 11:43
Het lijkt me onwaarschijnlijk dat er ook maar iets aan preprocessing wordt gedaan door een van beide partijen. Dat is immers computationeel nog duurder voor de hoster (zelfs het decoderen van een plaatje is enkele orden van grootten duurder dan even een bitstream hashen), terwijl het voor de uploader niet veel extra moeite kost om het te omzeilen.

Daarnaast lijkt MD5 me niet bepaald geschikt voor zulke toepassingen, aangezien het ontworpen is om cryptoveilig te zijn; je zou iets willen hebben waarbij de hash bruikbaar is om vergelijkbare inhoud te zoeken, iets wat lijnrecht tegenover cryptoveiligheid staat.
Ik kan in zien dat leaseweb zich via dit systeem in wil dekken tegen het medeplichtig zijn bij verspreiding van kinderporno

Zolang we denken dat we met dit soort filters de wereld behoeden van kinderporno / terrorisme / verkeerd denken zijn we fout bezig.

Hiervoor dienen er vervolg/andere stappen genomen te worden (door de juiste instaties natuurlijk)

Het uploaden van bekende kinderporno wordt door dit filter tegen gehouden, nu nog daadwerkelijk de koppeling dat degene die het upload aangepakt kan worden.
Hierop lijkt me dat je dan een spoor kan maken naar de makers/andere verspreiders en zo vervolgens de bron aan kan pakken.

Ander negatief puntje wat hier nog speelt is natuurlijk dat met zo'n filter wel wordt gestimuleerd om meer nieuwe kinderporno te maken of te manipuleren. Want die staat dan nog niet in de database van de KLPD
Anoniem: 80466 @Pumbaa8225 maart 2010 11:41
nu nog daadwerkelijk de koppeling dat degene die het upload aangepakt kan worden.
Ah, de ultimate privacy killer.
Iederen die iets upload moet identificeerbaar worden op het internet.
Grappig dat een tegenstander van filtering met een meer draconische privacy concept komt.
Waarschijnlijk bedoelt Pumbaa82 dat op het moment dat het filter een positive (al dan niet false) geeft dat het een logentry uitspuugt met daarin het IP van degene die het probeert te uploaden, dan kan de politie daar verder iets mee doen.
Anoniem: 135756 @naam25 maart 2010 12:27
Enorm tricky omdat er zoveel misbruik van derden bestaat met het uploaden van illegale content. Net als spammers een openrelay gebruiken, hebben uploaders vaak een klein botnet.
Je hebt recht op privacy in je eigen huis, niet op andermans servers (tenzij het in je contract staat).
'bij de bron' aanpakken ga je niet doen door iedereen te arresteren bij wie iets (anoniem) is geupload. Iedere PC met een actieve trojan kan als een botnet fungeren waardoor de echte uploader prima vanaf 600.000 adressen zijn plaatjes kan posten, zonder dat de onwetende gebruikers thuis door hebben dat er KP via hun lijn verstuurd wordt.

Waar je het echt aan moet pakken is bij de productie, dus de schoften die meisjes van 4-18 jaar van de straat plukken, dwingen tot het maken van KP en uiteindelijk in de vrouwenhandel gooien als ze er mee klaar zijn. Maar dat is ontzettend moelijk, want dat soort zieke praktijken gebeuren in landen waar de wetgeving er niet zo streng in is, en de handhaving al helemaal niet deugt.

Je lost het probleem alleen niet op door 'internet-douane' te gaan spelen.
Volgens mij gaat het er vooral om dat ze het aantal meldingen bij de helpdesk willen terug dringen (meldingen terugdringen bij de helpdesk is voor een bedrijf altijd intresant)

Ook is het een service voor hun klanten die plaatjes laten uploaden.

En het is natuurlijk een stukje imago.

Ik denk niet dat het met indekken van verspreiding van kinderporno te maken heeft aangezien ze een service provider zijn en niet de verspreiders (Dat zijn de uploaders volgens mij)
Ander negatief puntje wat hier nog speelt is natuurlijk dat met zo'n filter wel wordt gestimuleerd om meer nieuwe kinderporno te maken of te manipuleren. Want die staat dan nog niet in de database van de KLPD
Goh.... laten we dit probleem ook al langer hebben met virussen. (en virusscanners...)
Anoniem: 146875 25 maart 2010 11:08
Net als voorgaande jaren zijn het voornamelijk uploadwebsites die veel meldingen van kinderpornoplaatjes bij onze helpdesk genereren
Erg discutabel. De afgelopen 12 jaar zit ik bijna elke dag op internet te surfen en in al die tijd ben ik nog nooit kinderporno tegengekomen.
De afgelopen 12 jaar zit ik bijna elke dag op internet te surfen en in al die tijd ben ik nog nooit kinderporno tegengekomen
De afgelopen 12 jaar is er bij mij niet ingebroken. Ik concludeer dat berichten over inbraken erg discutabel moeten zijn.
Het is hoe dan ook wel beter verborgen dan 15+ jaar geleden, toen liep je er in nieuwsgroepen nog echt per ongeluk tegenaan. Het is mij iig een paar keer overkomen en dat heeft een onuitwisbare indruk achtergelaten. brrrr
Dat komt misschien ook dat wij er niet actief naar op zoek zijn!
Dat wil nog altijd niet zeggen dat het er niet is.
Als je er concreet naar gaat zoeken, dan kan je het ook vinden!
De reden dat het niet over één nacht ijs gaat, is volgens Kraszewski (KLPD) dat het om 'complexe materie' gaat. "De wil is er, maar het moet wel goed gebeuren. We moeten dus rekening houden met zaken als beveiliging en de juridische implicaties."
Zeker weer 1 van die duurbetaalde 'externen' die zijn zakken aan het vullen is bij de KLPD? :?
Hoe moeilijk en privacy-gevoelig is het om een hash database te maken van een serie plaatjes en enkel de hashes aan Leaseweb te geven.
Een gemiddelde eerste-jaars MBO-er kan zo'n taak nog wel volbrengen met 1 vinger in zijn neus... :(
Maar het zal vast wel heel moeilijk zijn voor de KLPD.....
Op die afdeling zitten geen externen....
Maar buiten dat zit er zeker wel iets meer complexiteit achter als jij denkt.
Vergeet overigens niet dat dit een gecontroleerde database is die ze zelf al in de loop der jaren hebben moeten vullen.
Ik wil jou nog wel eens spreken als je 3 dagen allemaal kp foto's heb zitten bekijken om te beoordelen of het kp is of (net) niet....
Dat heeft niet te maken met 1e jaars MBO, HBO, WO of watvoor opleiding dan ook.

Als het zo simpel is als jij probeerd voor te spiegelen had ieder korps op deze wereldbol al zo'n database opgezet met de hele meuk erachter om die bestanden op te sporen.
Vergeet niet.... Het KLPD is redelijk uniek in deze opzet. (wereldwijd!)
Het gaat bas om het resultaat .. de resulterende hashes kunnen gewoon als plaintext file geexporteerd worden. die hash lijst ljkt me verder gewoon publiek, dus op een publieke URL knallen en klaar.
Ja, ideaal voor kinderporno-verspreiders. Kunnen ze controleren of hun plaatjes al in de hash voorkomen, dus dat ze even een pixel moeten verkleuren: hoppa, hun hele verzameling in 1x niet meer herkenbaar.

De politie gebruikt die hashes natuurlijk om de verspreiding van bepaalde bestanden te tracken en zo netwerken in kaart te kunnen brengen. Lekker handig om het dan publiek te maken.

Lijkt me ook het probleem met LeaseWeb's oplossing: iemand hackt ergens in op een slecht beveiligd WiFi, gaat 1 voor 1 al zijn plaatjes proberen te uploaden, wordt 'ie geweigerd, weet 'ie ook meteen dat het plaatje bij de politie bekend is...
Tja.... de "die-hards" kan je toch niet tegenhouden... Maar moet je daarom dan kp gaan legaliseren?
Het is een onderdeel van het grote geheel!
Afbeeldingen filteren, sites blocken..... als het gaat om kp kan het mij niet ver genoeg gaan.
Als ze dan zo'n gast oppakken gelijk publiekelijk met foto, naam en toenaam aan de schandpaal nagelen!
Neeeee..... dan roepen ze (de kp misbruikers) opeens heel hard dat hun privacy aangetast wordt.
Duhhh... Daar hebben ze toch ook geen last van gehad toen ze zich met kp gingen bezighouden? Wat was er mis met de privacy van die kinderen?

Maargoed, als ze op die manier direct geraakt worden in het aantal bezoekers omdat de url's en / of afbeeldingen geblocked worden, en daarmee ook hun inkomsten, wil ik wel eens zien of ze iedere week zo'n berg werk willen blijven verzetten als ze hun inkomsten zien verdampen...
Dan geven ze het vanvanzelf wel op.
beetje een simpele denkwijze. We leven niet in een zwart-wit wereld met alleen bad guys en good guys met een dikke muur ertussen. Als er maatregleen worden genomen om op internet dingen te filteren, dan krijgt elke internetgebruiker daarmee te maken. En wie garandeert dat het alleen bij kinderporno blijft en niet bij politiek gevoelige informatie?

Zelfde als voor de kinderporno klanten. Je kunt niet zomaar hun privacy aantasten als in de wet de rechten van iedere burger staan vastgelegd. Wat weerhoudt dan de overheid nog om anderen in hun privacy aan te tasten als ze dat aan hun laars lappen?

Sowieso kun je alleen maar filteren wanneer je weet dat het materiaal niet in orde is. En als je dat weet kun je evengoed maatregelen tegen de bron ervan nemen.
Als ze zich zo druk maken om de naleving van de wet, doen ze dat wel heel eenzijdig. Degene die de wet overtreedt hoeft van mij ook geen aanspraak te maken op de wet in zijn voordeel. Toen diegene zich inliet met kp had ie ook schijt aan de privacy van het kind!

Dat het niet helemaal zwart-wit is, is natuurlijk ook wel duidelijk.

Ik heb ook al elders in dit topic de opmerking al gemaakt, het is niet alleen de vraag waar het begint, maar waar het stopt!
als het gaat om kp kan het mij niet ver genoeg gaan.
Als ze dan zo'n gast oppakken gelijk publiekelijk met foto, naam en toenaam aan de schandpaal nagelen!
Okee, jij wil een grijs gebied horen?

Je bent net 18, zit op 6VWO en krijgt iets met een 17-jarige meid uit 5HAVO. Waar normaal gesproken zich niemand druk om zou maken, maar op een gegeven moment worden jullie als stelletje betrapt.

Juridisch gezien heb je in dat geval seks met een minderjarige. Je wordt in het grote boze kinderverkrachters-bestand opgenomen, en bent voor de rest van je leven publiekelijk als vieze oude man, uitschot en crimineel bestempeld.

En dit verhaal verzin ik niet, deze situatie is in de VS al meer dan één keer voorgekomen.
Ja, ideaal voor kinderporno-verspreiders. Kunnen ze controleren of hun plaatjes al in de hash voorkomen, dus dat ze even een pixel moeten verkleuren: hoppa, hun hele verzameling in 1x niet meer herkenbaar.
Laten we de Opiumwet en de snelheidslimieten ook maar alleen bij de politie bekend houden? Zodat de hardrijder pas 119 gaat rijden als ie op de snelweg met 150 gepakt is, omdat de maximumsnelheid niet was gepubliceerd? En een coffeeshop-houder die met een volle bus met 80 kilo wiet de cel in moet, en pas achteraf hoort van 'je mag maar 2 gram voor eigen gebruik hebben'?

Zwarte lijsten met verboden materiaal achterhouden werkt niet. Een belangrijk punt van openbaarheid van bestuur is dat het publiek weet waar de grenzen van de wet liggen.
Slechte vergelijking: het is prima bekend wat de wet is en welk materiaal wel/niet is toegestaan. Als je de precieze details wil weten kun je gewoon het wetboek erop na slaan. Dit komt niet voor uit de hashes (al helemaal niet omdat het slechts een deelverzameling is van al het verboden materiaal).

Het gaat hier erom van welke specifieke plaatjes de politie weet dat ze bestaan en kan traceren. Om je vergelijking met auto's (altijd fijn) vol te houden: de politie maakt ook niet bekend waar ze snelheidscontroles of drankcontroles gaan houden (soms wel, maar meestal niet). Die informatie is niet publiek en dat zou ook handhaving alleen maar benadelen.

Het openbaarmaken zou niet bijdragen aan het bekendmaken van de grenzen, mensen weten nu ook echt wel wanneer iets kinderporno is.
De database vullen is moeilijk.

Een servertje op zetten waar Leaseweb een hash heen kan sturen en een niet/wel KP respons terug kan krijgen is erg simpel. De database past vrijwel zeker geheel in het geheugen met een goede index structuur (op het eerste gezicht zou ik zeggen radix/patricia). Zolang je niet stom bent en probeert het op te lossen met een SQL database is het een koud kunstje om snelle matching te doen.

Natuurlijk zijn MD5 hashes makkelijk te manipuleren, maar het is beter dan niets (en veel beter dan deep packet filteren bij ISPs).

[Reactie gewijzigd door Pinkys Brain op 26 juli 2024 04:58]

Wie komt er eens per ongeluk op een kinderporno site dan?
Wie willen we tegen kinderporno weren dan?

Iemand die er niks mee te maken wilt hebben komt er toch niet op en degene die er wel mee te maken wil hebben heeft wel andere manieren om het te bereiken.

Dit heeft 0% te maken met kinderporno.
Dit heeft 0% te maken met kinderporno.
En ik maar denken dat ik soms kort door de bocht ben.....

Wat dacht je van het zorgen dat de betrokken sites waar je kp kan vinden om die te blocken?
Geen bezoekers = ook geen inkomsten uit advertenties
Geen inkomsten.... dan stop de site er vanzelf mee door een gebrek aan geld!
Als een site ermee stopt, heeft de aanbieder van kp aan die sites ook minder / geen afzetmarkt meer en daarmee perk je ook gelijk het misbruik van de kinderen in!
Ik snap je niet helemaal?
waarom kort door de bocht?
Denk jij dat die Filter er wel komt voor KP?
Ik denk van niet maar Onder de mom van KP kan je veel maken want wie is daar nou niet tegen.
Ik denk dat de kop in het topic duidelijk genoeg is.
[...] filtering kinderporno
Maar om te zeggen dat die database 0% met kp te maken heeft is een beetje te kort door de bocht.
Van mij mogen ze die filter inzetten! Maar zoals ik al eerder heb gezegd, het is niet alleen de vraag waar het begint... (kp), maar ook waar het stopt!
Natuurlijk kan er in die database van alles bijgepropt worden om even een simpel voorbeeld te geven, auteursrechtelijk beschermd materiaal.
Moet je daarvan wakker liggen als gemiddelde internetgebruiker dat je geen illegale downloads meer kan maken? Neuhhh..... ik kan er niet echt wakker van liggen.
(ben altijd al voorstander geweest van opensource, open standaarden en GPL :) )

Het zal wel nooit 100% uitgebannen kunnen worden, maar je kan het wel inperken!
Als iedereen zich altijd aan de wet zou houden hoefden er ook nooit meer straffen cq. boetes uitgedeeld te worden.
[...
]Als een site ermee stopt, heeft de aanbieder van kp aan die sites ook minder / geen afzetmarkt meer en daarmee perk je ook gelijk het misbruik van de kinderen in!
Bot economisch gezegd: Dan is de vraag er nog wel, maar geen aanbod meer. Als je alle kinderporno in de wereld van het internet zou kunnen wipen, ben je niet gelijk ook alle pedofielen kwijt. Net zo min als je alle alcoholisten niet kwijt bent als de alcohol weg is.

En geen aanbod van KP betekent dus wel dat de vieze oude man die naar het schoolplein zit te kijken en zich noodgedwongen aan echte kinderen moet vergrijpen, wel een stap dichterbij komt, en er meer kinderen het slachtoffer worden.

Nee, dat praat het niet goed, maar het is wel the lesser of two evils.
Komaan zeg.... Als er iets simpel is dan is het die database wel.
Juridische implicaties = 0
We hebben het hier over een grote verzameling aan MD5-hashes van bestanden waarvan bekend is (!!!) dat het kp betreft! Niks meer en niks minder.
Anoniem: 189986 @]Byte[25 maart 2010 11:24
Maar het heeft wel implicaties voor de opsporingsmogelijkheden. Door de hashdatabase vrij te geven kunnen verspreiders van kinderporno ook zien op basis van welke hashes door het KLPD wordt opgesproord en kunnen ze deze gaan omzeilen door een bit in de afbeelding te wijzigen waardoor het KLPD achter de feiten aanloopt. Het kat-en-muisspel tussen KLPD en verspreiders van kinderporno wordt hiermee vereenvoudigd voor deze verspreiders. Dat lijkt me onwenselijk.
Klopt helemaal wat je zegt....
Het is een beetje dezelfde situatie rondom de zwartelijst met websites met kp die op die manier door providers geblocked kunnen worden.

Dit artikel zegt genoeg over het lekken van dergelijke databases.
Als iemand ziet dat ie op de lijst staat, gaat ie gewoon naar een nieuw domein toe.
(buiten die tandarts dan....)
Het zal altijd kat-en-muisspel blijven zolang er van die ranzige gekken op deze wereldbol blijven rondlopen die zich op dergelijke manieren "verheerlijken" aan kinderen.
Het lekken van dergelijke lijsten hebben nog een nadelig neven-effect. Mensen zouden ermee op het idee gebracht kunnen worden en gaan vervolgens dat soort sites juist bezoeken omdat ze die lijsten zien en van kwaad tot erger vervallen.

[Reactie gewijzigd door ]Byte[ op 26 juli 2024 04:58]

Is het ook niet zo dat dit false positives oplevert? Jouw gewone plaatje kan in theorie hashen naar dezelfde hash als een KP plaatje. Kans is heel klein, ik geef het toe, maar op heel veel uploaders aanwezig. Staat de politie ineens aan je deur omdat je een vakantieplaatje hebt geshared...

Daarbij hoef je maar 1 pixel te veranderen in je KP plaatje en je kunt 'm wel uploaden, want dan is de hash anders. Ik snap niet zo goed waar die KP hype ineens vandaan komt, alsof je niet gewoon melding kunt maken als je het tegenkomt :s
False positives mogelijk... Euhhh.... ja!
Maar om je een idee te geven wat je nodig hebt bij 1 druppel water... (volgens nsrl)

CRC-32 - 232 - 4.29 X 109 All the water in a small pond
MD5 - 2128 - 3.40 X 1038 All the water in our galaxy
SHA-1 - 2160 - 1.46 X 1048 All the water in our universe

10 These values are for comparisons of relative size and assume the following: there are approximately 20 drops of water per ml, the volume of water on earth is 1.3x109 km3, and that each star in our galaxy contains an earth-like volume of water. Additionally, that there are approximately 4x1011 stars in our galaxy, and 8x1010 total galaxies in our universe.

Kijk eens in dit document op pagina 7 wat is geschreven over de collision-kansen.

[edit]
sorry voor de belabberde opmaak, maar het lukt nu ff niet anders. Zie de link voor een beter leesbaar resultaat.

[Reactie gewijzigd door ]Byte[ op 26 juli 2024 04:58]

de kans dat jouw ene plaatje matched met een ander plaatje is idd zo groot.

maar de kans dat een van de vele miljarden plaatjes matches op internet matched met een key van een KP plaatje is vele, vele malen groter, en zal daardoor veel regelmatiger voorkomen.

edit : mtoneman heeft hierboven de naam van dit probleem al aangegeven the: birthday paradox.
de kans dat jouw ene plaatje matched met een ander plaatje is idd zo groot.

maar de kans dat een van de vele miljarden plaatjes matches op internet matched met een key van een KP plaatje is vele, vele malen groter, en zal daardoor veel regelmatiger voorkomen.
KP plaatjes zijn al een subset van normale plaatjes. En ik denk niet dat dat aantal tot miljarden op gaat lopen, als je de manier van filtering 'standaardiseert' kom je al op een aardig kleiner aantal uit.

Als je een foto-bestand 1-op-1 door de MD5 heen zou trekken, dan verandert die hash inderdaad als je er één pixel van om gooit of hercomprimeert. Dan worden het heel veel verschillende hashes voor één en dezelfde foto, en wordt je kans op een false-positive alleen maar veel groter.

De beste manier is om zo'n plaatje om te bouwen tot een 'gelijkgetrokken' format, dus bijvoorbeeld alles resizen naar 640x480, 32 bits per pixel, en dat blok data (bytes, pixels) door de MD5 heen halen. Dan maakt het dus niet uit of je een foto resized of anders comprimeert voordat je 'm uploadt, de foto blijft in feite namelijk hetzelfde. Een creatieveling kan natuurlijk nog altijd met Photoshop aan de slag, dus kaderen, croppen of kleuren bijwerken als 'zijn' plaatje is geblacklist, maar het wordt al een stuk moelijker.
Anoniem: 112442 25 maart 2010 12:17
Even naar de leaseweb gegaan. Hier kan ik nergens vinden dat ze filteren. Had ik wel verwacht van ene bedrijf dat er zo'n speerpunt van maakt.

Het lijkt me toch het minste dat je je klanten duidelijk laat weten dat je filtert.
En dat de klant mag aangeven of hij van deze dienst gebruik wil maken.

Ik zou zo'n filter niet willen om een drietal redenen:
1) Ik ben tegen welke vorm van censuur dan ook.
2) Je kunt false positives krijgen omdat content onterecht als kinder porno aangemerkt wordt.
3) Ik ga niet naar deze sites, en ik hoop dat ze verdwijnen doordat de personen die dit soort zaken produceren een gepaste straf krijgen.
4) Deze personen moet vervolgd worden en niet gefilterd.

Alle landen moeten maar eens zo veel energie steken in het voorkomen van kinderporno en mensen handel als ze nu in ACTA doen c.q. IMO naar de mensen luisteren.
Ik zou zo'n filter niet willen om een drietal redenen:
1) Ik ben tegen welke vorm van censuur dan ook.
2) Je kunt false positives krijgen omdat content onterecht als kinder porno aangemerkt wordt.
3) Ik ga niet naar deze sites, en ik hoop dat ze verdwijnen doordat de personen die dit soort zaken produceren een gepaste straf krijgen.
4) Deze personen moet vervolgd worden en niet gefilterd.
Het zijn een viertal redenen die je opgeeft... ;)
1 - helemaal mee eens. De vraag is niet waar het begint, maar waar het stopt!

2 - beter een false-positive dan een false-negative

3 - Ik ga er ook niet heen, maar helaas nog wel teveel andere mensen waardoor ze ook de geldstromen van deze sites in stand houden.
- Gepaste straf? Daar heb ik er maar eentje voor. Villen met de kaas-schaaf!

4 - Filtering is nog de makkelijkste stap! Vervolging kan je pas doen als je er een persoon aan hebt weten te koppelen. Door filtering toe te passen maak je de bereikbaarheid van die sites weer moeilijker en daardoor lopen ze ook weer inkomsten mis. (en hopelijk moeten ze de deuren sluiten wegen gebrek aan geld)
Ik snap het probleem niet met het delen van die hash-databse. Uit die database valt verder niets te halen. Alleen hashes. Er is geen privacyding aan de orde of iets dergelijks.
En als je er nu slechts 10% van alle dubieuze zaken kunt voorkomen.. dan is dat toch dikke winst?
En als je er nu slechts 10% van alle dubieuze zaken kunt voorkomen.. dan is dat toch dikke winst?
Of dat winst is hangt er vanaf wat het kost. Velen vinden de prijs (ieders gang op internet volgen alsof we allemaal verdachte zijn) te hoog.

Op dit item kan niet meer gereageerd worden.