Hoofdcategorieën
Device Settings

Literatuurtool moet terroristen opsporen

Door Mick de Neeve, maandag 12 november 2007 15:36, views: 8.733

Amerikaanse onderzoekers zeggen dat een programma om auteurs van literaire werken te identificeren, aangewend kan worden om uit te vissen welke stukjes 'terroristische propaganda' van dezelfde schrijver zijn.

gemaskerde computerterrorist Volgens Hsinchun Chen van het Dark Web-project van de universiteit van Arizona laten schrijvers van postings op het web onbedoeld sporen achter die kunnen worden gebruikt om verschillende teksten tot dezelfde persoon te herleiden. De aanhef van de tekst, de gebruikte woorden en interpunctie, maar ook de wijze waarop attachments worden gecodeerd: het zijn allemaal potentiële features die de auteur kunnen ontmaskeren.

Het programma Writeprint van de universiteit is afgeleid van een literatuurtool die oorspronkelijk was ontwikkeld om de authenticiteit van werken van William Shakespeare te verifiëren. Het maakt gebruik van 480 verschillende factoren, waaronder woordfrequenties, het webadres, de gebruikte lettertypes en het gebruik van speciale karakters. Volgens Chen kan het programma met een nauwkeurigheid van 95 procent vaststellen of een posting of email van de hand van een bepaalde auteur is. Wie dat dan precies is, komt niet uit Writeprint rollen; enkel dat verschillende stukken tekst bijelkaar horen. Het identificeren van de schrijver is voor rekening van de inlichtingendiensten, waarvan er volgens de wetenschapper enkele op het punt staan de techniek toe te gaan passen.

Arnon Grunberg (Café de Wereld)Een vergelijkbare techniek werd in Nederland bekend door de affaire Marek van der Jagt: een computerprogramma ontdekte vijf jaar geleden dat Arnon Grunberg schuilging achter deze opvallend goede onbekende schrijver. De reden: Grunberg liet onbewust karakteristieke kenmerken in zijn schrijfsels achter, en het computerprogramma kon, doordat bij het comprimeren van de teksten van Van der Jagt en Grunberg gelijksoortige patronen opdoken, de onbekende schrijver ontmaskeren. Het verschil met de door de universiteit van Arizona ingezette techniek is dat laatstgenoemde met een voorgebakken featureset van 480 kenmerken werkt, terwijl de door Italiaanse wetenschappers ontwikkelde tool die Van der Jagt ontmaskerde, zelf op zoek gaat naar identificerende kenmerken.

Volgende 16:05 Privacytoezichthouder EU tegen antiterreurplannen
Vorige 14:54 Radiohead en comScore twisten over albumdownloadcijfers
Advertentie

Reacties

«  1  2  3  »

'Een beetje van jezelf en een beetje van Bayes' ;)

Ongewenst? mijn fout, ik had het een wat uitgebreidere reactie moeten maken:

Kennelijk missen nameijk veel van jullie waar ik het over heb.

Met Bayesiaanse statistieek/algoritmen kun je naast het trainen op het herkennen van spam ook behoorlijk goed gebruiken op het herkennen van auteurs en verschillende talen.

Relevante link, oa: http://johnmcox.org/bayes_shakespeare

[Reactie gewijzigd door Starfish op maandag 12 november 2007 17:15]



Niet iedereen hier is tweaker, niet iedereen weet wie Bayes is, en je kunt niet van iedereen verwachten dat hij of zij voor elke term Google opent en iets op gaat zoeken.

Ja en nee... eigenlijk zou je namelijk ook kunnen stellen dat niet iedereen reacties zou moeten modereren zonder te snappen waar het over gaat.

Edit: wat kennelijk wel gebeurt, zoals deze algemene opmerking ook treft... zucht

[Reactie gewijzigd door Starfish op dinsdag 13 november 2007 11:44]


Als dit echt goed werkt, zal dat zeker een mooie ontwikkeling zijn.
Niet dat een terrorrist zich hier ook maar iets van zal aantrekken.

:P je bent een terrorrist of je bent het niet :P

Daarbij komt wel dat dit wellicht ook gebruikt kan worden door grote scholen.
Als er op websites dreigementen ofzo worden gepost tegenover docenten of medeleerlingen, kunnen ze zo misschien nagaan of het iemand van school is :)

Tsja en weer een techniek die dmv het woordje "anti-terrorisme" de hemel in geprezen wordt.
Je kunt deze technieken ook gebruiken om klokkenluiders op te sporen en mensen die minder geliefd zijn in bepaalde regimes. Denk even aan de verzetskrantjes die wij hier in de 2e wereldoorlog hadden.

Oftewel blijf altijd kritisch kijken naar ontwikkelingen.

lastig, in dat geval gaat het vaak om kleine stukjes tekst. Deze methode werkt alleen met minimaal een aantal pagina's aan woorden. kleine kans dat commentaar van een scholier tegenover een docent zo goed onderbouwt is.

Als je dit als terrorist weet, weet welke karakteristieken worden gebruikt dan is dit (wel met de nodige moeite) toch prima te omzeilen. Dingen als lettertypes e.d. zijn niet moeilijk aan te passen immers.

Ik denk dat er nog genoeg andere dingen overblijven om iemand aan te herkennen, het gaat ja ook nog om de tekst die je schrijft en hoe je deze schrijft.

Nou kan ik me voorstellen dat dit inderdaad prima werkt bij schrijvers omdat er gewoon heel veel materiaal beschikbaar is, maar voor een terrorist die eens hier en daar wat achterlaat lijkt me dit een stuk moeilijker, met als gevolg een boel false positives.

Nee, maar een lettertype is maar 1 van de vele factoren die het programma gebruikt om zo tot een profiel te komen. Het zou dus misschien maar zo'n 0,001%(even overdreven) uitmaken of je het lettertype manipuleert of dat je je eigen lettertype/patroon gewoon blijft gebruiken.

En toen werden terroristen creatief en gingen ze communiceren middels cartoons en strips :P

Uit een 'tekening' kun je nog veel gemakkelijker overeenkomsten halen. Het is in zekere zin vergelijkbaar met een handtekening.

Met de tools die ik ken die dit kunnen (ik ken ze zeker niet allemaal) kan je ook teksten genereren. Dan kan je ook mensen verdacht gaan maken.

Het lijkt me inderdaad geen onmogelijke taak om met behulp van zo'n programma, een tekst zo te tweaken dat het overeenkomt met de schrijfstijl van iemand anders. Ik hoop dus niet dat de uitslag van een dergelijk programma als bewijs gebruikt gaat worden. Maar als opsporingsmethode vind ik het een erg mooie techniek.

Dit is wel leuk. Je hebt tegenwoordig van die dingen die vergelijken op wie jij lijkt, maar als er ergens een tooltje is dat (uiteraard minder intensief) wat zoekt naar jouw schrijfstijl, is het wellicht toch leuk om eens je opstellen en papers voor Nederlands en Engels door dat ding heen te slaan, dan weet je misschien meteen in welke hoek je moet zoeken als je weer eens een boek wilt lezen...

Een soort LAST.FM, maar dan voor boeken.
Ervanuitgaand dat mensen graag boeken lezen in dezelfde stijl als dat ze die zelf zouden schrijven.

last.fm kijkt natuurlijk naar wat je verder luisterd, en ook niet naar wat je zelf maakt. Maar toch, het idee is leuk.
«  1  2  3  »

Op dit item kan niet meer gereageerd worden.

Volgende 16:05 Privacytoezichthouder EU tegen antiterreurplannen
Vorige 14:54 Radiohead en comScore twisten over albumdownloadcijfers
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011