Amerikaanse onderzoekers zeggen dat een programma om auteurs van literaire werken te identificeren, aangewend kan worden om uit te vissen welke stukjes 'terroristische propaganda' van dezelfde schrijver zijn.
Volgens Hsinchun Chen van het Dark Web-project van de universiteit van Arizona laten schrijvers van postings op het web onbedoeld sporen achter die kunnen worden gebruikt om verschillende teksten tot dezelfde persoon te herleiden. De aanhef van de tekst, de gebruikte woorden en interpunctie, maar ook de wijze waarop attachments worden gecodeerd: het zijn allemaal potentiële features die de auteur kunnen ontmaskeren.
Het programma Writeprint van de universiteit is afgeleid van een literatuurtool die oorspronkelijk was ontwikkeld om de authenticiteit van werken van William Shakespeare te verifiëren. Het maakt gebruik van 480 verschillende factoren, waaronder woordfrequenties, het webadres, de gebruikte lettertypes en het gebruik van speciale karakters. Volgens Chen kan het programma met een nauwkeurigheid van 95 procent vaststellen of een posting of email van de hand van een bepaalde auteur is. Wie dat dan precies is, komt niet uit Writeprint rollen; enkel dat verschillende stukken tekst bijelkaar horen. Het identificeren van de schrijver is voor rekening van de inlichtingendiensten, waarvan er volgens de wetenschapper enkele op het punt staan de techniek toe te gaan passen.
Een vergelijkbare techniek werd in Nederland bekend door de affaire Marek van der Jagt: een computerprogramma ontdekte vijf jaar geleden dat Arnon Grunberg schuilging achter deze opvallend goede onbekende schrijver. De reden: Grunberg liet onbewust karakteristieke kenmerken in zijn schrijfsels achter, en het computerprogramma kon, doordat bij het comprimeren van de teksten van Van der Jagt en Grunberg gelijksoortige patronen opdoken, de onbekende schrijver ontmaskeren. Het verschil met de door de universiteit van Arizona ingezette techniek is dat laatstgenoemde met een voorgebakken featureset van 480 kenmerken werkt, terwijl de door Italiaanse wetenschappers ontwikkelde tool die Van der Jagt ontmaskerde, zelf op zoek gaat naar identificerende kenmerken.