Een groep onderzoekers is in staat met behulp van een algoritme het geslacht van een auteur te bepalen aan de hand van zijn tekst, zo meldt Boston Globe Online. De onderzoekers hebben een algoritme ontwikkelde dat een anonieme tekst kan doorkijken en kan voorspellen of de auteur mannelijk of vrouwelijk is. De voorspellingstechniek is gebaseerd op het gebruik van kleine woorden: 'je', 'ik', 'een' of 'veel' kan al weggeven of de schrijver wel of geen piemel in zijn broek heeft hangen . Het gebruik van veel persoonlijke voornaamwoorden wijst op een vrouwelijke auteur; mannen gebruiken veel aanwijzende voornaamwoorden en telwoorden.
Ook het gebruik van bepaalde woordconstructies kan verraderlijk zijn: waar mannen het hebben over een 'tuin met rozen', spreken vrouwen over een 'rozentuin'. Om dit soort merkwoorden te achterhalen, hebben de onderzoekers ruim zeshonderd teksten uit het British National Corpus onderzocht. Allereerst werden alle woorden die kenmerkend waren voor het onderwerp van het boek verwijderd. De overgebleven teksten worden door een algoritme gevoerd. Dit algoritme zocht naar woorden die veel vaker voorkwamen in de teksten van een bepaald geslacht en gaf een dergelijk woord een geslachtsindicatie mee.
Uit de zeshonderd teksten kwamen ongeveer vijftig woorden rollen, die zouden moeten kunnen aangeven van welk geslacht de auteur zou moeten zijn. Na een test met nieuwe teksten bleek tachtig procent van de voorspellingen aan de hand van deze techniek te kloppen. Een verklaring voor deze dingen ligt in het oude gezegde "Vrouwen praten over mensen, mannen over dingen." Om mensen aan te geven gebruik je persoonlijke voornaamwoorden, voor dingen maak je meer gebruik van telwoorden. Juist door dergelijke ouderwetse vooroordelen en gezegden stuitte het onderzoek op veel kritiek:
A rather controversial one, too. When the group submitted its first paper to the prestigious journal Proceedings of the National Academy of Sciences, the referees rejected it ''on ideological grounds,'' Koppel maintains. ''They said, `Hey, what do you mean? You're trying to make some claim about men and women being different, and we don't know if that's true. That's just the kind of thing that people are saying in order to oppress women!' And I said `Hey-I'm just reporting the numbers.'''