Een nieuw computermodel moet dubbelzinnige grappen beter kunnen identificeren. Dat gebeurt door te checken of woorden en zinsdelen ook voorkomen in erotisch werk. Het model heeft nog wel een hoog percentage 'false positives'.
Het model gebruikt een methode die door de onderzoekers in de onderzoekspaper DEviaNT wordt genoemd: Double Entendre via Noun Transfer. De methode checkt zinnen op zinsdelen die ook in erotisch werk worden gebruikt. Zo concludeerden de onderzoekers dan een zin met het woord 'banaan' erin meer kans heeft om dubbelzinnig bedoeld te zijn dan een zin met het woord 'deur'.
Naast woorden worden ook zinsdelen onder de loep genomen. Via een berekening moet vervolgens achterhaald worden hoe groot de kans is dat een zin dubbelzinnig is bedoeld. Het doel van het onderzoek is het verbeteren van het begrip van humor door computers. Dat slaagt deels: het model levert nog veel 'false positives', waarbij een zin onnodig als dubbelzinnig wordt opgevat, omdat er woorden in worden gebruikt die ook in erotisch werk terugkomen.
De onderzoekers richtten zich specifiek op 'That's What She Said'-grappen uit de comedyserie The Office. Daarbij spreekt iemand een normale zin uit, die echter dubbelzinnig wordt gemaakt doordat iemand anders de zin 'That's what she said' eraan toevoegt.