Jigsaw, een bedrijfsonderdeel van Google, gaat een api genaamd Perspective uitbrengen die via slimme algoritmes in staat is commentaren met ongewenst taalgebruik te herkennen. Perspective moet de moderatie op nieuwssites vereenvoudigen en daarmee de discussie bevorderen.
Perspective is specifiek bedoeld voor uitgevers van nieuwsmedia. Dat heeft Jared Cohen, directeur van Jigsaw, gezegd in een bericht over Perspective. De api werkt door middel van het toekennen van een beoordelingsscore aan elke individuele comment. Een algoritme bekijkt daarbij in hoeverre de taal in een comment overeenkomsten vertoont met het taalgebruik in comments waarvan mensen hebben gezegd dat ze als 'toxic' moeten worden beschouwd. Daaronder vallen schelden, flamen en ander boosaardig, negatief taalgebruik.
Om dit mogelijk te maken heeft Perspective honderdduizenden berichten geanalyseerd die door menselijke moderators als giftig werden betiteld. Bepaalde woorden die overwegend als toxic worden gezien, komen op een zwarte lijst. Daarbij helpt ook de feedback van lezers. Als via Perspective een comment ten onrechte als giftig is aangemerkt en eventueel zelfs is verwijderd, en een lezer blijkt daar terecht over te klagen, dan leert de api daar weer van. In de toekomst merkt deze soortgelijke berichten dan niet meer als ongewenst aan. Hoe vaker de api wordt ingezet en hoe meer commentaren langs de algoritmes van Perspective gaan, des te beter moet de technologie in staat zijn om het kaf van het koren te scheiden.
Nadat Perspective een comment op een zwarte lijst heeft gezet, kan de nieuwsuitgever bepalen wat ermee moet gebeuren. Zo kan er gekozen worden om de gemarkeerde comment nog eens door de eigen menselijke moderators te laten beoordelen, waarna kan worden bepaald of deze niet wordt toegelaten of toch deel mag uitmaken van de conversatie. Uitgevers kunnen er ook voor kiezen om lezers de comments te laten sorteren, zodat ze de meeste giftige opmerkingen eruit kunnen filteren en zodoende toegang krijgen tot een inhoudelijke en betere discussie.
Jared Cohen, de directeur van Jigsaw, heeft telefonisch aan Tweakers toegelicht dat Perspective tot doel heeft om onlineconversaties te verbeteren en uitgevers te helpen met het terughalen van lezers die door flaming zijn afgehaakt. Hij is echter niet bang dat de tool wordt gezien als ongewenste censuur. "De modellen zijn niet ontworpen voor het direct toepassen van censuur; daar zijn ze helemaal niet effectief voor. We vinden het heel belangrijk dat iedereen in principe kan zeggen wat hij of zij wil zeggen."
Jigsaw heeft Perspective uitgebreid getest bij The New York Times. Bij de krant uit New York werkt een team van redacteuren om handmatig alle commentaren te beoordelen voordat ze online onder de nieuwsberichten komen te staan. Het gaat dan soms wel om 11.000 commentaren die dagelijks moeten worden beoordeeld. Door dit grote aantal heeft de Amerikaanse krant bij slechts 10 procent van de geplaatste artikelen commentaren. Jigsaw hoopt dat dit percentage door het gebruik van Perspective aanzienlijk zal gaan stijgen, doordat het moderatieproces wordt versneld.
Perspective is ook getest bij Wikipedia en er wordt een experiment gestart bij de krant The Guardian. Cohen wilde niet zeggen of Perspective ook met Twitter heeft gesproken en of de samenwerking met nieuwsmedia zoals The New York Times samenhangt met eventuele financiële banden tussen Google en het nieuwsmedium.
De api moet via feedback van gebruikers ook steeds beter in staat zijn om rekening te houden met de culturele verschillen ten aanzien van de betekenis van een woord. Zo wijkt de Amerikaanse betekenis van het woord pissed sterk af van de Britse definitie; een Amerikaan denkt al snel aan 'boos', terwijl een Brit in een bar dit woord gebruikt als synoniem voor 'dronken' zijn. Vooralsnog is de api alleen te gebruiken bij Engelstalige comments, maar Cohen wil de technologie uiteindelijk geschikt maken voor gebruik bij zoveel mogelijk verschillende talen.
Perspective wordt nog verder doorontwikkeld. Er zijn ongeveer tienduizend commentaren nodig om een simpel werkend model te laten functioneren; minimaal honderdduizend berichten zijn nodig om de api volledig te laten functioneren. Op termijn wil Jigsaw de api verder doorontwikkelen, zodat niet alleen maar toxic taalgebruik wordt gesignaleerd, maar dat ook off-topic commentaren en irrelevante bijdragen worden geïdentificeerd.