Nu nog een model dat het kan definiëren, want er is nog geen eenduidige definitie.
Dat klopt, en tegelijkertijd lukt het ons mensen het prima om te doen alsof die definitie wel bestaat. In het dagelijks leven in de rechtsspraak. Het is niet perfect maar meestal weten we wel of iets hatelijk is of niet.
Zouden termen als blank, neger en allochtoon ook als haatspraak gedetecteerd worden?
Niet alleen op grond van een woord, het gaat juist om het meenemen van context.
En kan het model omgaan met sarcasme?
Ja, state-of-the-art taalmodellen kunnen daar heel aardig mee overweg.
Owja, schrik niet als ze dwars door een dubbele laag sarcasme heenprikken, hondenfluitjes herkennen doen ze prima.
Ik denk dat het gebruik van 1 model nooit kan werken. Concurerende modellen voor verschillende platformen zou beter zijn.
Helemaal mee eens, diversiteit is belangrijk.
Anders komt er straks 1 woord op een blacklist(ook dat woord is tegenwoordig haatspraak) en kun je dat nergens meer uiten.
Daar zou ik me geen zorgen over maken, de technieken van tegenwoordig zijn juist niet afhankelijk van een enkel woord. De oude filtersystemen werken met vaste lijstjes verboden woorden. Het gaat er juist om dat de nieuwe systemen dat beter doen omdat ze niet zozeer kijken welke woorden je gebruikt maar hoe je gebruikt.
Als ik de hond van de buren een teef noem is er niks aan de hand, als ik de buurvrouw zo noem....
Zou het model ook rekening houden met de tinestamp van het bericht? Een term die nu als beledigend gezien wordt was het toen misschien niet. In dat geval zou het handhaven met terugwerkende kracht niet juist zijn.
Dat ligt denk ik aan hoe je het model wil inzetten en wat probeer je te bereiken. Als je bepaalde dingen niet wil lezen dan wil je ze ook niet lezen als ze vroeger geschreven zijn. Als je wil weten hoe mensen vroeger over elkaar dachten dan wil je ook weten of iets toen als hatelijk werd gezien of niet.
Een term die nu als beledigend gezien wordt was het toen misschien niet.
Als het alleen om de term gaat dan zouden deze filters daar juist heel goed mee om moeten gaan omdat ze voorbij die term kunnen kijken naar de onderliggende boodschap.
Het moeilijke hierbij is dat we er ook even bij moeten vragen door wie een term als wel/niet beledigend gezien wordt en wat de gevolgen zijn. Een (halve) eeuw geleden was het sociaal acceptabel om kinderen te slaan, zelfs als het om kinderen van vreemden ging. Tegenwoordig zijn we van mening dat kinderen slaan nooit de beste oplossing is. Betekent het dat ze vroeger niet van hun kinderen hielden? Nee, natuurlijk niet. Maakt het dat het acceptabel om geweld goed te praten omdat het "vroeger" was? Nee, dat niet.
We kunnen best terugkijken en zeggen dat het gedrag van toen fout was, zelfs als er goede bedoelingen achter zaten.
Zo ook met beledigingen. Dat bepaalde opvattingen honderd jaar geleden heel normaal waren maakt ze nog niet onschuldig. Achteraf terugkijkend kunnen we nog steeds besluiten dat bepaalde termen of opvatting kwetsend waren, ook al zag de maatschappij dat toen anders.