TikTok geeft toe dat het onschuldige woorden blokkeerde in Duitsland

ByteDance, het Chinese moederbedrijf van video-app TikTok, heeft toegegeven dat het in Duitsland onschuldige woorden blokkeerde. Dat gebeurde per ongeluk, betoogt het bedrijf. Het woordfilter zou te strak afgesteld zijn geweest.

ARD-tv-programma Tagesschau ontdekte de woorden bij het plaatsen van reacties op TikTok. Daarbij ging het om woorden als 'gay', 'heteroseksueel', 'homofoob' en 'porno', zo is te zien in de lijst. Ook de naam van Peng Shuai komt voor. Shuai is een Chinese professionele tennisster die een Chinese politicus beschuldigde van seksueel misbruik en vervolgens enige tijd verdween.

Volgens TikTok was het woordfilter te strak afgesteld. Zo zou de naam van de tennisster geblokkeerd zijn omdat daarin de lettercombinatie 'hua' zit, wat een Oostenrijks scheldwoord zou zijn om een vrouw als prostituee aan te duiden. Het is onduidelijk waarom het filter geen verschil zag tussen een los woord en een aaneengeschreven naam.

De blokkade van de termen is opgeheven. Die blokkade zat alleen op de reacties. Een woordfilter moet het plaatsen van reacties met ongewenste termen daarmee onmogelijk maken. Dat is een geautomatiseerd systeem en heeft geen menselijke moderatie. Het is onbekend of er in Nederland en België ook onschuldige woorden en termen op de lijst staan.

Verboden woorden volgens Tagesschau homophob Peng Shuai schwul
Auschwitz homosexuell Porno Sex
gay LGBTQ Pornografie Sexarbeit
Heterosexuelle LGBTQI Prostitution Sklaven
homo Nationalsozialismus queer Terroristen

Door Arnoud Wokke

Redacteur Tweakers

24-03-2022 • 11:59

78

Reacties (78)

Sorteer op:

Weergave:

Dat is lang geleden, viezewoordenfilters die niet op hele woorden checken. Toen mocht je soms niet eens zeggen dat je in Sexbierum of aan de Kuttingerweg woonde.

Inhoudelijk: per abuis Duitsland aangevinkt terwijl dit filter in China actief had moeten zijn?
In het Engels ook wel bekend als het Scunthorpe-probleem. Zoals op die pagina te lezen is, zo af en toe nog steeds relevant in deze tijd.
Een lijstje; wel goed om deze lijst in je tests in te bouwen: https://github.com/daniel...-naughty-strings.txt#L640

Scunthorpe, Penistone, Jimmy Clitheroe, Horniman Museum, shitake mushrooms, Super Bowl XXX, classic, en Arsenal komen daar onder andere in voor.
Shitterton! Met hun mega-zware stadsnaam.
Ik had ooit een collega die Dick heette en zijn mail niet kon versturen omdat zijn naam in de handtekening stond van de mail. Dit was een Engels bedrijf en collega in kwestie was dan ook "not amused"

[Reactie gewijzigd door P_Tingen op 23 juli 2024 18:41]

toevallig niet Dick Decock ;) ?
Mijn Opa heet ook Dick. Al heet hij eigenlijk Dirk, maar toen hij bij de KLM ging in de tekenkamer vonden ze "Dirk" wat te boers klinken (hij kwam van het platte land), daarom hebben ze hem als Dick in de boeken gezet. Veel beschaafder.
Linda Callahan
evaluate
mocha
expression
Ik mis even waar hier de vieze woord zitten?

Ik heb in het verleden overigens wel eens een game gespeeld die ook zo'n filter had en zelfs het woord 'document' werd daarin gecensureerd, alsmede combinaties zoals 'of against'.

[Reactie gewijzigd door Zyppora op 23 juli 2024 18:41]

"call", "eval", "mocha" en "expression" kunnen in Javascript en andere script talen gebruikt worden om willekeurige code uit te voeren. Dus in plaats van te zorgen dat user strings goed ge-escaped worden, hadden ze ervoor gekozen om deze termen nogal rigoreus te vervangen door synoniemen.
Volgense de wiki : Linda Callahan

edit: Rotterdammertje heeft het over de CALL, maar meneer Kallahar had ook problemen...

[Reactie gewijzigd door Jeroen73 op 23 juli 2024 18:41]

Of zelfs je achternaam die gefilterd zou worden:
https://www.linkedin.com/in/sarah-butt-8549b1180/
Nee, eerder filter: kijken hoe ver we kunnen gaan met het filteren.
Denk dat er genoeg andere woorden zijn, die gefilterd worden. Maar ons niet opvallen.
Je kunt zo creatief zijn als je zelf wilt en als je iets verbied dan komt het kleine kind naar boven.

Porno is p0rn0 of anders p0ru0, en als je het allemaal gaat verbieden pak je simpelweg een andere taal.

Kurwa betekent zoiets als shit/kut maar strak vertaald weer hoer en je kunt het in meerdere contexten gebruiken. Maar het staat niet in de vandale 🙂
Het is toch gewoon pr0n? Wie gaat er nou op die andere wijze dat schrijven?

Aan de andere kant zijn er al tijden manieren om dat soort 'filters' te ontwijken, speciale tekens die er hetzelfde uitzien maar niet in het filter voorkomen.

Maar ik vind het vooral heel erg kleinzerig dat het gefilterd wordt. Ik erger mij groen en geel als er in een videoclip of op de radio een keer de 'nigger' of 'fuck' wordt 'weggeblurred' (al dan niet bewust door 2 versies van een nummer). Men kent de daadwerkelijke tekst van de 'explicit' versie en er wordt veel meer aandacht op dat 'foute' woord gelegd door het juist niet te laten horen.

Ik speel zo ook op een RolePlay server van het spel Rust, en voor welke acties je daar wel niet op de vingers wordt getikt is echt belachelijk, terwijl de basis van het spel toch wel het toxic gedrag is (niet dat dit de focus is op een RP server, maar elkaar een klein beetje naar het leven staan moet naar mijn (standaard) idee toch wel kunnen.
Wat ik aan het originele artikel af kan leiden is dat er niet volledig is getest op de geïmplementeerde logica. De correctheid van het statement van TikTok ten tijde van hun test valt daarom ook niet meer te verifiëren.

Als het daadwerkelijk zo zou zijn geweest als gesteld door TikTok, zou een woord als Huawei ook geblokkeerd moeten zijn geweest, echter heeft men enkel "positieve tests" doorgevoerd.

Wat echter wel uit het artikel op is te maken is dat "rechtsextrem" en "bisexuell" niét werden gefilterd, terwijl deze woorden wel het woord "sex" bevatten. Dat kan duiden op het gebruik van een zekere marge in de zoeklogica, "shuai" en "hua" hebben immers minder letters afwijkend van elkaar dan de andere voorbeelden. Of TikTok zuigt hier een excuus uit de duim.
staatsexamen :+ was ook een leuke op scholen
expertsexchange.com
Altijd beter dan een Amateur Sexchange.
christelijke overheids school? staat-sex-amen ;)
Dat een modern filter geen onderscheid kan maken tussen losse woorden klinkt natuurlijk ouderwets en als een gemakkelijk smoesje, maar in de Chinese taal heb je geen spaties. Alle karakters en woorden worden daar aan elkaar geschreven dus dat een groep Chinese filterontwikkelaars niet stilgestaan heeft bij de westerse complicaties is ook niet volledig ondenkbaar.
说话 bv., "spreken", is ook shuōhuà.
Idem 华语, Chinese taal, huáyǔ zou ja dat ook niet kunnen schrijven. Nee dit smoesje is wel heeeeel erg slap.
Daar zie je al wel duidelijk dat de ene hua de ander niet is (verschillende karakters), terwijl dat onderscheid in het westers schrift voor chinezen denk ik lastig te maken is. Ik ben het trouwens wel met je eens hoor, het voelt eerder als een slap excuus om doorgeschoten censuur mee goed te praten.
In het populaire spel Genshin is dit heel erg. Hele worden die halve ***** krijgen omdat de filter daar super strak staat en geen onderscheid maakt tussen een los word en een deel van een woord. Was lang geleden dat ik nog zo’n woord filter zag.
Regelmatig Engelse chat's en fora gezien die "that it's" en varianten banden want "tits".. Zelfs met de spatie ertussen 8)7
Op school konden wij nooit het woord analyse gebruiken. For obvious reasons...
Ik kom het in spellen ook wel tegen. In de in-game chat spreek je dan met Nederlandse gebruikers en in een vraag als "Hoe doe je dat dan?" wordt "Hoe" opeens weggehaald omdat dat in het Engels blijkbaar slang is voor prostituee.
Ik zei laatst iets van shit hee, stond er **** hee, toen zei ik wtf mag je niet eens sh zeggen? Stond er *** mag je niet eens sh zeggen? :')
wat wil je nou zeggen? ik zie alleen sterretjes en leestekens? :+
Hetzelfde als met je wachtwoord: hunter2 :+
Haha, ********* !
Haha zo word je weer een brave burger. Heropvoeding door Tiktok. :')
Vooral lastig als je een schoffel nodig hebt.
"Luke, grab that little hoe"
(Modern family)
https://www.youtube.com/watch?v=yBtLRSUUZ7Y
Het zal dan wel weer een vervorming zijn, want de gebruikelijke slang schrijf je als "ho". Een "hoe" is gewoon een hark in het Engels, en kom je toch in behoorlijk veel tuincentra tegen : P
Dan weet ik niet waarom het geblokkeerd wordt. Maar iedereen chat nu op Discord over dat spel, dat werkt veel beter dan de in-game chat.
Bij Blizzard games zijn er een aantal woorden geblokkeerd die we in principe dagelijks gebruiken.
Ik herinner me op dit moment alleen "kunt". Maar er waren er nog een paar. Ja ik begrijp Britten / Amerikanen... maar ik mag toch wel gewoon in mijn eigen taal spreken tegen een landgenoot?

Er zijn ook spellen waar je en ban krijgt. Dat gaat nog een stap verder, niet doe goede kant op.
Best raar hoe woorden zonder context dus geblokkeerd worden.

Veel van zulke woorden kan je prima in 'normale' context gebruiken, zelfs als het geen onderdeel van een bepaald woord is, ook in reacties kan je prima deze woorden in neutraal/positieve zin gebruiken.

In games of oudere fora kom je nog wel eens de 'search string' principes tegen, dat bepaalde delen van een woord al als fout gezien worden, je zou toch verwachten zo'n 20 jaar laten dat zo'n filter (buiten de discussie an sich) toch beter zou moeten werken dan nog steeds simpel op een woord gaan filteren?
Dat is voor ons raar, maar TikTok is Chinees en daar geldt een strenge censuur. Het is ingesteld en na klachten weer uitgezet.
Wat ik bizar blijf vinden is dat bedrijven zoiets altijd onder het kopje 'per ongeluk'(dit geval) of 'bug' (Google Maps die Wi-Fi punten scande) schaart. Ben gewoon eerlijk, het is overduidelijk...
Uiteraard, maar doel op de context. Mijn oude Chinese visum had duidelijk 'sex' staan (volgens mij staat geslacht er nu totaal niet meer op), in die context is het opeens niets meer gerelateerd aan hetgeen wat ze willen censureren. Het woord 'an sich' is niet verboden (zoek maar gewoon eens op baidu), het is niet opeens dat de rockband Sex Pistols daar opeens $#*&#$ Pistols heet.
Toch zullen er genoeg mensen zijn die er in geloven. Gaan ze bekennen dat ze het expres doen zijn ze bij iedereen schuldig. Daarnaast denk ik ook dat er wel een psychologische aspect in zit. Ik verwacht dat als men leest dat ze een fout gemaakt hebben (ook al geloof je het niet) dan weinig actie ondernemen. Ja een reactie op een forum of in een gesprek erover hebben. Maar als het bedrijf bekent dat ze dit doen er meer mensen op zoek zouden gaan naar een alternatief. Want als ze hier misbruik van ons maken waar dan nog meer. En ja er zijn genoeg uitzonderingen. Google zoekmachine blijft voor mij en vele andere toch het beste, Facebook wordt lastig omdat je de geschiedenis niet (makkelijk) over kan zetten, mensen je misschien niet volgen naar de alternatief of dat jij mensen of bedrijven volgt die alleen op Facebook zit.

Maar een alternatief voor Google Maps is wel te doen voor de meeste mensen. Een gemiddelde alternatief ligt qua kwaliteit wel aardig in de buurt of zijn (op bepaalde punten) beter.

Daarnaast denk ik dat qua PR de schade kleiner blijft. Doordat het een "fout" was zal het door minder nieuws bedrijven opgepakt worden. Maar schuld bekennen zal het door meer nieuws bedrijven opgepakt worden. Een schandaal trekt vaak meer lezers aan.
Gelukkig dat dat soort filters zich vaak weer laten foppen door l33tsp3@k. :)
Standaard methode bij bijna elk filter :P Of het is in de context van de zin nog overduidelijk wat het woord had moeten zijn.

$#&* you, you piece of &()#*&$#, mother$#&*($#.. weinig creativiteit nodig om dat in te vullen :P
Doet me denken aan een bash klassieker: http://www.bash.org/?178890
Tiktok. Gebruik het gewoon niet.
3 miljoen Nederlandse gebruikers denken daar anders over.
3 miljoen Nederlanders zouden op andere gedachten gebracht moeten worden. (wat ook gaat lukken over een paar jaar)
Omdat jij iets niet leuk of ok vindt, maakt niet dat je de mening van anderen niet moet respecteren.
Mensen vinden vaak dingen leuk die ik zelf absoluut niet kan waarderen maar leven en laten leven zeg ik altijd maar, zolang ze anderen er maar niet actief mee lastig vallen.
Er zaten vroeger ook miljoenen Nederlanders op Hyves, ICQ, MSN, MySpace en Facebook...
De hypes duren nu misschien wat langer, maar zodra je ouders op jouw platform zitten, weet je als jongere dat het tijd is om wat anders te zoeken. En als je eenmaal oud en wijs genoeg bent, kap je helemaal met die onzin :D
Klopt helemaal! :)
De hypes zullen altijd komen en gaan en Tiktok zal eens bejaard en uncool gaan zijn voor de jeugd die dan weer hun heil elders gaan zoeken.
Er is nu wel veel meer fragmentatie qua sociale media aan het ontstaan heb ik het idee met Facebook, Instagram, Tiktok, Youtube, Twitter en Tiktok om maar een paar grote te noemen. Omdat ze zo groot zijn en niet als een ballon leeglopen zoals toen met Hyes, MSN en Myspace, blijven ze veel langer bestaan en gebruikt door een specifieke doelgroep.
Dit soort filters werken niet.

Heb het een paar keer getest in enkele nieuwe pokemon games, waaronder legends arceus.

Een woord zoals
WHORE
is niet toegestaan Maar een woord zoals
WHORE.
Is dan weer wel toegestaan.
Het enigste verschil is dat bij de 2e er een . aan toegevoegd is

Ofwel dit geeft aan dat deze filters niet altijd goed werken

[Reactie gewijzigd door darknessblade op 23 juli 2024 18:41]

Nog leuker, bepaalde Pokemon zoals Frosslass zijn(of waren) niet te ruilen op de global trading system in bepaalde spellen, omdat er ass in de naam zit. Enkel als je de Pokemon zelf een geschikte bijnaam geeft is deze te ruilen.
Frosslbackside
@Framoes (Flamoes? :+ )
Ze hebben vast lang en diep over het antwoord na moeten denken. Volgens die logica zou het echter ook onmogelijk moeten zijn geweest om over Huawei te spreken, hetgeen ik wel durf te betwijfelen. Of over regionale aanduidingen als Sussex en Wessex.

Wel netjes dat ze Peng Shuai als onschuldig zien, lijkt me een vrij controversiële mening in het moederland.
Zo zou de naam van de tennisster geblokkeerd zijn omdat daarin de lettercombinatie 'hua' zit, wat een Oostenrijks scheldwoord zou zijn om een vrouw als prostituee aan te duiden.
Dan ben ik benieuwd of in die periode 'Huawei' ook geblokkeerd werd (gokje: zal wel niet).

P.S. geinige naam dan in Oostenrijk, dat Huawei
Het is niet alsof het zoveel helpt. Wanneer je een woord niet kan gebruiken dan verzinnen mensen wel een ander woord die daarna dezelfde betekenis krijgt als het verbannen woord.
Volgens mij is 'hua' niet alleen Oostenrijks maar ook Haags
Maar betekent het daar ook ‘prostituee’, net als in het Oostenrijks?
Shit, jij maakte 'm al. ;)
Haha, beetje humor en hopelijk blijft China van het Haags af
Ik dacht al aan woorden als ‘Kugelschreiber‘ of ‘verkraften‘…

Toch maar even gecontroleerd dat auto correct dit niet alsnog tot verkeerde woorden bombardeert :+

Op dit item kan niet meer gereageerd worden.