Algoritmes voor opsporen werken beter op Facebook dan op Instagram

De algoritmes die Facebook heeft gemaakt om verboden content op te sporen, werken beter op Facebook zelf dan op Instagram. Dat blijkt uit cijfers die het bedrijf naar buiten heeft gebracht. Daardoor zien gebruikers procentueel veel meer verboden content op Instagram.

De cijfers van Facebook tonen aan dat 99,5 procent van de verwijderde kinderporno door algoritmes worden gevonden. Op Instagram is dat percentage 94,6 procent. Het bedrijf verwijderde de rest van de content na meldingen van gebruikers. Op andere gebieden is hetzelfde beeld te zien. Algoritmes waren verantwoordelijk voor het spotten van 98,5 procent van de terroristische propaganda op Facebook, waar dat bij Instagram 92,2 procent was. De cijfers gaan over de maanden juli, augustus en september van dit jaar.

Facebooks algoritmes zijn duidelijk beter in het spotten van bepaalde dingen. Bij het opsporen van pesten en intimidatie was het aandeel van algoritmes 16,1 procent, en veruit de meerderheid van verwijderingen naar aanleiding daarvan kwam dus door meldingen van mensen.

Het bedrijf verwijderde de afgelopen maanden na meldingen van gebruikers 5,1 miljoen nepprofielen. De algoritmes spotten er nog eens ongeveer 1,7 miljard voordat een menselijke gebruiker een melding had gedaan, vermoedelijk toen softwaretools nepaccounts aan het aanmaken waren.

De algoritmes zijn belangrijk, omdat na meldingen van mensen medewerkers van Facebook of partnerbedrijven moeten kijken naar die foto's en video's. Dat heeft vaak psychische problemen bij zulke medewerkers tot gevolg.

De cijfers spreken ook over het aantal keren dat overheden gegevens opvragen bij Facebook. Belgische overheidsinstanties vroegen gegevens op over 1033 accounts, in Nederland was dat 864 accounts. Dat aantal is nauwelijks veranderd afgelopen anderhalf jaar.

IT-banen

Reacties (17)

Byron010 14 november 2019 13:25

Zonder meer informatie over aantallen en false-positives is dit eigenlijk nutteloos. T zegt alleen dat ze 99% gedaan wordt door AI en 1% van de verwijderde content door mensen zelf gedaan is.
Voor t zelfde geld hebben ze maar 100 dingen verwijderd voor het 99% percentage terwijl er eigenlijk miljoenen posts verwijderd zouden moeten worden. (t is maar een voorbeeld)

Hun AI's blijken ook vaak genoeg niet goed te werken; ik wou maandag een nieuw Instagram account aanmaken, en na de registratie was hij direct disabled, heeft niet eens een minuut tussen gezeten. Met als reden dat de user guidelines/rules gebroken waren, nou dat kon dus niet eens in die paar seconden.
Vervolgens opgezocht of meer mensen dit hadden en ja hoor, het schijnt heel vaak voor te komen dat (nieuwe, maar ook al bestaande) accounts disabled worden zonder dat het klopt. Vervolgs kan je je account terug krijgen door een foto te sturen van jou als persoon met je naam, achternaam, username en een verificatie code op een papiertje.

- Die false positives zelfs direct na een registratie maar ook bij bestaande accounts is echt niet netjes
- Account Terug krijgen vereist teveel, waarom zou ik een foto moeten sturen van mijzelf als het alleen om de verificatie gaat? Het account bestond net dus die foto kon niet eens bewijzen of ik het wel echt was.

- Eigenlijk had ik verwacht dat het terug krijgen langer zou duren, het heeft uiteindelijk 2 dagen geduurd voordat ik m'n nieuwe account terug had.

MaxTheKing 14 november 2019 11:45

Instagram is van Facebook, dan zouden ze toch gewoon hetzelfde algoritme voor beide diensten kunnen gebruiken?

RM-rf @MaxTheKing • 14 november 2019 12:14

De content is ook anders, Instagram heeft een hele hoop creatieven die bv er kunstzinnige foto's op delen, waarbij het ook eerder tot een grijs gebied komt wat men onder 'kunst' valt of onder 'erotische content'.

tevens is er bv een sterke groep kunstenaars die zich sterk inzetten voor het verruimen van de regels;
Bv Spencer Tunick, een fotograaf die naakte mensen fotografeert in publieke omgeving is zelf erg actief op instagramm, op facebook eerder niet.

Wat dat betreft is facebook veel eerder een 'sociaal' netwerk dat zich richt op direkte interpersoonlijke contacten tussen gebruikers, en Instagram ook een medium met een zeer publieke uitstraling en veel minder 'private' content.

[Reactie gewijzigd door RM-rf op 23 juli 2024 15:40]

Trekfolie @MaxTheKing • 14 november 2019 12:32

Instagram is (volgens mij) meer een beeldend medium. Op Facebook is het makkelijker om content te weren op basis van keywords. Een algoritme die op basis van beeldmateriaal content moet weren heeft het moeilijker dan het algoritme die dit op basis van tekst moet doen.

Noob_Saibot @MaxTheKing • 14 november 2019 11:49

Mechanische is net anders, denk aan privacy enzovoort

Nas T @Noob_Saibot • 14 november 2019 11:56

Privacy bij Facebook? Goede grap

Ik kan me ook voorstellen dat Facebook al langere tijd wordt gescand door algoritmes en daar beter op de content ingespeeld zijn. Op zich is er nog een significant verschil, dus er is wel ruimte voor verbetering.

AppleFan2007 @MaxTheKing • 14 november 2019 16:17

Ik heb me dat ook al afgevraagd. Foto’s zijn foto’s dat is dan toch niet zo moeilijk om te verwijderen. Voor verhalen is dit misschien iets ander.

bbob

Facebook
Internet

14 november 2019 11:45

Dat klinkt natuurlijk allemaal heel mooi. Maar nepadvertenties waarin het gezicht van bekende personen misbruikt wordt kan facebook nog steeds niet weghalen. Of misschien willen ze het helemaal niet weghalen, ze verdienen er immer geld mee

LOTG @bbob • 14 november 2019 12:23

Inderdaad, ik vind het een enorm zwaktebod om te zeggen dat het te veel geld kost om die nep advertenties aan te pakken.

Je verdient geld aan het misbruiken van iemand zijn gezicht plus het oplichten van je gebruikers.
Een kwestie van niet willen in mijn ogen. Ik ben er ook voorstander van om sites zelf verantwoordelijk te maken voor de advertenties die ze tonen. Wijzen naar een andere partij moet gewoon van tafel geveegd worden, je hebt er zelf voor gekozen om het uit te besteden.

Ik denk dat het dan heel snel een stuk minder zal zijn met de nep advertenties en de malware die er mee geserveerd word.

bbob

Facebook
Internet

@LOTG • 14 november 2019 12:46

Ze zijn nu ook verantwoordelijk en in het geval de mol ligt er een dwangsom. Probleem is dat het best kan dat ze gewoon doorgaan en die dwangsom betalen. De dwangsom staat waarschijnlijk niet in verhouding tot de opbrengst.

Helaas zie je dat ook met EU boetes tegen dit soort bedrijven. Ze zijn zo groot geworden dat zelf een paar miljard ze niets uitmaakt. Het is feitelijk een rekensom overtreden we de wet dan verdienen we zoveel en moeten dan zoveel boete betalen. De verdienste ligt nog steeds hoger dan de boete dus hebben we lak aan regels en wetten.

Er is maar 1 manier deze bedrijven te stoppen, hogere boetes of keiharde wetten of verboden.

killerfreak @bbob • 14 november 2019 17:00

Het gaat pas stoppen als je mensen persoonlijk verantwoordelijk houdt voor de blunders die een bedrijf maakt. Nu is het gewoon een kosten baten plaatje voor het bedrijf, maar ik denk dat als bepaalde sleutel personen een paar keer een boete van orde grootte jaarsalaris op de deurmat krijgen er meer motivatie is om iets te veranderen in de bedrijfsstructuur.

Iblies

Facebook

@bbob • 14 november 2019 12:10

Wij van WC-eend...

Niemand die het controleert dus ze kunnen zeggen wat ze willen totdat de bom weer barst.

Alleen het griezelige is dat oa FB alles wegmoffelt onder AI en dat er steeds minder mensen werken. De kans dat er iemand naar buiten komt om misstanden mee te delen wordt steeds kleiner.
Wat er precies gebeurt is teruggebracht tot een steeds kleinere groep, waarbij je kunt zeggen dat Mark Zuckerberg het zelf ook niet allemaal precies weet.

Maar wie dan wel...

SinergyX 14 november 2019 11:56

Dat is bijna 2 requests per dag, 'Legal Process', en toch zijn er nog genoeg 'webshops' te vinden op instagram met nep/namaakkleding, die kunnen ze vreemd genoeg niet vinden? Die hebben letterlijk hun hele collectie als foto's staan, werkelijk nergens kan die algoritme maar iets vinden?

Maar dit zijn percentages van totaal verwijderd, zegt dus 0,0 over de totale omvang op Facebook. Als ze er 10 verwijderen, terwijl er nog 100 staan, leuk dat je 99,9% haalt met je algoritme.. hij faalt nog steeds compleet. Spam is natuurlijk een lachertje, als je nog steeds reclames voor bitcoin of onzin ziet met foto's erbij van 'bekende mensen', al die bullshit 'like en win'.

Leuk gehalte 'zie ons een goed bezig zijn', hebben ze weer wat reputatieschade?

bbob

Facebook
Internet

@SinergyX • 14 november 2019 12:15

Zie uitspraak John de Mol, foto misbruikt voor bitcoin oplichting. die advertenties konden ze ook niet verhinderen zeggen ze. Of is het net als die shop dat die reclame maken dus geld betalen aan facebook en facebook even een oogje dichtknijpt want tja die 40-50 miljard aan reclame-inkomsten laten we toch niet liggen. Daar betalen ze graag een paar miljoen schadevergoeding voor aan klagers zoals de mol

Davy de Vries 14 november 2019 11:51

Ik ben wel onder de indruk van de spam score van 99.9. Doet een menig mailbox slechter 😅
Zouden ze hun algoritme ondertussen zo getraind hebben met user input?

TagForce 14 november 2019 12:12

Dat is leuk... Maar die cijfers zijn natuurlijk compleet nietszeggend zonder de cijfers over onterecht verwijderde content.

Als Facebook alle content zou verwijderen zou het percentage voor al deze 'algoritmen' op 100% staan.
Dat 50000000% false positives zijn laten we voor het gemak even weg uit de berichtgeving.

Met andere woorden:
Als 99.5% van de kinderporno wordt verwijderd door een algoritme, met een false positive rate van 5%, dan is dat naar mijn mening minder goed dan wanneer 94,6% wordt verwijderd met een false positive rate van 0,5%.

In harde cijfers:
Aantal KP posts: 100000
Facebook:
99,5% = 99500
5% = 5000

IG:
94,6% = 94600
0,5% = 500

Dus we hebben 90% minder onterecht verwijderde meldingen en slechts 4,9% minder KP geblokt.
Nou zal niemand daar in het geval van KP een traan om laten (onterecht wmb), maar wat wordt verstaan onder 'terrorismepropaganda'? Zijn die false positives dan wellicht terechte kritiek op een huidig regime wat toch gezien wordt als propaganda van terroristen?

Maar nogmaals, die cijfers hebben we niet, dus we moeten Facebook maar op hun blauwe ogen geloven dat die rate enigszins acceptabel is.

Edit:
De cijfers van Facebook zelf geven een indicatie (over alle content, niet per categorie) over hoeveel content er later is teruggezet.
In april-juni 2019 gaat het om 1 miljoen items die voornamelijk na een protest weer teruggeplaatst zijn. In die periode is actie ondernomen op 27,7 miljoen items. Dat is dus 3,6%... En dat is dus zonder de verwijderingen waar geen protest op gekomen is over onterechte verwijdering.

[Reactie gewijzigd door TagForce op 23 juli 2024 15:40]

Op dit item kan niet meer gereageerd worden.

Lees meer

IT-banen

Reacties (17)

Sorteer op:

Weergave: