NYT: Facebook gaf onvolledige gegevens aan onderzoekers van misinformatie

Facebook heeft onderzoekers onvolledige informatie gegeven over hoe gebruikers omgaan met berichten op het platform. Het bedrijf zou data van de helft van zijn Amerikaanse gebruikers hebben verstrekt, terwijl het aangaf dat het om gegevens van al zijn gebruikers in de VS ging.

Facebook heeft per e-mail zijn excuses aangeboden aan de onderzoekers, schrijft The New York Times. Daarin zou het platform zich verontschuldigd hebben voor 'het ongemak' dat de fout veroorzaakt kan hebben. Het bedrijf geeft daarbij aan dat het de datasets aan het updaten is om de fout te verhelpen, maar dat het nog enkele weken zou duren voordat dit werk voltooid zou zijn, gezien de grote hoeveelheid data.

Vertegenwoordigers van het bedrijf hielden op vrijdag ook een telefoongesprek met de onderzoekers om zich te verontschuldigen voor de fout, melden anonieme bronnen aan het Amerikaanse dagblad. Daarin zouden verschillende onderzoekers geklaagd hebben dat ze maanden werk hebben verloren door de fout. Een onderzoeker zou zich ook hebben afgevraagd of Facebook nalatig was, of dat de fout opzettelijk was gemaakt om onderzoek te ondermijnen.

Een woordvoerder van het bedrijf claimt dat het probleem werd veroorzaakt door een 'technische fout', en zegt dat Facebook dat probleem 'proactief' aan zijn partners te hebben gemeld. De fout werd ontdekt door Fabio Giglietto, een professor van de Universiteit van Urbino in Italië. Giglietto vergeleek de gegevens die het bedrijf aan onderzoekers verstrekte met de data uit het transparantierapport dat Facebook in augustus publiceerde. Hij ontdekte daarbij dat de gegevens niet overeenkwamen.

Facebook is de afgelopen maanden vaker in opspraak gekomen over het delen van informatie. Recent kwam The New York Times erachter dat het bedrijf een transparantierapport had achtergehouden, waarna Facebook het alsnog publiceerde.

Begin augustus verbande Facebook ook enkele academici die onderzoek deden naar de verspreiding van politieke advertenties op het platform. De onderzoekers gebruikten daarbij een zelfontwikkelde browserextensie, in plaats van de gegevens die Facebook zelf verstrekt. Facebook stelde dat die onderzoekers 'ongeoorloofd' data scrapeten van het platform. Ook AlgorithmWatch staakte zijn onderzoek naar het Instagram-algoritme vorige maand, nadat moederbedrijf Facebook dreigde met juridische stappen.

Door Daan van Monsjou

Nieuwsredacteur

12-09-2021 • 10:32

48

Reacties (48)

Sorteer op:

Weergave:

Als ik mijn belasting niet betaal. Zou ik dan ook weg komen met het argument:" Oepsie, dit was een technische fout".

Ik vind het ondertussen idioot worden hoeveel grote bedrijven met dit soort "foutjes" weg komen. Terwijl de impact heel erg groot is.

Maar als een burger dit flikt dan wordt hij of zij door de mangel gehaald.
Tja "ik heb daar geen actieve herinnering aan" en "ik heb niet gelogen, maar de waarheid verkeerd herinnerd."

Twee dingen waar een gewone burger nooit mee weg kan komen. Maar als je positie hoog genoeg is of je portemonnee dik genoeg, kom je overal mee weg.
Off-topic

Dat hoeft op zich geen leugen te zijn, terwijl het wel een specifiek voor dit doel gecreëerde situatie is.
Stel: Je hebt een werkweek van 80 tot 100 uur in een crisissituatie, waarbij je van overleg naar overleg holt. In veel van die overleggen worden dezelfde onderwerpen besproken en van de meeste overleggen worden wel afsprakenlijstjes gemaakt, maar voor de rest geen verslag gemaakt. Dan is het zelfs voor de persoon met het beste geheugen heel erg lastig om zich te herinneren wat er in een bepaald overleg precies is gezegd. Dan kan je met volle overtuiging en 100% naar waarheid zeggen dat je je niet kunt herinneren of je in overleg X A hebt gezegd (of dat je dat misschien in overleg Y hebt gezegd).
Dit is geen vrijpleiten! Want dit is een situatie die specifiek is gecreëerd om achteraf met dit soort zaken weg te kunnen komen. Daarom is het zo belangrijk om van een vergadering/ overleg/ etc. notulen te maken, die alle deelnemers achteraf terug kunnen lezen. Dan weet iedereen wat er gezegd is (ook wat ze zelf gezegd hebben) en weet iedereen wanneer het gezegd is. Dan kan je er niet meer mee weg komen wanneer je zegt dat je je niet kan herinneren dat je A voor rotte vis hebt uitgemaakt in overleg X, terwijl je heel goed weet dat je A voor rotte vis hebt uitgemaakt, maar je je alleen niet kan herinneren of dat in overleg X of overleg Y was.
Ik mag toch echt hopen dat de overheid notulen bijhoud van elk overleg. Juist als het om crises overleg gaat!

Los daarvan als het kapot maken van 10 duizenden mensen niet 'belangrijk' genoeg is voor Rutte om dat te onthouden, dan is Rutte zeer incompetent. Daarbij ging het niet om een Q&A rondje, maar om een specifiek debat over een serieus probleem. Ministers betrokken bij zo'n overleg behoren dan het fatsoen te hebben al hun aantekeningen en notulen door te lezen zodat ze correct verantwoording kunnen afleggen naar de volksvertegenwoordigers..
Ja mag hopen...maar van sommige overleggen worden expres geen notulen gemaakt.
Het staat bekend als de 'Rutte doctrine'. Van veel besprekingen wordt alleen een besluitenlijst gemaakt, maar geen notulen. Dat zou het spreken voor alle betrokkenen makkelijker maken of zo iets.

Natuurlijk wordt alles door iedereen onthouden, alleen wanneer je -tig overleggen over hetzelfde onderwerp hebt gehad, weet je niet meer precies wat op welk overleg gezegd is. Wanneer dan gevraagd wordt of A op overleg X gezegd is, kan je naar eer en geweten antwoorden dat je je dat niet kan herinneren, omdat dat misschien wel op overleg Y of Z is gezegd. (Al zeg je dat laatste er natuurlijk niet bij.)
Best interessant. Op zich heeft hij natuurlijk gelijk - dat zal zeker zorgen dat mensen zich vrijer uitdrukken. Maar het verminderd wel de transparantie en die is ook belangrijk. Misschien zou dit geen keuze moeten zijn voor de premier, maar politiek worden vastgelegd...
Dan kan je er niet meer mee weg komen wanneer je zegt dat je je niet kan herinneren dat je A voor rotte vis hebt uitgemaakt in overleg X, terwijl je heel goed weet dat je A voor rotte vis hebt uitgemaakt, maar je je alleen niet kan herinneren of dat in overleg X of overleg Y was.
Als je altijd een eerlijke en eervolle man bent, dan is onthouden niet zo moeilijk. Je weet immers over jezelf wat voor besluiten je neemt, wat je waarden zijn en wat voor dingen je wel zegt of nooit zou zeggen.
Als je in ieders gezicht lacht en achter hun rug om allerlei nare dingen zegt en doet, maar dat ook geheim wilt houden en van de ene persoon wel en andere niet. Ja dan kan het wel moeilijk worden om te onthouden wanneer je welke streek hebt uitgehaald en wie er daarbij waren die ervan weten en wie niet. Wordt steeds moeilijker hoe vaker je dat doet.

Ik ben geen bijzondere man met een uitzonderlijk hoog IQ, maar als ik beloftes maak (of iets naars zeg over iemand die ik niet mag), al is het 10jr en 1000 meetings geleden, dat onthou ik omdat ik geen dubbel geweten heb en het tegen iedereen anders vertel waarna ik na een gegeven moment zelf de waarheid kwijtraak en niet meer weet welke "waarheid" ik tegen wie heb verteld.
Helemaal mee eens. Dat is echt geen toeval maar een bewust actie. Voordat je data overhandigt, controleer je eerst de integriteit en volledigheid. Dus al is er een technische fout, die had gespot moeten worden.
Dan kan je dus net zo goed ook stellen dat de universiteit weet hoe belangrijk het is dat ze op tijd controleren en zorgen dat facebook ook genoeg gegevens geeft. Kennelijk vonden ze het niet zo belangrijk dat ze afgedwongen hadden zeker te weten dat facebook wist hoe ze die gegevens moesten verzamelen en aanleveren?
Ten eerste is dat een onterechte verschuiving van verantwoordelijkheid, ten tweede is het wellicht lastig voor de onderzoekers om te zien of de data volledig is. (misschien geeft die geen absolute aantallen weer, maar dingen als "x% van de mensen tussen 30-40 jaar klikt vooral op <y>")
Dat je als onderzoekers niet zomaar je gegevens gaat vertrouwen heeft niets met verschuiven van verantwoordelijkheid te maken. Je kan er niet zomaar vanuit gaan dat een ander je onderzoek niet zal verknoeien, ook al zou je daar op willen vertrouwen dat ze hun best doen. Als onderzoeker neem je dus niet zomaar genoegen dat iemand je gegevens wil toestoppen, je doet ook op tijd moeite dat die gegevens je onderzoek niet verkeerd resultaat kunnen geven. Doet niets af aan een belofte van facebook.

Daarbij lees ik niet wat er moeilijk aan het op tijd zorgen voor complete gegevens is. Als dat belangrijk is dan doe je er vooraf in afspraken moeite voor er voldoende zekerheid in te kunnen hebben. Als er al twijfel is of facebook wel in staat is redelijk te leveren en ze geen controle willen kan je dat dan ook tegen ze gebruiken waardoor dat lijkt te komen.
Maar het is een onderzoeker geweest die de fout ontdekt heeft. Dus 1. De claim dat onderzoekers dat niet controleren is onjuist, en 2. Blijkbaar was dat controleren niet een simpele “check of het aantal gebruikers ongeveer het goede aantal is.”
Ik stel niet dat de onderzoekers niet gecontroleerd hebben en ook stel niet dat het simpel zou zijn. Ik vraag af waar uit blijkt dat er genoeg gedaan is als de bewering is dat het een bewuste actie van facebook was.

We concluderen dat onderzoekers van volledige gegevens afhankelijk zijn, dan mag ook wel duidelijk gemaakt worden of de onderzoekers genoeg gedaan hebben om te voorkomen dat facebook ze opzettelijk te weinig gaf. Simpel als tweaker klagen dat facebook wel iets bewust gedaan zou hebben is anders te makkelijk. Die mening lijkt daarbij niet van de universiteit, dus het lijkt er eerder op dat ze er vanuit gaan dat het niet opzettelijk was.
Je moet het er toch wel mee eens zijn dat het weer heel toevallig is en er wel degelijk sprake is van een patroon, om over de reputatie van Facebook nog maar te zwijgen.

Hoewel je strikt genomen natuurlijk gelijk hebt, lijk je aan het trollen te zijn
Ik heb kritiek op gebrek aan evenredige verantwoordelijkheid om facebook maar te beschuldigen. Daarbij geef ik duidelijke redenen waarom we niet zomaar kunnen beschuldigen, waarom ook de universiteit op tijd verantwoordelijkheid hoort te nemen en dat ik daarmee niet stel dat facebook met die kritiek dus maar niet te verwijten zou zijn. Dat is juist geen trollen. Het komt op mij niet redelijk over als we aan de ene kant maar makkelijk zeggen dat het opzet van facebook is maar we aan de andere kant klagen dat je kennelijk opzet kan verwachten en onderzoekers dan maar pas na leveren kritisch zijn op of facebook ze wel heeft gegeven wat de bedoeling is. Terecht dat ze controleren, ik zou facebook ook niet snel meer vertrouwen dat ze leveren wat je mag verwachten, maar dan kan je moeilijk doen alsof je niet eerder kan proberen opzet uit te sluiten.
Ik vind het wel erg simpel gezegd. Mensen kunnen gewoon fouten maken. Ik heb wel eens van een vriend een spel mogen lenen en nam die mee naar huis. Wat bleek nou: het hoesje was leeg. Blijkbaar had hij met een nieuwe spel in de computer doen dat spel even in het hoesje van het nieuwe spel gedaan met de gedachte van dat ruim ik straks wel op. Als er bij zoiets simpels al een fout gemaakt kan worden dan kan het natuurlijk ook bij zoiets ingewikkeld. Al zou het me inderdaad niet verbazen dat Facebook het expres gedaan heeft.
Sorry maar een vriend is natuurlijk wel even wat anders dan een miljarden bedrijf met een erg slechte reputatie op dit gebied.

Edit: en dan nog dit

[Reactie gewijzigd door Alxndr op 23 juli 2024 07:36]

Als Facebook zelf het ‘foutje’ had ontdekt en gerapporteerd was het wellicht wel anders overgekomen.
En toch heeft de marketing-afdeling van hun effect;
Recent kwam The New York Times erachter dat het bedrijf een transparantierapport had achtergehouden, hoewel Facebook deze later alsnog publiceerde.
Dit is een heel aparte woordkeuze. Het zijn namelijk twee verschillende momenten en geen tegenstelling op hetzelfde moment.

Facebook publiceerde dit pas nadat er ophef bestond dat datgene wat ze publiekelijk bekendmaken niet overeenkwam met interne gegevens.
Is de impact hiervan heel erg groot?
Daarin zouden verschillende onderzoekers geklaagd hebben dat ze maanden werk hebben verloren door de fout.
Zie het als een schrijven van een scriptie en op een gegeven moment krijg je de mededeling dat je scriptie maar de helft van de situatie vertegenwoordigd en waarbij je totaal niet weet wat de korrelatie is tussen verschillende setten data.


Dit is letterlijk de grootste naaistreek die je iemand kunt leveren omdat al het huidige werk compleet is uitgehold omdat niemand er voor wil gaan instaan en daardoor heeft Facebook ook zijn doel bereikt.
Er zijn niet genoeg mensen die deze materie redelijk snappen, als je ze al kunt vinden zal er aan alle kanten aan ze worden getrokken,

maar als het onderzoek “af” is en je naam komt er onder te staan, maar de conclusies rijmen niet helemaal, dan ben je alsnog de sjaak want niet meer te vertrouwen.


Ben benieuwd welke overheid meegaat in deze conclusie,
helemaal als je weet dat onafhankelijke meting per direct is aangeklaagd.

Ik zou als overheid per direct weer doorgaan met de plug-ins en laat ze maar aanklagen wat ze willen.
De helft van een dataset, daar kan je ook wel wat mee toch? Of ligt het genuanceerder?
Het ligt er aan welke helft.
Hoe is die helft samengesteld? Is het een random verzameling die representatief is voor het totaal? Bv. alleen de even recordnummers? In dat geval zal het voor statistisch onderzoek niet zo veel uitmaken.
Of is het deelverzameling die zich onderscheidt van het geheel? Bv. alleen de vrouwelijke FB-gebruikers, of alleen 30+, of alleen Noord- en Zuid-Amerika? Afhankelijk van hoe goed de gegevens geanonimiseerd zijn kan het lastig zijn om daar achter te komen (al zal geslacht altijd wel onderdeel van de gegevensset zijn). De kans is groot dat je onderzoeksresultaten in dat geval volslagen onzin zijn.
Sterker nog, de reden dat men er achter kwam is dat de analyse andere verdelingen lieten zien dan gerapporteerd. Dus is het een select deel van de verzameling. Ik ben dan ook erg benieuwd welke conclusies veranderen met de totale dateset en hoe. Ik denk (nog) niet dat ze het onderzoek ermee probeerde te beinvloeden, maar ik zou daar als onderzoeker wel naar kijken.
Als ik mijn belasting niet betaal. Zou ik dan ook weg komen met het argument:" Oepsie, dit was een technische fout".
Onvergelijkbare situatie. Het gaat hier niet om de overheid maar onderzoekers. Het gaat ook niet om een verplichting maar om vrijwillige medewerking. Verder gaat het hier om onderzoek (met onzekere uitkomst en een zelf te bepalen structuur) en niet om een belastingtechnisch iets (goed gedocumenteerd proces met wettelijke kaders). Eigenlijk vraag ik me of er wel overeenkomsten zijn.
Er zijn legio voorbeelden dat partijen fouten maken in processen met wettelijke kaders.

Ik denk als je zoekt in Google met de term "AVG overschrijdingen Facebook" dan vinden we vast wel wat.

De AVG is een wettelijk kader waar ze een loopje mee nemen met "technische foutjes". Of bij fusies zeggen dat data niet gedeeld wordt. En uiteindelijk wel doen.

Hoeveel "foutjes" mogen ze maken?

[Reactie gewijzigd door BestevaerNL op 23 juli 2024 07:36]

Als ik mijn belasting niet betaal. Zou ik dan ook weg komen met het argument:" Oepsie, dit was een technische fout".
Eerlijk gezegd wel. Als jij moedwillig in je aangifte onterechte aftrekposten opgeeft, worden die 9 van de 10 keer zonder gevolgen door de belastingdienst gecorrigeerd. In de overige gevallen kom je meestal weg met “oh sorry, dat wist ik niet”.
Als ik mijn belasting niet betaal. Zou ik dan ook weg komen met het argument:" Oepsie, dit was een technische fout".
Dat kan, mits het een technische fout is en jou niets valt te verwijten. Let wel, als de technische fout duidelijk op te merken was door jou als belastingbetaler en je doet daar niks mee, dan is dat weer nalatigheid, wat jou valt aan te rekenen. Een simpel ja of nee op je antwoord lijkt me niet waarschijnlijk.
Maar als een burger dit flikt dan wordt hij of zij door de mangel gehaald.
Facebook ook, waarvan akte ;)
Je vergelijking gaat scheef. Er is vaak een verschil of jij standaard een plicht hebt of zelf met een ander een afspraak maakt.
De VS is een corporatocratie, dan krijg je dat :/
In Nederland, in geval van horizontaal toezicht (: grote corporates) en bij niet te vaak voorkomen en een niet te grote misser, dan is het antwoord: Jazeker. Liever ten halve gedwaald dan ten hele gekeerd. Het is de bedoeling dat je als bedrijf fouten zelf ontdekt, meldt en overgaat tot verrekening van het resterende bedrag.
Misinformatie geven aan de onderzoekers van misinformatie?
Als het klopt dat er misinformatie is gegeven aan de onderzoekers; dat kan natuurlijk ook misinformatie zijn :)
Inception was toch ook 3 diep of zo?
Bijzonder hoe Facebook met fout op fout wegkomt met het maken van excuses om vervolgens te horen dat de situatie nog erger is dan gedacht.

Hoelang mag een groot bedrijf hiermee doorgaan? En is dit niet gewoon de bevestiging dat dit soort bedrijven groter dan de wet zijn geworden?!
Facebook onderzoeken voor misinformatie en dan verkeerde informatie toebedeeld krijgen ... de ironie :)
... zegt dat Facebook dat probleem 'proactief' aan zijn partners te hebben gemeld.
En
De fout werd ontdekt door Fabio Giglietto, een professor van de Universiteit van Urbino in Italië. Giglietto vergeleek de gegevens die het bedrijf aan onderzoekers verstrekte met de data uit dat Facebook in augustus publiceerde. Hij ontdekte daarbij dat de gegevens niet overeenkwamen.
Zijn mutueel exclusieve stellingen; voor fb om een fout proactief te melden moet fb zelf de fout vast kunnen stellen ipv dat andere onderzoekers dit *maanden* na het verstrekken van deze gegevens zelfstandig moeten vaststellen.
Gewoon kappen met Facebook, iedereen, dan gaat dat bedrijf vanzelf weg.

Maar zo lang mensen iedere(totaal oninteressante) brainfart op insta of Facebook moeten zetten maakt dat weinig kans.

Voor het overige maakt het weinig uit welke gegevens overgedragen worden......

Er wordt door grote bedrijven een onderzoeks instituten continu tegen de massa gelogen. Geloof niet dat dat met dit onderzoek anders zou zijn
Ook grappig is dat (1 van) de grootste data-dieven het niet goed vindt dat 'hun' data wordt 'gestolen' door onderzoekers... en dan ook op een zelfde manier (dus niet door hacken o.i.d.)

Hoe gek kun je het maken?
Lijkt Rutte van de VVD wel. Die heeft er ook een handje van verkeerd, half of te laat informeren van de 2e kamer.
Lijkt Rutte van de VVD wel. Die heeft er ook een handje van verkeerd, half of te laat informeren van de 2e kamer.
Of hij heeft er geen actieve herinnering meer aan, lekker makkelijk.

Maar pas op, het zit hier vol met VVD'ers, dus de kans dat u en ik worden weggemod is 100% :Y)
[...]


Of hij heeft er geen actieve herinnering meer aan, lekker makkelijk.
Ik vond dat sowieso al een rare opmerking, want dat zou dus betekenen dat hij er wel een inactieve herinnering aan heeft? :P
Maar het zijn écht allemaal op zichzelf staande toevalligheidjes, die écht geen groter onderliggend probleem aantonen!
Jo mooi zou het zijn als er vanuit gaan een bepaald land op een gegeven moment een top persoon zoals bv Zuckerberg strafbaar wordt gesteld. Zolang bedrijven wegkomen met paar boetes en waarschuwingen zal de invloed van bedrijven in politiek alleen maar groter worden.

Op dit item kan niet meer gereageerd worden.