Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

WhatsApp blokkeert twee miljoen accounts per maand in bestrijding valse info

Facebook-dochterbedrijf WhatsApp blokkeert twee miljoen accounts per maand in de bestrijding van nepaccounts, verspreiding van valse informatie en spam. Dat heeft het bedrijf laten weten. WhatsApp heeft algoritmes die een groot deel van de nepaccounts bij registratie herkennen.

WhatsApp logo 2018Zo let het algoritme onder meer op het ip-adres van de registratie en of dat in hetzelfde land ligt als waar het mobiele nummer is geregistreerd, schrijft Venturebeat op basis van een interview met een Indiase medewerker. Ook het direct gaan versturen van berichten in bulk naar veel verschillende nummers is een aanwijzing voor het algoritme dat het een nepaccount is, aldus de site.

Inmiddels heeft het algoritme 20 procent van de nepaccounts in de smiezen bij registratie, terwijl de software 75 procent van de twee miljoen geblokkeerde accounts per maand herkent zonder tussenkomst van mensen.

De maatregelen moeten de verspreiding van desinformatie via WhatsApp tegengaan. Daarbij ligt de focus op India, waar lynchpartijen hebben plaatsgevonden nadat mensen dachten ontvoerders herkend te hebben aan de hand van valse informatie die via WhatsApp verspreid werd. Eerder is WhatsApp begonnen met labelen van doorgestuurde berichten en het maximaliseren van het aantal chats waarnaar gebruikers berichten kunnen doorsturen om de verspreiding van valse informatie tegen te gaan.

Door Arnoud Wokke

Redacteur mobile

06-02-2019 • 20:08

63 Linkedin Google+

Reacties (63)

Wijzig sortering
uh.. wat?

Definieer 'nepaccount'?
Schijnbaar is registeren met een buitenlands ip-adres (bijv. VPN) al voldoende om als 'nep' aangemerkt te worden?

[Reactie gewijzigd door Ynst2003 op 6 februari 2019 20:22]

Nee, dat staat er niet. Er staat dat ze daar onder meer op letten. Uit de bron:

"In terms of overall flags, Jones said WhatsApp looks at various factors, including the user’s IP address and the country of origination for phone numbers used to sign up for the service (and whether both are pointing to the same location), how old the account is, and whether that account started sending a lot of texts as soon as it was created"
die uitbreiding van die opsomming maakt het ook niet echt goed.
Als ik een accountje aanmaak, terwijl ik toevallig in het buitenland zit, dan is het toch niet vreemd als ik flink ga zitten chatten? Daar is de app toch voor? Ik maak dus een account aan niet om te gaan zitten lurken...
Dat is ook niet vreemd, daarom zul je ook niet snel problemen krijgen. Het is pas vreemd bij excessen als meerdere factoren matchen. :)

Dus jij registeert tien Indiase nummers vanaf hetzelfde IP in de VS en gaat meteen bulkberichten sturen. Dan kom je heel snel op de banlijst, zeker als mensen het als spam rapporteren.

Registreer je één NL nummer in Duitsland en stuur je een paar berichtjes of misschien een verzendlijst en niemand rapporteert spam dan is er niets om je druk om te maken. Hoogstens wordt je verzendlijst misschien even gethrottled (langzaam stuk voor stuk afleveren met korte intervallen) om te zien of niemand het als spam rapporteert, maar daar houdt het wel op. Daar merk je eigenlijk niets van.

[Reactie gewijzigd door WhatsappHack op 7 februari 2019 00:25]

Als jij ''flink gaat zitten chatten'' zal je ook zeker niet opvallen volgens dit algoritme, tenzij jij de seconde nadat je dit account hebt aangemaakt naar 2000 ''contacten'' berichten stuurt.
en dan nog... wat als het een chatlijst is voor bepaalde doeleinden? Wie weet is het wel een organisatie die een meeting organiseert of wat dan ook. Wie is Facebook dan om daar iets van te vinden?
Alleen als er gerapporteerd wordt op spam zou je iets kunnen doen, maar voor de rest heeft Facebook niets te maken met wie wat via Whatsapp doet of wel? Dat kan je dan alleen beoordelen als je de inhoud van de berichten kan zien. En volgens het officiele verhaal kan dat niet, dus valt er voor Whatsapp niets te blokkeren of te bannen.
Doen ze dat wel, dan is dat censuur.

Alleen omdat iemand ineens flink wat berichten verstuurt hoeft niet direct te betekenen dat het 'nepnieuws' is. Dit vind ik dus het gevaar van dit soort ontwikkelingen. Bedrijven gaan wel even bepalen wat wel of geen nepnieuws is.
Fascinerend hoe we maar technische maatregelen moeten treffen omdat wij mensen zo ultiem dom zijn, dat we zelf informatie niet fatsoenlijk kunnen of willen filteren en verifiëren.

In plaats van algoritmes die onzin kunnen herkennen, zouden we toch in staat moeten zijn om onszelf een beetje bij te sturen met dit soort idioterie.

Wat een ongelooflijk zwaktebod is dit toch ook. Het laat duidelijk zien hoe incapabel we eigenlijk zijn als mensheid.

[Reactie gewijzigd door fapkonijntje op 6 februari 2019 21:00]

Vooral grappig dat je je hier zo over opwindt - het gemiddelde IQ is per definitie slechts 100, geloof dat veel mensen totaal niet beseffen dat dat inhoudt dat de helft van de mensen onder de 100 zit. Maar alleen een flink IQ hebben is niet voldoende, je hersenen hebben nu eenmaal een hoop manieren om energieverspilling te voorkomen wat ervoor zorgt dat je de fysieke neiging hebt om zo min mogelijk na te denken. Sinds het boek 'Thinking, fast and slow' van Kahneman kan niemand meer volhouden dat wij zulke rationele wezens zijn dat we niet enorm gemakkelijk te bedriegen zijn. Dat jij dat allemaal erg vreemd vindt is typerend voor de mens: we overschatten onze rationele mogelijkheden stelselmatig en dat maakt ons juist extra kwetsbaar.

De social networks hebben intussen een dodelijk mechanisme, bedoeld om zoveel mogelijk geld te verdienen (engagement te creeëren): elke populariteit wordt gekatalyseerd waarbij populariteit gemeten wordt door die engagement. En laat de gemiddelde mens nou het meest getriggerd worden door sensatie, waarbij het waarheidsgehalte ervan totaal niet belangrijk is... Ze kunnen tegen-algoritmes gaan verzinnen maar in feite zijn de algoritmes die de basis vormen van hun businessmodel het grote probleem. Ik verwacht dat het nog wel een tijd zal duren voordat ze dat in gaan zien en, toegegeven, ze verdienen zo absurd onmetelijk veel geld met hun onzin dat ze waarschijnlijk nog steeds winst maken als ze de halve wereldbevolking in dienst nemen om facts te checken.

Tech nerds + miljarden dollars = tech dystopia. Enjoy the ride...
Nou, je gaat wel erg kort door de bocht. Het is juist onze arrogantie, en ook die van jou door aan te nemen dat ik mij opwind - een aanname die je zomaar even doet op basis van een reactie onder een nieuwsbericht.

Het is dus onze arrogantie om te denken dat we dingen weten. IQ is helemaal niet relevant. Dat is een maatstaf die we zelf hebben verzonnen met een zelfverzonnen schaal, op basis van zelfverzonnen opdrachtjes, op basis van hoe we nu denken dat hersenen werken. Er komt een dag dat we erom lachen.

Het enige dat we hoeven te doen, is accepteren dat we dingen simpelweg niet weten en dat anderen eigenlijk ook niets zeker weten, dus dat we dingen met een korreltje zout moeten nemen. Natuurlijk zijn er zaken die goed empirisch uitgevogeld zijn, die nemen we aan voor waar, tot we beter weten. Dat we nog lang niet in staat zijn om zekerheid te hebben over zaken zou wat mij betreft iets moeten zijn dat we onszelf als mens toch wel zouden moeten realiseren, zo langzamerhand.

Mijn reactie is niet omdat ik iets vreemd vind, maar vooral omdat je door zo'n artikel weer zo mooi met je neus op de feiten gedrukt wordt, dat we na al die al die jaren ontwikkeling en fouten in het verleden, nog steeds zo verrekte arrogant zijn.

Persoonlijk weet ik dingen gewoon simpelweg niet, dus ga ik ook niet op roddels acteren, of verhalen van mensen zomaar voor waar aannemen, tenzij er een stevige onderbouwing is. Dat er mensen zijn die dat wel doen, is best wel eng. Teveel mensen geloven teveel dingen, zonder zich af te vragen waarom ze eigenlijk iets geloven.
Dat idee dat niemand iets zeker weet is op dit moment erg populair en strikt genomen weliswaar voor een aardig deel juist, maar wordt in de nepnieuws narratieven misbruikt om mensen het idee te geven dat het gebrachte nepnieuws ook best eens waar zou kunnen zijn, want tsja niemand weet iets zeker, toch? Ik distantieer me daar graag van; zoals jij verderop terecht opmerkt: de kennis die het beste onderbouwd is, omarmen, is het beste wat we kunnen doen, hameren op het idee dat niemand iets zeker weet is in deze omstandigheid juist olie op het vuur gooien.

Zoals Nicholas Negroponte in 1995 voorspelde in zijn rake boekje 'Being Digital': de ontwikkeling van het 'multicast' internet zal leiden tot information overload. Dat is waar we nu mee worstelen en de sensatie-katalyserende algoritmes van Google en Facebook katalyseren intussen ook de negatieve gevolgen van dat probleem, bestaande uit gevaarlijk radicale politiek, moordpartijen enz., grote groepen die tegen elkaar opgezet worden in een mate die we nooit eerder gezien hebben, met (door genoemde in beginsel technische partijen) gevoede gedachtenwerelden die verder van de werkelijkheid staan dan ooit.

Destijds al (m.i. correct) opgemerkt is de enige remedie hiertegen selectie, maar de gemiddelde mens is daar helemaal niet voor uitgerust en/of heeft er geen tijd voor. Dat is iets heel anders dan arrogantie; we zijn gewoon goedgelovig, lui of druk en/of ontberen de vaardigheden die iemand in staat stelt onzin te herkennen. Gelukkig neemt het onderwijs al een tijd lang zijn verantwoordelijkheid op dit vlak dus hopelijk zullen latere (Nederlandse) generaties daar beter mee om kunnen gaan, maar zoals Kahneman duidelijk maakt hebben we slechts beperkt controle over onze gedachtenprocessen - het is dus niet zomaar luiheid of onvermogen waar je wat aan kunt doen. Intussen zijn de tech giganten van dit moment onlosmakelijk onderdeel van het probleem; dat Facebook nu schoorvoetend en morrend bereid is om een paar centen uit te trekken om een beetje fact checking uit te voeren is schattig maar te weinig, te laat, in verkeerde handen en dweilen met de kraan open zolang hun verdienmodel het probleem intussen blijft voeden. De mogelijkheid om via Facebook mensen te targeten - alleen gebruikt door marketeers en politieke lobbyisten van discutabele statuur - haal die weg en we zijn van een groot deel van het probleem af. In de tussentijd moeten we fatsoenlijke journalistiek (grotendeels uitgevoerd/geproduceerd door wat in nepnieuws narratieven smalend 'MSM' wordt genoemd) opnieuw leren waarderen want ook al doen we nog zo onze best qua onderwijs, nieuwsconsumenten zullen dus nooit de rol van journalisten over kunnen nemen, betrouwbare kanalen die voor het gros de selectie uitvoeren zijn daarom van essentieel belang.

[Reactie gewijzigd door droner op 6 februari 2019 22:04]

IQ en 'slim zijn' hoeft niet noodzakelijk verband te hebben..
... het gemiddelde IQ is per definitie slechts 100, geloof dat veel mensen totaal niet beseffen dat dat inhoudt dat de helft van de mensen onder de 100 zit.
Just FYI: Al is de verdeling aannemelijk, dat houdt dat niet in, misschien ben je in de war met de mediaan.
Een groep kan prima gemiddeld 100 hebben terwijl er maar 1 onder zit, bijv. heel veel mensen met een IQ van 101 en 1 persoon met een IQ van 5.
Daar heb je whatapp niet voor nodig.

Neem een vrouw die loopt met een man over straat, begint ineens te schreeuwen dat ze ontvoerd is. Moet je eens kijken wat er met die man gebeurt. Filter is iets dan veel mensen niet hebben of dat nu op internet of in het echt is.

In het echt heb je ook piramide systemen, hoeveel mensen zich daar niet laten bedonderen. Wederom ook zonder internet kun je veel mensen van alles wijsmaken.

Dat het nu ook eenvoudiger via internet kan laat alleen maar zien hoe veel mensen zijn.
Het feit dat wij meer informatie te verwerken krijgen en de bijbehorende constante stress is je even ontgaan geloof ik?
Komt omdat het onzin is. Je kiest zelf de mediakanalen waar je mee in aanraking wilt komen. Alle info die je krijgt moet je toch echt zelf naar op zoek. Je kiest zelf naar welke website je gaat, waar je een account aanmaakt en participeert in het informatiedelen. Je kiest ook zelf welke media je consumeert. Het is niet dat iemand je op je stoel vast heeft gebonden en je dwingt op Facebook sensatieberichten uit je hoofd te leren.

Je bent verantwoordelijk voor jezelf. De schuld leggen hij anderen, vind ik maar een beetje vreemd.
Ik leg de schuld niet bij anderen zelf probeer ik gedegen onderzoek te doen, maar ik ben er voor opgeleid.

Zover ik weet wordt de wetenschappelijke methode, kritisch denken en mindfullness (nog) niet als essentiele skills geleerd op de basis-middelbare school.

Voornamelijk met de huidige cultuur blijft de educatie nog steken in leer modellen die nog groot deel van industriele era komen.

Er is enorm veel informatie, en vaak tegenstrijdig.

Je moet het wel enigsinds in perspectief plaatsen, niet alleen bij het individu.

Dat heeft niks met schuld te maken maar een combinatie van factoren.


Ik ben ook van het motto teach a man to fish, maar wat als je geleerd krijgt de hengel onderste boven te houden.
Ook het direct gaan versturen van dezelfde berichten naar veel verschillende nummers is een aanwijzing voor het algoritme dat het een nepaccount is, aldus de site. [..]

De maatregelen moeten de verspreiding van desinformatie via WhatsApp tegengaan. Daarbij ligt de focus op India, waar lynchpartijen hebben plaatsgevonden nadat mensen dachten ontvoerders herkend te hebben aan de hand van valse informatie die via WhatsApp verspreid werd.
Ik dacht altijd dat WhatsApp eind tot eind encryptie heeft.
"WhatsApp's end-to-end encryptie zorgt ervoor dat alleen jij en het contact waarmee je communiceert de berichten kunnen lezen. Niemand anders kan de berichten lezen. Zelfs WhatsApp kan dat niet. Je berichten zijn beveiligd met een slot en alleen de verzender en de ontvanger hebben de sleutel om het slot te openen en het bericht te lezen. Voor extra beveiliging heeft elk bericht een uniek slot en dus ook een unieke sleutel. [...]

Er is geen manier om de end-to-end encryptie uit te schakelen."
toevoeging: Maar schijnbaar wordt een bericht als je het 'doorstuurt' al getagd, met een unieke tag-id die niet meer geheim blijft, en actief gevolgd kan worden.

[Reactie gewijzigd door 3x3 op 6 februari 2019 20:24]

Op berichtinhoud, niet op metadata.

-edit- Correcties na het nalezen van het bronartikel en de Whitepaper en verdere uitleg hoe het systeem werkt is hieronder beschreven: WhatsappHack in 'nieuws: WhatsApp blokkeert twee miljoen accounts per maand i...

[Reactie gewijzigd door WhatsappHack op 6 februari 2019 23:13]

Hoe kan het dan precies dat berichten en bijlagen een uniek ID hebben dat kan worden uitgelezen bij een doorgestuurd bericht? Met end-to-end encryptie dient een doorgestuurd bericht toch opnieuw op basis van de sleutels van verzender en ontvanger te worden versleuteld? Wordt er los van het versleutelde bericht dan altijd een hash van het oorspronkelijke bericht onversleuteld doorgestuurd ofzo?

"Blobstore" klinkt alsof er een "centrale opslag" van (her)gebruikte bijlagen zou zijn? Dat moet niet mogelijk zijn lijkt me, omdat de reeds versleutelde data (waarbij de versleuteling afhankelijk is van de betrokken personen en ook per bericht varieert) onmogelijk hergebruikt kan worden, tenzij de policy ineens is dat "grote bijlagen" deze end-to-end encryptiebehandeling niet genieten?
Hoe kan het dan precies dat berichten en bijlagen een uniek ID hebben dat kan worden uitgelezen bij een doorgestuurd bericht?
Dat is inderdaad niet mogelijk. Het was een theorie dat ze dit misschien aan ID's in de metadata kunnen zien, maar dat blijkt toch gewoon correct afgevangen te worden door WhatsApp en niet het geval. Ze kunnen zelf blijkbaar niet zien dat een bericht is doorgestuurd en een nieuw bericht heeft dus een nieuw ID. Wel zouden ze op basis van metadata + retrieval log wellicht relaties kunnen leggen dat het waarschijnlijk is dat je een bijlage heel vaak hebt (door)gestuurd, maar of ze dat doen is weer een ander verhaal.

Dat is overigens verder geen probleem, want als je voor elk bericht dezelfde bijlage opnieuw zou versleutelen en versturen is ook wel te voorspellen dat het hetzelfde bestand is... Immers als jij 100x een bestandje van ongeveer ~3MB upload naar de WhatsApp servers, heel snel achter elkaar (eg: verzendlijst of in een groep), dan is de kans heel erg groot dat dit om steeds dezelfde bijlage gaat. :P Het kunnen herkennen daarvan zou dan zelfs juist makkelijker en voorspelbaarder zijn in vergelijking met zoals het nu werkt. Het apart voor iedereen opnieuw versleutelen zou je maar één ding echt mee bereiken: ontiegelijk veel meer dataverbruik...

Daar is redelijkerwijs eigenlijk ook nogal weinig tegen te doen en eerlijk gezegd is het ook niet zo'n probleem. Immers weten ze nog steeds niet WAT er nou precies in die bijlage staat. En met wie je communiceert weten ze al a.d.h.v. metadata.
Met end-to-end encryptie dient een doorgestuurd bericht toch opnieuw op basis van de sleutels van verzender en ontvanger te worden versleuteld?
Dat is inderdaad hoe het functioneert.
Wordt er los van het versleutelde bericht dan altijd een hash van het oorspronkelijke bericht onversleuteld doorgestuurd ofzo?
Nee.
"Blobstore" klinkt alsof er een "centrale opslag" van (her)gebruikte bijlagen zou zijn? Dat moet niet mogelijk zijn lijkt me, omdat de reeds versleutelde data (waarbij de versleuteling afhankelijk is van de betrokken personen en ook per bericht varieert) onmogelijk hergebruikt kan worden, tenzij de policy ineens is dat "grote bijlagen" deze end-to-end encryptiebehandeling niet genieten?
Er is inderdaad een centrale opslag van bijlagen.
Zoals je reeds is uitgelegd werkt het iets anders. Bijlagen vallen buiten het end-to-end encryptie schema voor de bijlagen zelf. Deze worden "normaal" encrypted, en de decryptiesleutel plus de link naar de bijlage in de blobstore worden end-to-end encrypted verstuurd naar de ontvangers. Als je een bijlage doorstuurt stuur je in werkelijkheid de pointer + sleutel door. Een bijlage blijft enkele dagen staan op de servers.

Quote vanuit de technische whitepaper:
1. The WhatsApp user sending a message (“sender”) generates an ephemeral 32 byte AES256 key, and an ephemeral 32 byte HMAC-SHA256 key.
2. The sender encrypts the attachment with the AES256 key in CBC mode with a random IV, then appends a MAC of the ciphertext using HMAC-SHA256.
3. The sender uploads the encrypted attachment to a blob store.
4. The sender transmits a normal encrypted message to the recipient that contains the encryption key, the HMAC key, a SHA256 hash of the encrypted blob, and a pointer to the blob in the blob store.
5. The recipient decrypts the message, retrieves the encrypted blob from the blob store, verifies the SHA256 hash of it, verifies the MAC, and decrypts the plaintext.

[Reactie gewijzigd door WhatsappHack op 7 februari 2019 00:31]

Ook bijlages zijn indirect end-to-end versleuteld natuurlijk. Ze zijn met een sleutel versleuteld opgeslagen in de "blobstore", maar WA zelf heeft de sleutel ervoor niet. Die sleutel wordt E2E-versleuteld verstuurd naar de ontvangers, zodat de ontvangers ddeze bijlages kunnen lezen maar niemand anders.

Wat er hier naar mijn mening wel fout gaat is dat blijkbaar de attachment IDs en de message IDs buiten de E2E-encrypted payload vallen, zodat er meer metadata verzameld wordt dan nodig zou zijn om deze functionaliteit te kunnen bieden.
Thanks voor deze extra uitleg. De reactie @WhatsappHack was uitvoerig (thx!), maar ik begreep daar nog niet direct uit dat de decryptiesleutel van de blob alleen lokaal wordt opgeslagen en vervolgens end-to-end versleuteld naar de ontvanger wordt verstuurd. Een erg voor de hand liggende manier nu ik 't zo lees :) Hier volgt ook (gelukkig) uit dat als bijvoorbeeld iemand anders dezelfde bijlage zou uploaden, Facebook niet zou weten dat het dezelfde bijlage betreft (al zou een grove schattig wellicht kunnen op basis van gedeelde contactpersonen, bestandsgrootte en tijdstippen).
Wat er hier naar mijn mening wel fout gaat is dat blijkbaar de attachment IDs en de message IDs buiten de E2E-encrypted payload vallen, zodat er meer metadata verzameld wordt dan nodig zou zijn om deze functionaliteit te kunnen bieden.
Dit vind ik ook erg curieus, als dat gebeurt tenminste: @WhatsappHack zegt nu juist hierboven dat dit (toch) niet het geval is.

[Reactie gewijzigd door guillaume op 7 februari 2019 18:30]

Wanneer jij een filmpje naar 50 mensen stuurt zou het enorme bandbreedteverspilling zijn als jij dat filmpje dan 50x moet uploaden. Gebruik je een groep of verzendlijst, dan upload je het één keer en wordt het vanuit de 'centrale opslag' naar alle ontvangers gestuurd. Ik gok dat in het geval van een groep of verzendlijst een iets ander E2E protocol telt dan bij een op een communicatie, anders zouden berichten in grote groepen tientallen keren versleuteld en verstuurd moeten worden, dat is niet heel efficiënt.
Hoe weet je op basis van metadata of het hetzelfde bericht is?
Ik heb m'n post aangepast met een wat bredere uitleg, zag de vraag al aankomen. :P
Maar daaruit begrijp ik dat het message ID dus onversleuteld verstuurd wordt, zelfs als het gewrapped is in een ander bericht. Dat is dus een gat in de E2E encryptie. Idem voor bijlages. Ik zou verwachten dat een bijlage vesleuteld geupload wordt, en vervolgens de upload-ID en decryptiesleutel E2E versleuteld naar de ontvangers gestuurd wordt. Daar zou WhatsApp dus niets van moeten zien, behalve dan een hoog aantal requests voor dezelfde upload-ID.
Het message ID is voor zover ik weet inderdaad onderdeel van berichtmetadata en niet end to end versleuteld. Dit is iets anders dan het ID voor de volgorde van encryptie zoals Signal Protocol werkt overigens, verschillende zaken. Daarmee ook geen lek in het protocol.

De encryptie van de bijlage werkt exact zoals je stelt, daarom kost via Desktop bijlages versturen ook nauwelijks data op je telefoon omdat de client direct kan communiceren met de blobstore en de client enkel de pointer + E2EE de sleutels hoeft te sturen. Hoe WhatsApp het doorsturen van dezelfde blob kan inzien zou ik eigenlijk zo 1,2,3 niet weten en klinkt idd raar; maar ik gok dat het antwoord daarop wederom in de metadata zou kunnen zitten, omdat de blobstore onafhankelijk van Signal Protocol werkt. Inherent zou dat dan inderdaad een tik privacy gevloeiger dan de end to end encryptie zijn, maar geen gat in diezelfde encryptie omdat bijlagen strict gezien *niet* end-to-end versleuteld zijn maar met een eenmalige sleutel die je met zoveel mensen kan delen als je wilt tezamen met die pointer... WhatsApp krijgt de sleutel overigens uiteraard niet en kan dus ook niet zien wat de bijlage precies is.

-edit- voor de duidelijkheid voor ik verkeerd begrepen wordt: ik weet niet zeker of die pointer ook E2EE wordt gestuurd. (-edit- Ja, dat worden ze! Hieronder uitgelegd.) Het kan zo zijn dat dat wel degelijk zo is, maar de ontvangende client misschien een poll doet naar de pointer in de blobstore om daarvan de metadata op te vragen? Een slim algoritme op de WhatsApp servers kan dan wellicht heel simpel 1+1=2 doen wat ook zou verklaren waarom het algoritme het wel kan, maar de menselijke werknemers niet... Just a theory.

Ik weet dus niet exact hoe dit systeem werkt, maar het hoeft hoe dan ook geen gat in het protocol te betekenen noch dat de pointer zelf niet E2EE zou worden verstuurd. Wel een zwakte in de zin van privacy ivm het verwerken en relaties kunnen leggen in metadata misschien, maar dat wisten we al.


-edit- typofixes en opheldering

[Reactie gewijzigd door WhatsappHack op 7 februari 2019 00:04]

Bij E2E-encryptie zou álles versleuteld verstuurd moeten worden behalve dat was essentieel noodzakelijk is om het bij de ontvanger te krijgen. Alles wat daaraan afdoet is een gat.

Inderdaad, WA zal niet kunnen zien wát er precies verstuurd wordt. Ook de inhoud van de bijlages kunnen ze niet zien. Maar als naast het tracken van wie wanneer aan wie een berichtje stuurt, ook kunnen tracken welk bericht (zonder de inhoud te kennen) welke route door een netwerk volgt is dat alweer een groter gat dan nodig is.

De enige reden die ik me kan indenken is exact voor wat in dit bericht aangehaald wordt: spammers pakken. Maar eigenlijk gaat het al fout bij het bestaan van de verzendlijst-functie. Verzendlijsten zijn eigenlijk uitsluitend bruikbaar voor spammers en zouden geen plek moeten hebben op een platform voor persoonlijke communicatie. Als je een bericht met een groep moet delen maak je maar een groep aan.
Okidokie, intussen thuis dus heb er eens even wat beter naar kunnen kijken in plaats van de hele tijd gissen naar hoe het misschien zou kunnen werken met de metadata en dit en dat. Hoe langer ik er over dacht hoe gekker het begon te klinken dat er inderdaad een mogelijkheid zou zijn om dezelfde tekst te detecteren. Bijlagen zou ik me, zoals hierboven beschreven, nog iets bij kunnen voorstellen (al zou dat idd ook wat vaag zijn); maar het leek me raar dat het zo ontworpen zou zijn. Vandaar dat ik er ook bij opgemerkt had dat ik niet zeker weet hoe het functioneert.

... Afijn, nu wat uitgebreider op onderzoek uitgegaan:
Het blijkt dat het artikel op Tweakers iets heeft toegevoegd.
Tweakers:
Ook het direct gaan versturen van dezelfde berichten naar veel verschillende nummers
Origineel:
... they have built a machine learning system to detect and weed out users who engage in inappropriate behavior, such as sending bulk messages and creating multiple accounts with the sole purpose of spreading questionable content on the platform.
En
In terms of overall flags, Jones said WhatsApp looks at various factors, including the user’s IP address and the country of origination for phone numbers used to sign up for the service (and whether both are pointing to the same location), how old the account is, and whether that account started sending a lot of texts as soon as it was created.
Er wordt met geen woord gerept over "hetzelfde bericht", enkel over accounts die (opeens) heel veel berichten (bulk) gaan versturen. Daarnaast worden er matches geprobeerd te maken of het IP wel overeenkomt met het telefoonnummer en of er niet opeens heel veel WhatsApp-instances vanaf hetzelfde IP-adres tevoorschijn komen terwijl dat eerder niet het geval was.

... Dat zijn anti-spam technieken die ze een paar jaar geleden al hanteerden en dat nog eens extra gevoed wordt met de "Rapporteer als spam" functie binnen WhatsApp die je te zien krijgt als iemand niet in je contacten staat.

In het hele artikel is geen enkele opmerking te vinden dat WhatsApp zou weten dat het om dezelfde berichten gaat. Zelfs mijn theorie dat dit misschien om bijlagen zou gaan i.v.m. India's problemen met mensen die niet kunnen lezen wordt niet over gesproken.
Het blijkt ook dat de eerste variant van de theorie niet zou werken, want zowel de sleutel alsmede een SHA256 hash van de encrypted bijlage plus de pointer naar die bijlage in de blobstore worden allemaal volledig end-to-end encrypted verstuurd en komen dus NIET terecht in de metadata, op geen enkele wijze. WhatsApp kan dat dus NIET zien. De tweede theorie zou wel kunnen werken (men kan relaties leggen tussen verzonden bericht + client haalt de bijlage (metadata) op uit de blobstore), maar dat is een theorie waarvan het niet bekend is of ze dit ook toepassen op de anti-spam maatregelen.

Kortom, het lijkt neer te komen op een fout in het artikel van Tweakers die verwarring verspreidt. :P

Men kan niet:
- Zomaar zien wie dezelfde bijlagen steeds (door)stuurt (wel zou men een relatie kunnen leggen a.h.d.v. metadata zoals hierboven beschreven. Of ze dat doen: geen idee.)
- Zomaar zien dat iemand steeds hetzelfde bericht stuurt (ook hier zou men wel kunnen gokken, immers als jij 1000 berichten verstuurd in minder dan 10 seconden dan... Nou, dan boeit het eigenlijk niet eens of het wel of niet hetzelfde bericht is, dan gaan er sowieso alarmbellen rinkelen. :+)

Men kan wel:
- Zien dat iemand opeens heel veel berichten stuurt (en als spam wordt gerapporteerd)
- Detecteren als er vanaf een IP opeens meerdere nummers aanmelden
- Detecteren of het nummer wel hoort bij het land van het IP (onbetrouwbaar)
Wat allemaal eigenlijk niets nieuws onder de zon is.

[Reactie gewijzigd door WhatsappHack op 7 februari 2019 00:02]

Ha, het bronartikel erop naslaan. Zou niet nodig moeten zijn ;) Maar bedankt voor de opheldering. Dan is dit nieuws niet ernstig en verder prima te verdedigen dat ze daar iets mee doen.

@arnoudwokke heeft wat aan te passen ;)
Whatsapp heeft welliswaar end2end encryptie, al het verkeer gaat via servers.
Het bestrijden van de valse informatie kan je beter zien als bestrijding van spam.

Het detecteren van nepaccounts bij registratie heeft wellicht te maken met registraties van non-Windows Phone,Iphone of Android clients, die daardoor enkel op een andere encryptie zitten dan echte users(soms web,soms iphone). Een nieuwe user, die niet op 1 van deze devices zit EN die vlak na registratie verschillende uploads naar de blobstore doet, is hoogstwaarschijnlijk een fake account.
"All communication between WhatsApp clients and WhatsApp servers is layered within a separate encrypted channel. On Windows Phone,iPhone, and Android, those end-to-end encryption capable clients use Noise Pipes with Curve25519, AES-GCM, and SHA256 from the Noise Protocol Framework for long running interactive connections." (bron: https://www.whatsapp.com/...p-Security-Whitepaper.pdf)

Het detecteren van zal vooral op IP, connectie, contacten,groepen en platform informatie gebaseerd zijn, aangezien dat data is waar Whatsapp vrij toegang toe heeft.
Met de encryptie is niets mis (zie pdf), het is voornamelijk de ToS die dit mogelijk maakt.
Kijk maar eens welke data zij van jou mogen hebben en delen;
" You can access or port your information using our in-app Request Account Info feature (available under Settings > Account). " (bron: https://www.whatsapp.com/...our-european-region-users)

Zie vervolgens wat zij met deze data mogen doen:
"We verify accounts and activity, and promote safety and security on and off our Services, such as by investigating suspicious activity or violations of our Terms, and to ensure our Services are being used legally." (bron: https://www.whatsapp.com/...cy-how-we-use-information)

en uiteraard;

"We are part of the Facebook Companies. As part of the Facebook Companies, WhatsApp receives information from, and shares information with, the Facebook Companies. We may use the information we receive from them, and they may use the information we share with them, to help operate, provide, improve, understand, customize, support, and market our Services and their offerings."
(bron: https://www.whatsapp.com/...-other-facebook-companies)

Kortom, de algoritmes zullen zich waarschijnlijk meer focussen op de aspecten van de data die zij mogen gebruiken, dan op de daadwerkelijke (encrypte) data. 'fake news' is simpelweg de huidige benaming van spam.

[Reactie gewijzigd door w0nnapl4y op 6 februari 2019 22:11]

Waterdicht is het dus zeker niet..
In welk opzicht precies? Qua encryptie is het waterdicht. :)

Let op dat de post waarop je reageert een theorie bevat hoe het zou kunnen ALS ze het kunnen. Nader onderzoek wees uit dat dit slechts deels zou kunnen en dat de beschrijving in het artikel hier dat WhatsApp dezelfde berichtinhoud zou kunnen detecteren niet klopt, wat een hele hoop verklaart. :P De post is daar deels ook op aangepast en er is een nieuwe reactie gepost die de feiten opsomt.

[Reactie gewijzigd door WhatsappHack op 7 februari 2019 00:12]

Grootte, hash, misschien zelfs de ciphertext.
Deze is al uit 2017,
https://www.forbes.com/si...r-government-data-request
According to court filings reviewed by your reporter over recent months, there’s little indication WhatsApp has ever handed message content to the cops. But it has given plenty of other revealing data to the FBI on multiple occasions. Mostly it’s metadata showing which numbers contacted which over WhatsApp, when, and for how long, as well as the IP addresses and phone identifiers associated with the subpoenaed accounts. Location and contacts data may also be accessible to police when they come knocking on WhatsApp’s Mountain View doors.
Gooi er een time-stamp op icm telefoonnr of imei en je kunt makkelijk tracken.
Het gaat hier over het massaal doorsturen van berichten.

Zoals de grappige filmpjes van ome Henk ;)
Dat gebruikt WhatsApp ook.

Je hoeft geen toegang tot de inhoud van een bericht te hebben om te weten dat het naar veel mensen is doorgestuurd, bijvoorbeeld door het message ID van het originele bericht mee te sturen met het doorgestuurde bericht.
Klopt, maar om de functionaliteit om berichten door te sturen naar meerdere mensen te tellen (loggen) heb je de inhoud van het bericht niet nodig. Dus die vlieger gaat nog steeds op.
Vind ik eigenlijk wel een goede vraag. Iemand die hier een verklaring voor heeft?
Worden die twee miljoen accounts ook grotendeels door computers aangemaakt?
Ja, volgens het bronartikel zijn er zelfs apparaten gemaakt met tientallen simkaarten erin gekoppeld aan computers om zo met wat scripts heel veel WhatsApp-accounts aan te maken. :+
Dit wordt dus een soort wapenwedloop. De spammers zullen hun accounts zo realistisch mogelijk aanleggen, een tijdje laten rijpen, en dan pas spam gaan verspreiden.

Dat algoritme, dat nu al volledig geautomatiseerd 75% van die 2 miljoen accounts per maand blokkeert, zal het dus steeds moeilijker gaan krijgen. Er wordt niet vermeld wat de false positive rate van het algoritme is, maar als het 99,9% correct is, wat onwaarschijnlijk hoog is voor alles behalve de meest simplistische gevallen, dan wordt 0,01%, 1500 accounts per maand, onterecht geblokkeerd. En hoe scherper het algoritme getuned wordt om met de meer gesofisticeerde spammers af te rekenen, hoe slechter dit wordt.
Daar hebben ze iets op gevonden. De WhatsApp-client vraagt je als je een bericht krijgt van een nummer dat niet in je contactenlijst staat of het spam is. Als een account van de een op de andere dag opeens heel veel berichten gaat versturen, dan wordt dit gethrottled. Als de mensen bij wie het aankomen X daarvan aangeven dat het spam is, dan wordt het account geblokkeerd.

... En dat is geen algoritme dat je moet verslaan.
Er zullen vast spammers zijn die doodleuk het bericht beginnen met PAS OP!! KLIK NIET OP DE KNOP OM SPAM TE RAPPORTEREN WANT DAN KRIJG JE EEN VIRUS!! en dat er mensen zijn die daarin trappen, maar over het algemeen moet je dus toch de mensen zelf verslaan in dat geval; en niet het algoritme. Ik mag hopen dat de meeste mensen dat soort berichten intussen wel negeren, maar aan de andere kant: we hebben het dus wel mede over mensen die lynchpartijen uitvoeren op basis van wat onzin die verspreid wordt via WhatsApp, dus wat dat betreft... Afijn.

Stuur je het naar alle mensen die jou in je contacten hebben...? Dan wordt het inderdaad een stuk lastiger omdat men veel minder data heeft om mee te werken en ze ook niet willen dat er veel false-positives getriggerd worden.

[Reactie gewijzigd door WhatsappHack op 6 februari 2019 23:53]

Wat een bak misinformatie in deze thread zeg. Dat laatste paragraaf slaat niet perse op spammers en hoort wat mij betreft niet perse in het artikel. Daadwerkelijke spam ga je natuurlijk niet doorsturen. Een programmeur die zoiets wil doen is echt niet zo stom.

Wat logischer zou zijn is dat de berichten van iemand die je rapporteert voor spam op dat moment verstuurd worden naar Whatsapp maar dat lees ik niet zo snel terug. Natuurlijk kun je wel zien of iemand bijzonder weinig interactie heeft in chats, regelmatig berichten stuurt, veel berichten stuurt etc.
ik heb 'bestrijding van nepnieuws' altijd een mooie eufemistische term van 'censuur' gevonden.
Wie bepaalt wat nepnieuws/valse info is? Die partij weet dan blijkbaar de echte waarheid, laat ze die dan ook even vertellen...

Daarnaast gaat het Whatsapp volgens mij helemaal niets aan in welk land ik een whatsapp-accountje aanmaak. Als ik in Duitsland ben en ik wil graag een Whatsapp-accountje aanmaken (stel dat ik er geen had) dan moet Whatsapp niet moeilijk gaan doen dat ik een Nederlands nummer heb.

Techbedrijven moeten zich bezighouden met tech, niet met politiek.
Volgens mij is nep nieuws toch best duidelijk te definiëren...
Ik ben blij dat de Tech bedrijven die dit faciliteren een oplossing proberen te vinden om dit zo snel mogelijk tegen te houden.
Ik maakte me eerst ook zorgen over hoe zo'n bedrijf zo'n bericht zou kunnen herkennen, maar dat is al een paar reacties hierboven uitgelegd . Goed werk dus. Scheelt mij weer regelmatig de irritante persoon te moeten zijn om diegenen met feiten te corrigeren :P

Dit is overigens niet op Whatsapp. Daar heb ik gelukkig nooit te maken gehad met fake accounts....

[Reactie gewijzigd door fm77 op 6 februari 2019 20:57]

definieer 'nep nieuws' dan maar eens.
'Informatie die niet klopt'? Zoiets? Ja, maar wie bepaalt of iets klopt of niet?
Er kan best een bericht komen en dat wordt dan afgedaan als nepnieuws, maar achteraf blijkt het toch waar te zijn.

'Nepnieuws' is politiek.
Gaat het niet om massaal doorgestuurde berichten? iets waar een person-to-person communicator niet voor gemaakt is?
Je trekt e.e.a. in het belachelijke om een flinterdun punt te maken - nepnieuws bestaat nl. veelal uit beweringen die te verifiëren zijn, en vals blijken te zijn. Journalistieke foutjes zijn geen 'nepnieuws' - fouten maakt iedereen, nepnieuws is het moedwillig verspreiden van desinformatie om bepaalde doelen te verwezenlijken die niet door feitelijkheid gediend worden. Nepnieuws trekt bewust zaken uit verband, plaatst bewerkte of niet-gerelateerde foto's, probeert mensen op te hitsen.

Nepnieuws wordt dus niet politiek bepaald, maar wordt bepaald door (structurele) moedwillige (on)feitelijkheid en veelal duistere motieven. En kan dus ontmaskerd worden door fact checking.
Ik doel meer op berichten met "alternatieve" feiten ;)
wat is het verschil?
Wat zijn alternatieve feiten?
Informatie die aantoonbaar fout is, maar toch door grote groepen mensen voor waar aangenomen wordt.
Maar laten we het daar ook maar bij houden. Ik merk al dat dit niet een zinvolle discussie gaat worden (met alle respect natuurlijk).
Hoe bedoel je End-2-end encryptie.... Ze zouden niet moeten kunnen zien WAT je verstuurd alleen de meta data met wie je aan het communiceren bent....
ik heb 'bestrijding van nepnieuws' altijd een mooie eufemistische term van 'censuur' gevonden.
Ja, maar wat zou jij doen?
Twee miljoen accounts per maand die de boel proberen op te lichten.
Heb je uberhaupt wel een idee wat hier aan de hand is?

En hoezo maak je hier politiek van?
Mogen ze die miljoenen nepaccounts dan niet weren van hun platform?
dan moet Whatsapp niet moeilijk gaan doen dat ik een Nederlands nummer heb.
Doen ze moeilijk dan? Heb je er last van? Maak jij dan duizenden nepaccounts aan op whatsapp ofzo?
Ja, lynchpartijen in India, daar wordt je niet vrolijker van, natuurlijk. Maar toch zet ik vraagteken bij deze trend van de grote social media jongens om ons alleen maar 'waarheid' voor te willen schotelen (denk 'Pravda'). Het begint met het wegfilteren van ideen/ideologien die men kennelijk 'onwaar' acht. En bij de volgende stap, zitten we op 'some truths are more equal than others', om het zo maar even te zeggen, en gaan Facebook en aanverwanten bepalen wat voor soort waarheid we te zien krijgen. Onder het mom van 'lynchpartijen voorkomen' geven we Facebook weer een extra, gevaarlijk achterdeurtje.

Zou het toch ook niet veel beter zijn als de Indiase overheid zijn eigen mensen vraagt niet direkt te handelen als een debiel wanneer ze een vermeende waarheid lezen/zien? En niet 'de waarheid' te leggen bij een totaal onbetrouwbaar bedrijf als Facebook.
Belachelijke artikelen doorsturen gebeurt in alle culturen. Subliminal message erbij en je bereikt als aanvaller je doel.
"Kat vermoord door kwaadaardige kinderen #EUkills" met gore foto erbij. Dat soort dingen. Waarbij het op zich betekenisloze bericht een lading krijgt door de hashtag.

[Reactie gewijzigd door sympa op 6 februari 2019 21:31]


Om te kunnen reageren moet je ingelogd zijn


Apple iPhone XS Red Dead Redemption 2 LG W7 Google Pixel 3 XL OnePlus 6T (6GB ram) FIFA 19 Samsung Galaxy S10 Google Pixel 3

Tweakers vormt samen met Tweakers Elect, Hardware.Info, Autotrack, Nationale Vacaturebank, Intermediair en Independer de Persgroep Online Services B.V.
Alle rechten voorbehouden © 1998 - 2019 Hosting door True