Okidokie, intussen thuis dus heb er eens even wat beter naar kunnen kijken in plaats van de hele tijd gissen naar hoe het misschien zou kunnen werken met de metadata en dit en dat. Hoe langer ik er over dacht hoe gekker het begon te klinken dat er inderdaad een mogelijkheid zou zijn om dezelfde tekst te detecteren. Bijlagen zou ik me, zoals hierboven beschreven, nog iets bij kunnen voorstellen (al zou dat idd ook wat vaag zijn); maar het leek me raar dat het zo ontworpen zou zijn. Vandaar dat ik er ook bij opgemerkt had dat ik niet zeker weet hoe het functioneert.
... Afijn, nu wat uitgebreider op onderzoek uitgegaan:
Het blijkt dat het artikel op Tweakers iets heeft toegevoegd.
Tweakers:
Ook het direct gaan versturen van dezelfde berichten naar veel verschillende nummers
Origineel:
... they have built a machine learning system to detect and weed out users who engage in inappropriate behavior, such as sending bulk messages and creating multiple accounts with the sole purpose of spreading questionable content on the platform.
En
In terms of overall flags, Jones said WhatsApp looks at various factors, including the user’s IP address and the country of origination for phone numbers used to sign up for the service (and whether both are pointing to the same location), how old the account is, and whether that account started sending a lot of texts as soon as it was created.
Er wordt met geen woord gerept over "hetzelfde bericht", enkel over accounts die (opeens) heel veel berichten (bulk) gaan versturen. Daarnaast worden er matches geprobeerd te maken of het IP wel overeenkomt met het telefoonnummer en of er niet opeens heel veel WhatsApp-instances vanaf hetzelfde IP-adres tevoorschijn komen terwijl dat eerder niet het geval was.
... Dat zijn anti-spam technieken die ze een paar jaar geleden al hanteerden en dat nog eens extra gevoed wordt met de "Rapporteer als spam" functie binnen WhatsApp die je te zien krijgt als iemand niet in je contacten staat.
In het hele artikel is geen enkele opmerking te vinden dat WhatsApp zou weten dat het om dezelfde berichten gaat. Zelfs mijn theorie dat dit misschien om bijlagen zou gaan i.v.m. India's problemen met mensen die niet kunnen lezen wordt niet over gesproken.
Het
blijkt ook dat de eerste variant van de theorie niet zou werken, want zowel de sleutel alsmede een SHA256 hash van de encrypted bijlage plus de pointer naar die bijlage in de blobstore worden
allemaal volledig end-to-end encrypted verstuurd en komen dus NIET terecht in de metadata, op geen enkele wijze. WhatsApp kan dat dus NIET zien. De tweede theorie zou wel kunnen werken (men kan relaties leggen tussen verzonden bericht + client haalt de bijlage (metadata) op uit de blobstore), maar dat is een theorie waarvan het niet bekend is of ze dit ook toepassen op de anti-spam maatregelen.
Kortom, het lijkt neer te komen op een fout in het artikel van Tweakers die verwarring verspreidt.
Men kan niet:
- Zomaar zien wie dezelfde bijlagen steeds (door)stuurt (wel zou men een relatie kunnen leggen a.h.d.v. metadata zoals hierboven beschreven. Of ze dat doen: geen idee.)
- Zomaar zien dat iemand steeds hetzelfde bericht stuurt (ook hier zou men wel kunnen gokken, immers als jij 1000 berichten verstuurd in minder dan 10 seconden dan... Nou, dan boeit het eigenlijk niet eens of het wel of niet hetzelfde bericht is, dan gaan er sowieso alarmbellen rinkelen.

)
Men kan wel:
- Zien dat iemand opeens heel veel berichten stuurt (en als spam wordt gerapporteerd)
- Detecteren als er vanaf een IP opeens meerdere nummers aanmelden
- Detecteren of het nummer wel hoort bij het land van het IP (onbetrouwbaar)
Wat allemaal eigenlijk niets nieuws onder de zon is.
[Reactie gewijzigd door WhatsappHack op 23 juli 2024 00:18]