De zaken die je noemt gaan eigenlijk over metadata, niet over berichtinhoud. Over de metadata heb ik het bewust niet gehad, dat is immers ook geen onderdeel van het encryptieschema. Voor die zaken is nog altijd op geen enkele wijze toegang tot de berichtinhoud noodzakelijk.
Overigens denk ik niet dat de correlatie maken per definitie zo makkelijk is...
Als Henk op Facebook een enorme liefde heeft voor gitaren en daar de godganse dag foto's van plaatst en spullen liked, kan het nog steeds zo zijn dat ik met Henk gewoon een gesprek voer over hoe laat we morgen gaan lunchen om een zakelijke casus te bespreken en gitaren me geen hol interesseren.
Wel kan Facebook inschatten dat omdat Henk kennelijk van gitaren houdt, dat ik er misschien ook wel interesse in heb en zo op FB-platform "relevante" advertenties tonen. Of die ook daadwerkelijk relevant zijn is een gok, toch zal dat zeker best effectief kunnen zijn. Maar het blijft Henk's profilering, niet de mijne: tot ik zo stom ben om op een advertentie te klikken.
Waar Facebook's werkelijke verzamelkracht ligt is niet in WhatsApp, encrypted FB Messenger en wellicht niet eens perse direct op het Facebook Platform (behalve pages die je liked/veel bezoekt (serieus, dat hele algoritme van pages is bizar slecht.) en advertenties die je aanklikt). Nee, het grootste gedeelte van de data harkt men binnen aan het gedrag wat ze van je verzamelen met betrekking tot je browsen op andere websites; al helemaal als je ingelogd bent bij Facebook en geen trackers blokkeert. Die trackers, die leveren de werkelijke zee van data op en *zeer* contextueel. Welke sites bezoek je? Kom je daar vaker? Welke producten bekijk je daar en wat koop je uiteindelijk? Welk onderwerp hebben die sites in het algemeen? Wat is het nieuwsartikel dat jij zojuist gelezen hebt? Lees je vaker die onderwerpen? Daar schuilt de werkelijke datamining en levert veel concretere informatie op dan out-of-context informatie die in willekeurige insignificante WhatsApp-gesprekken over het algmeen worden gevoerd.
Dat is waarom ik denk dat:
1.) De inhoud van de berichten nauwelijks interessant is om te analyseren, zeker omdat er vaak geen context aan verbonden zal zijn. Dit is door dataexperts ook vaker aangedragen als punt overignes:
2.) De metadata al een stuk interessanter is, maar enkel om inschattingen te maken van wat je *mogelijk* leuk vindt als je veel met iemand spreekt
In geen van de scenario's is de inhoud van de berichten werkelijk de moeite waard om te analyseren, dat kost veel kracht, levert nauwelijks bruikbare informatie op en is een recept voor PR-gezeik; zeker met een app als WhatsApp waar men er vanuitgaat dat Facebook niet mee kan lezen.
M.a.w.:
Het probleem ligt bij de tracking van je complete browser gedrag. Toegang tot je berichten is nergens voor nodig. Ik bedoel, als dat wel zo zou zijn dan kon Google al jarenlang geen grip krijgen op wat de interesses van mensen zijn omdat ze geen (daadwerkelijk gebruikte

) Messenger hebben. Toch krijgen ze dat als je geen stappen onderneemt heel erg eng accuraat voor elkaar, puur op je browser geschiedenis. Het is voor Facebook noch Google interessant om jou gesprekjes over het avondeten of je sportactiviteiten of wat dan ook te volgen. Dat levert zo weinig op, dat het schermen met end-to-end encryptie en dit werkelijk honoreren veel meer oplevert: namelijk goede marketing en de illusie dat Facebook, Google, etc. nauwelijks data van je verzamelen. Ergens is dat mooi, want als je jezelf wél beschermt maak je wel mooi gebruik van encrypted messaging: maar ze kunnen nauwelijks iets van je verzamelen. Maar het relatief kleine percentage dat dat doet...? Dat zal Facebook, Google, Microsoft, et cetera echt compleet aan hun derriere oxideren.
Oh ik snap trouwens dat je FB niet wilt gebruiken hoor, daar niet van.
Het gaat mij echt puur even om het inhoudelijke stukje waarom end-to-end encryptie ongedaan maken niets zou opleveren voor Facebook, maar wel een heel groot stukje PR en goodwill (hoe gemaakt ook) compleet sloopt. Het lijkt me dus verschrikkelijk stug dat ze dat gaan doen gezien het meer problemen oplevert dan dat het ze bruikbare informatie oplevert.