Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 39 reacties

De EFF pleit ervoor dat browserbouwers de privacy van hun gebruikers beter gaan beschermen. Uit een EFF-onderzoek blijkt dat 84 procent van de surfers een unieke 'handtekening' heeft, mede door het gebruik van javascript.

De Electronic Frontier Foundation opende in januari Panopticlick, een website die onder andere met behulp van http-requests en javascript diverse gegevens van de gebruikte browser opvraagt. Tot die data behoren de OS-versie, de geïnstalleerde plug-ins, de schermresolutie en de tijdzone. Via Flash kan ook een lijst met beschikbare lettertypen worden gegenereerd. Deze gegevens werden op anonieme basis met behulp van een algoritme vergeleken met die van andere bezoekers, waardoor vastgesteld zou kunnen worden of een internetgebruiker 'uniek' is.

Uit de resultaten van circa één miljoen bezoekers zou blijken dat 84 procent van hen over een unieke 'handtekening' beschikt. Gebruikers die Flash of Java in de browser draaien, zouden zelfs in 94 procent van de gevallen individueel te herkennen zijn. Alleen gebruikers die javascript geheel uitschakelen, TorButton hebben ingeschakeld, gekloonde images op veelal zakelijke systemen draaien of de mobiele browsers van iPhone- en Android-toestellen gebruiken, zouden de dans kunnen ontspringen.

De methode die de EFF gebruikt, is - naast de beruchte en breed toegepaste cookie - allerminst nieuw. De organisatie stelt dan ook dat het met zijn onderzoek wil waarschuwen voor meer geavanceerde fingerprinting-systemen, die al op het web zouden worden gebruikt. Om het privacyprobleem in te perken, pleit de EFF bij politici voor strengere regels rondom het tijdelijk opslaan van informatie die tot een persoon is te herleiden. Daarnaast stelt de organisatie dat browserbouwers minder informatie moeten 'weggeven'. Daarbij doelt de EFF vooral op gegevens die via javascript zijn op te vragen.

Gerelateerde content

Alle gerelateerde content (25)
Moderatie-faq Wijzig weergave

Reacties (39)

Daarnaast stelt de organisatie dat browserbouwers minder informatie moeten 'weggeven'. Daarbij doelt de EFF vooral op gegevens die via javascript zijn op te vragen.
Maar deze gegevens zijn ook vrij generiek in veel gevallen. Schermresolutie is daar een van. Dat is wel handig voor de statistieken (als webdevver wil ik weten hoeveel mensen er bepaalde resoluties gebruiken, zodat ik kan zorgen dat iedereen m'n website op een fatsoenlijke manier kan zien), maar het kan je ook uniek maken. Die test kwam er bij mij uniek uit, waarschijnlijk alleen al door de resolutie die ik draai (2560*1600) die komt namelijk bijna niet voor. .
Zo zijn er nog talloze andere dingen (useragents etc) die nuttig te gebruiken zijn voor webdevvers (als statistiek, of daadwerkelijk in een website/webapplicatie), als die allemaal uitgeschakeld worden in komende browsers zal dat denk ik nog best een aardige bult werk op gaan leveren om het dan allemaal goed werkend te krijgen. Niet dat al deze informatie nu echt op een nette manier werkt (browser fullscreen gooien bijv), maar zo zijn er nog vast tientallen dingen waar ik nu even niet aan denk.

Wat ik me afvraag is in hoeverre deze informatie betrouwbaar genoeg is. Ik zelf werk met een aantal configs. Mijn desktop is een 64b WinVista, met 2560*1600 als primaire monitor, mijn notebookje is een 32b WinVista met 1366*786 als resolutie. Er staat verschillende software op, daarmee verschillende fonts en mijn browserinstellingen zijn ook nog eens afwijkend (omdat de notebook ook op m'n werk gebruikt wordt om op te devven, dus daar staan de nodige debugtools op bijvoorbeeld). Echter, deze zijn wel beide van mij persoonlijk, dus zouden aan mijn profiel te koppelen zijn.
Met zoveel variabelen die totaal niet vastliggen lijkt het mij zeer moeilijk om hier een beeld van te vormen dat betrouwbaar is en ook betrouwbaar blijft. Op het moment dat ik photoshop installeer of een nieuwe monitor koop (met andere reso dan ik had) dan klopt het al niet meer. Hetzelfde als ik er een browserupdate tegenaangooi of misschien m'n OS een keertje upgraden. Als enkel punt in tijd kan ik daar misschien wel zinnige data uithalen, maar hoe ga ik de veranderingen daarvan bijhouden? Dat is bijna niet te doen omdat je dingen gewoon niet zeker kunt weten.

Ik denk eerlijk gezegd dat we niet eens zo heel bang hoeven te zijn dat de privacy in het geding is, puur op basis van instellingen die we op ons systeem hebben gedaan, waar niet direct persoonlijke data uit op te halen is.

[Reactie gewijzigd door TERW_DAN op 18 mei 2010 14:58]

Je kunt zien welke schermresolutie ik heb, maar niet op welke afmeting ik mijn browser heb staan. Je weet dus eigenlijk nog niets.

En toch verbind je er blijkbaar conclusies aan en geef je mij hoogstwaarschijnlijk ook geen gelegenheid om die informatie te corrigeren.

Dus wat wil je nou? Eerst zeggen dat het handig is om er gebruik van te maken voor een specifiek persoon en toch ook zeggen dat je er niet op kunt vertrouwen dat het correct is...

En daar zit nu precies het hele gevaar: onbetrouwbare gegevens worden massaal gebruikt.
Dus wat wil je nou? Eerst zeggen dat het handig is om er gebruik van te maken voor een specifiek persoon en toch ook zeggen dat je er niet op kunt vertrouwen dat het correct is...
Wat ik zeg. Een boel functies en dingen die je via JS kan vinden KUN je nuttig gebruiken. Een useragent string is bijvoorbeeld handig. Om even een concreet voorbeeld te pakken een project waar ik mee bezig ben geweest. Daarbij had ik 1 webpagina die zowel op een normale PC moest werken, maar ook op een STB. Door middel van een specifieke useragentstring kan ik zien of ik wel of niet met een STB te maken heb, en zodra ik met die STB te maken heb een bepaalde API inladen die ik nodig heb om allerlei functies uit te voeren (heel simpel, een afstandsbediening gebruiken).

Weten wat voor schermresolutie je draait is ook zinnig om te weten in dit geval. Op het moment dat ik bezig ben een streamingvideodienst op te zetten dan is het zinnig om te kijken op wat voor monitoren het publiek werkt. Als je ziet dat minder dan 2% gebruik maakt van een monitor die fullHDcapable is (http://w3counter.com/globalstats.php), dan kun je je afvragen of het zin heeft om streams al in fullHD aan te gaan bieden, of dat 720P volstaat, omdat de mensen die het verschil op een fullscreen video tussen een 1080 en een 720 filmpje zien dus maar 2% is. Dat is informatie die ik nuttig kan gebruiken.

Wat ik ook zeg, is dat op basis van de dingen die hier meegenomen worden (waaronder useragent strings, plugins en resolutie) niet betrouwbaar zijn. Als ik nu een nieuwe plugin installeer, dan verandert mijn 'fingerprint'. Update ik mijn browser, dan verandert die ook. De gegevens waar je iets op baseert zijn veel te bewerkelijk om hier een profiel van op te stellen.
Deze gegevens zijn echter prima te gebruiken om te bepalen hoe je iets nu aan een gebruiker wil voorschotelen. Als ik aan een useragent zie dat die niet op een STB werkt, dan hoef ik geen API's te gaan laden die specifiek voor die STB geschreven zijn, op het moment dat jij gewoon achter een PC zit.

Dat zijn 2 verschillende manieren waarop er met die gegevens gewerkt kan worden. Daarom kan ik me goed voorstellen dat er beperkingen komen als browsers geen van dit soort info meer doorgeven, met bepaalde checks die ik doe.
Ik denk eerlijk gezegd dat we niet eens zo heel bang hoeven te zijn dat de privacy in het geding is, puur op basis van instellingen die we op ons systeem hebben gedaan, waar niet direct persoonlijke data uit op te halen is.
Ik ben het hier niet helemaal mee eens er zijn veel meer zaken op te vragen die het wel degeleijk mogelijk maken om meer informatie over een gebruiker op te halen dan een scherm resolutie, vooral als de UAC van Vista en Win7 zijn uitgeschakeld of als er onder XP onder een (default) administrator account de browser wordt gedraaid (onder andere via de Scripting host objects).

Daarnaast word hier waarschijnlijk gedoelt op het feit dat mensen die achter een NAT zitten op een gezamelijk IP adres niet eenduidig zijn te identificeren, dit is echter in combinatie met de hier genoemde installatie informatie wel mogelijk.
Dit is misschien inderdaad beter voor de privacy, maar ook voor het tegengaan van criminele internetactiviteiten zoals spammen en hacken en dergelijke.
Ik denk dat deze unieke handtekeningen niet schadelijk zijn, ze geven handige informatie waarmee meer moet worden gedaan. Zolang er geen foto met achternaam en adres van de gebruiker beschikbaar is vind ik dat er niets mis mee is om een gebruiker te herkennen.
stel.. even in theorie dan ..ik maak een reclamebanner en die draai ik op allerhande sites... of dat nou tweakers.net of een porno site is.. doet er niet toe.

Nu krijg ik via die banner - met dank aan de javascript, flash, etc. - zoveel gegevens door dat ik er enigszins best een profiel van kan bakken, die dan ook nog enigszins uniek te herleiden zou kunnen zijn.

Geen probleem, zeg jij, er hangt immers geen foto en naam e.d. aan.

Maar nu laat ik die reclame ook in de rotatie gaan facebook, hyves, myspace.. dat soort sites.

Nu kan ik het toch al 'unieke' profiel koppelen aan mijn statistieken van die sites. Ik zoek het passende profiel op in die statistieken, en ik merk op dat er binnen die statistieken toch wel heel vaak de impression page het adres bvz . hyves . nl is.

De rest laat ik aan je fantasie over.
De rest laat ik persoonlijk aan adblock plus over. Blokkeren van alle banners, ad-domeinen en statistieksites ed. Verder het blokkeren alles dat maar enigsinds naar google riekt in de hosts file. Gmail via pop3 downloaden.

Daarmee heb ik nog niet de handtekening via flash of js scripts geblokkeerd zoals in artikel beschreven, maar daar ga ik zeker ook nog wat op vinden.
Die cookies en javascript zitten natuurlijk niet alleen in de banners, maar ook gewoon verwerkt in de sites zelf.
De eigenaar van een website wil ook graag weten wie er allemaal komen kijken ;)
in dat geval kun je ook het ip adres gebruiken. Elke pc komt namelijk voor 90% van de tijd altijd vanaf dezelfde locatie met.... hetzelfde ip..
behalve zakelijke gebruikers, die gaan meestal via een proxy via 1 ip adres naar buiten.

laten we de ip adressen (en zeker de ipv6 adressen) dus ook maar afschaffen...
Maar PC is niet hetzelfde als gebruiker natuurlijk.
Ik, mijn vader, mijn moeder en mijn broertje zitten allemaal op hetzelfde IP. Maar ik heb ook een IP op m'n werk waar ik precies dezelfde websites bedoek.
Daarnaast heb je ook nog eens mobiel internet, waarbij je ook meerdere IPs zult gebruiken waarschijnlijk.
Dus je hebt zowel meerdere gebruikers per IP, maar ook meerdere IPs per gebruiker.
90% per dag ?
ik heb elke dag 2 ip-adressen, een thuis een 1 op het werk.
Die op het werk is idd static, maar gedeeld met honderden anderen.
die thuis is elke dag anders.

en zo hou ik het ook graag.
Klopt, maar ik heb geen hyves/msn dingen waar mijn naam o.i.d. online van staat. Maar in geval van anderen zou dat wel een wat intimidert gevoel zijn.
Jouw naam en foto zeggen een buitenlandse website ws. ook weinig. Je moet het zo zien: je kunt worden herkent als die surfer die belangstelling heeft voor XX, af en toe YY koopt, een profiel by ZZ heeft enz.
Denk je dat er ook maar iemand geinteresseerd is in een naam?? Nee hoor, ze willen weten wat jij voor iemand bent en (dus) hoeveel geld je te besteden hebt, niet hoe je heet of hoe je er uit ziet.

Niet alleen je naam en pasfoto, maar alle informatie die jou (redelijk) uniek identificeert zijn persoonsgegevens.
Het gaat er om dat ze jou herkennen, niet om of ze dat doen op basis van je naam of op basis van een verzameling browserproperties.

En nu is het maar hopen dat ze ook de juiste conclusies verbinden aan de gegevens die ze zonder jouw medeweten over jou verzamelen. Jij hebt er nl geen inzage in en je kunt het al helemaal niet corrigeren indien het fout is.
:D Ik heb een unieke vingerafdruk. Ben ik tenminste nog ergens uniek in.

De belangrijkste / meest unieke gegevens zijn de Browser Plugin Details en de System Fonts in mijn geval. Dat laatste zal bij veel mensen veel generieker zijn denk ik, aangezien de meeste mensen geen nieuwe fonts zullen installeren (noch van de mogelijkheid daartoe zullen weten).

Valt overigens nog wel op dat er een redelijk significante hoeveelheid mensen cookies uit hebben staan.
Ik heb javascript uitstaan ( via noscript ) en dat heeft als gevolg dat ook veel testen niet werken. Noscript geeft ook een wat rustiger web, omdat allerlei ads die schreeuwen er niet doorheen komen. (zonder meteen de noodzaak van adblockers te gaan draaien, wat de sites die je bezoekt inkomten onhoudt)
Hele goede tip! Heb hem gelijk geinstalleerd.
Ik hou er niet van dat dit soort info door alle sites te lezen is. Gaat ze niets aan wat ik draai of geinstalleerd heb.
Je hebt helemaal geen unieke vingerafdruk. Een vingerafdruk is maar 1op 10000 uniek, dus in Nederland lopen al ongeveer 1600 mensen rond met dezelfde vingerafdruk als jij. (Er even vanuit gegaan dat je jezelf niet net gesneden hebt oid, maar een normale vingerafdruk hebt.)

Uniek genoeg dus om je uit de ploitie-lineup met 5 verdachten te pikken, maar niet genoeg om een gevonden vingerafdruk even door de nederlandse vingerafdrukkendatabase te halen en de dader van zijn bed te kunnen lichten. (15:99 op 1600 dat ze de verkeerde hebben)

Maar daarmee is je vingerafdruk nog wel net iets unieker dan 94%, maar 'slechts' 99,94%.

En fonts installeer je ook ongemerkt als je programma's installeert. Of verwijderd. Ik denk dat het nog wel eens tegen zou kunnen vallen om 2 mensen te vinden met dezeflde verzameling fonts op hun PC.
Tsja, je kan aan de hand van mijn plugins en browserversie een identificatie maken. Als ik echter mijn software update verandert die combinatie. Hoe makkelijk kan men hierop anticiperen?

[Reactie gewijzigd door RSpliet op 18 mei 2010 14:35]

Makkelijk. Je kunt sowieso binnen één browsersessie iemand identificeren, met deze techniek blijkbaar over meerdere websites. En dat is genoeg om iemand in de gaten te houden en een profiel op te stellen.

Sterker nog, dat doet (of probeert) een website waar ik mee werk ook te doen. Door de voorkeuren van een gebruiker in de gaten te houden kunnen we advertenties beter targeten op die persoon. Als iemand bijvoorbeeld vaak op 'Opel' zoekt kunnen we meer reclame daarvoor laten zien. Om maar een voorbeeld te noemen.

Is natuurlijk wel een hele klus om al die informatie om te zetten naar iets nuttigs. Google heeft het natuurlijk al geperfectioneerd.
door bv gebruik te maken van de combinatie met een cookie, en je browser-identificatie te koppelen aan en site waar je vaker op inlogt...


Op die manier kun je dus ook soms wisselende browserprofielen of lichte fluctuaties ondervangen, zolang deze persoon maar soms ook ingelogd is op een aan zijn persoon te koppelen account..

hét gevaar hierbij is natuurlijk is dat je als gebruiker dénkt door uit te loggen, of nog rigoureuzer de betreffende cookie te verwijderen je opeens 'anoniem' bent...
echter, juist door daarnaast personen te traceren op hun browserprofiel kun je ook uitgelogde mensen (en die hun cookies vferwijderd hebben) nog prima blijven traceren, als die andere websites/domeinen bezoeken
Iedere keer dat ik op test me druk ben ik uniek, klopt de test dan wel want ik zou de tweede en opvolgende keren dus niet uniek meer moeten zijn toch? Of mis ik iets?
Hij knoopt die prut vast ook nog aan IP, juist om de statistieken kloppend te houden. Ik zou het vanavond thuis eens moeten testen, zelfde notebook, ander IP. Als hij IP ook meeneemt in het al dan niet uniek zijn dan zal ik ook thuis uniek zijn, als hij dat niet doet, dan zou het erop neer moeten komen dat ik niet meer uniek ben.
Hij onthoudt aan de hand van een cookie dat je al geweest bent. Als je je Cookie verwijderd gaat hij zeggen dat je iets minder uniek bent. (Is een tijdje geleden dat ik ben wezen kijken, dus weet niet meer zeker).

Hij geeft ook per hoofdstuk aan hoe uniek je bent. 1/zoveel hebben dezelfde schermresolutie, 1/zoveel hebben dezelfde fonts. Je kan dus zien dat je uniekheid zich voornamelijk uit in 2 of 3 hoofdstukken. En dat is niet je schermresolutie.
Een terugkerende bezoeker als een terugkerende bezoeker identificeren is natuurlijk geen privacy schending. Dat je browser gegevens over PC (resolutie, fonts) kan uploaden natuurlijk wel.
Het wordt al enger wanneer je site A bezoekt en dan op site B herkent wordt. Dit tracken van bezoekers over sites gebeurt heel veel, met name door adverteerders.

Vandaar dat veel mensen dan ook Javascript en cookies blokkeren van 3rd-parties, dat wil dus zeggen, die niet gekoppeld zijn aan het domein dat ze op dat moment bezoeken.
Zolang die site dat voor zichzelf houdt niet nee. Maar het wordt natuurlijk anders wanneer ik je ouders ga vertellen dat jij op mijn (prono-)site geweest bent.

Natuurlijk mag een bank je banksaldo bijhouden en dat aan jou koppelen. maar het wordt anders wanneer dat ze dat ook aan je supermarkt gaan doorgeven.

Gevens die specifiek bij jou horen, zijn persoonsgegevens en moeten vertrouwelijk behandeld worden. Jij hoort degene te zijn die bepaalt wat er wel en niet mee mag gebeuren, jij hoort degene te zijn die weet wat er over jou bekend is, zodat je dat bijvoorbeeld kan corrigeren als het fout is.

Maar je weet niet wat ze allemaal over je verzamelen, of dat correct is, of de conclusies die er aan verbonden worden correct zijn en wat ze er verder mee doen... want dat doen ze stiekem. En ze verkopen het nog door ook. Of ze gaan er onvoorzichtig mee om, of het lekt op een andere manier uit.
En voor dat je het weet denkt iedereen alles over je te weten.
Goed, idee maar laten we gelijk ook tracking cookies verbieden en zaken als Google Ads, waar duidelijk gegevens van de surfer gebruikt worden. Ik weet dat het zogenaamd prettiger is om gerichte reclame te krijgen. Maar toch krijg ik liever ook onzinnige reclame, dat betekend dat ik minder geneigd ben om ongemerkt toch in te gaan om een domme reclame (iedereen wordt uiteindelijk beinvloed door reclame).
Hij zegt dat ik uniek ben, maar ik vraag me af hoe 'waar' dat kan zijn. Ik denk dat ik, zoals alle Nederlandse gebruikers met dit model MacBook (graag geen mac/pc discussie) gewoon up to date draai met de normale system fonts, en met de meest gangbare plugins, zoals Flash en Silverlight. Kan me niet voorstellen dat ik daarin nou zo uniek ben. En als ik volgende keer de site bezoek met Chrome of Firefox, dan wordt ik dus als andere bezoeker gezien.

Daarmee is meteen dit ook een van de zwakheden denk ik in deze methode. Kan me voorstellen dat "tweakers" wel goed identificeerbaar zijn omdat die meer aan de standaardconfiguratie veranderen, maar de huis tuin en keukengebruikers draaien denk ik voor het overgrote deel een vergelijkbare configuratie. En die gaan deze site niet bezoeken want die weten helemaal niet waar dit over gaat, waardoor de statistieken van deze site totaal niet betrouwbaar zijn. Als ze nu bijvoorbeeld dit soort gegevens bij nu.nl of andere mainstream sites vandaan zouden halen zou het een stuk relevantere resultaten afleveren.
enkel de pure 'default' is dus generiek voor al die specifieke gebruikers met exact hetzelfde model, gekocht in precies dezelfde taalzone, echter als je een specifieke security update heb gedraait, veranderd ook je HTTP-requestheader al, evenals het installeren en upo-to-date houden van je systeem..
met het installeren van extra programma's veranderddt snel je HTTP_ACCEPT-header. (bv ook als je MS office installeert)

ook als je lichte afwijkingen hebt in je timezone, of je scherminstelling kan al gedlen als je 'unieke' waarde....
zoals gezegt, mensen die een puur default systeem gebruiken (van en veel gebruikte default install), via een Ghost-disk bv, kunnen redelijk onherkenbaar blijven..
Ook normaal gebruik an je PC maakt je echter al snel 'uniek'
Je vergist je waar het hier om draait. Het EFF doet hier helemaal geen wetenschappelijk onderzoek en maar zeer beperkte claims naar aanleiding van de cijfers.

Wat ze wel doet is bewustzijn creeeren. Ik denk dat een groot gedeelte van de Tweakers van de helft van die dingen nog niet eens wist dat je browser dat allemaal doorgeeft, laat staan dat ze zich realiseerden dat bedrijven dit (kunnen) gebruiken om ze te tracken. Dat is het belang van dit onderzoek.

Je kunt het op zijn hoogst voor jezelf beperkte impact hebben (niet veel mensen lijken te hechten aan hun privacy op het web), maar het privacy-issue gaat zeker niet weg door het te negeren.
1 miljoen unieke systemen laag? zolang de groep maar representatief is (en dat is niet zo moeilijk bij deze test) is dat meer dan genoeg.
Is het niet beter om het web te browsen in een virtuele linux images onder windows/mac of linux?
Ik vraag me wel eens af wat precies het nut is van die javascript functies die even alle browserplugins doorsturen. Vooral bij het opvragen van alle systeemfonts via javascript heb ik zo mijn twijfels. Ik kan geen enkele legitieme usecase voor die functie verzinnen. Net zoals de user agent string. Wat doet in vredes naam .Net daarin. Browsernaam en versie zou wat mij betreft voldoende moeten zijn.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True