Help Tweakers om privacyvriendelijke Google Analytics-alternatieven te testen

Voor een artikel over privacyvriendelijke Google Analytics-alternatieven hebben we jullie hulp nodig. We hebben zoveel mogelijk bezoekers nodig op een testwebsite, vanuit alle kanten van Nederland en met verschillende OS'en, useragents en apparaten, en op verschillende momenten.

Zoals je misschien weet, is Google Analytics op zijn retour. Waar je vroeger ieder hobbydomeintje nog heel snel kon voorzien van een werkende Google Analytics-integratie om je bezoekersverkeer te meten, heb je inmiddels veel meer keus. Googles trackingtool ligt steeds meer onder vuur van Europese toezichthouders. In Oostenrijk, Noorwegen en Frankrijk hebben privacyautoriteiten al gezegd dat het gebruik van Analytics in strijd is met de AVG. In Nederland waarschuwt de Autoriteit Persoonsgegevens daarvoor, maar die heeft nog geen definitieve conclusie getrokken. De kans lijkt echter groot dat Google Analytics hier straks ook niet meer gebruikt mag worden.

Wat zijn dan je opties? Stel dat je een hobby- of semiprofessionele website hebt, en je wilt weten waar je verkeer vandaan komt en wie je bezoekers zijn. Hoe meet je dat dan? Inmiddels zijn er tientallen alternatieven voor Google Analytics. Veel daarvan gaan er prat op privacyvriendelijk te zijn. Reden genoeg voor Tweakers om er eens een paar onder de loep te nemen, met jullie hulp.

Wat hebben we nodig?

Om de tools te vergelijken, kijken we uiteraard naar de privacyvoorwaarden en beschrijven we wat de tools op papier kunnen en hoeveel ze kosten. We willen ze echter ook in de praktijk testen. Dat hebben we gedaan door een simpele website te registreren, daar WordPress op te installeren en vervolgens vier analyticstools op te zetten. We willen jullie vragen die website te bezoeken. Zo krijgen we te zien hoe die tools in real time werken, welke informatie ze verzamelen (of juist niet) en hoe dat eruitziet. Die gegevens en de screenshots gebruiken we in het artikel. Als er toch identificeerbare informatie bij zit, halen we die er uiteraard zelf uit voor publicatie.

Ga naar www.tweakersanalyticstestsite.nl om te helpen met deze test.

Het enige dat je hoeft te doen, is de site bezoeken en wat rondklikken naar andere pagina's. Je kunt dat precies doen zoals je zelf wilt: op je desktop of juist op mobiel, vanuit Firefox, Chrome of Internet Explorer 6.0, in de middag om 13.37 uur of om 3 uur 's nachts, al dan niet van achter een vpn. Hoe meer verschillende databronnen we hebben, hoe diverser het artikel is.

We testen voor dit artikel de vier onderstaande tools. Mocht je daarvan het privacybeleid willen lezen, dan kan dat hier:

De website wordt gehost bij Strato en bestaat uit een paar simpele HTML-pagina's met wat CSS. We testen de tools niet voor diensten zoals mobiele apps of in games, maar alleen voor websites. Het gaat om een redactioneel artikel en heeft dus niets te maken met Tweakers' eigen analyticstools.

Alvast bedankt voor alle hulp. We slaan alvast wat extra serverruimte in om de Tweakers-hug-of-death te voorkomen.

Door Tijs Hofmans

Nieuwscoördinator

07-08-2023 • 15:30

86

Reacties (86)

86
86
36
5
0
35
Wijzig sortering
Door gebruik van Google Fonts komt gevoelige data nog altijd ongewenst bij Google terecht.
Veel websites hebben het gebruik van Google Analytics omgeschreven in hun privacyvoorwaarden, dat de verzamelde data niet door Google gebruikt mag worden. Maar daarnaast dan wel andere diensten van Google op de site gebruiken, zodat Google zonder problemen al deze data toch nog kan verzamelen.
Het is gewoon treurig dat je standaard 'alles van derden' blokkeren (ook hier op Tweakers) moet inschakelen, anders weet je simpelweg niet meer waar jouw data/persoonsgegevens blijft/blijven.
Google zegt de data van Google Fonts niet voor profielen of advertenties te gebruiken.
"When I embed Google Fonts in my website via the Google Fonts Web API, what data does Google receive from my website visitors?
When end users visit a website that embeds Google Fonts, their browsers send HTTP requests to the Google Fonts Web API. The Google Fonts Web API serves the Google Fonts Cascading Style Sheets (CSS) and subsequently the font files specified in the CSS to the users. Such HTTP requests include (1) the IP address used by the respective user to access the Internet, (2) the requested URL on the Google server, and (3) HTTP headers including the user agent describing the website visitors’ Internet browser and operating system versions as well as the referer (i.e. the webpage on which the Google font is to be displayed).

For clarity, Google does not use any information collected by Google Fonts to create profiles of end users or for targeted advertising."
Bron: https://developers.google.com/fonts/faq/privacy

Maar het levert ze indirect wel een hoop informatie op al die sites die Google Fonts gebruiken.
For clarity, Google does not use any information collected by Google Fonts to create profiles of end users or for targeted advertising
1. Don't explain where you don't use is for, explain where you use it for
2. Sure

Ik snap niet dat een developer hieraan meewerkt
Ik weet niet hoe letterlijk je dit moet nemen, maar hoe zit het met het verrijken van bestaande profielen? Oftewel, er wordt niet een profiel gemaakt, maar wat als je er al een hebt (zoals ongeveer 99% van de internetgebruikers)?
Profielen zijn alleen interessant als die actueel zijn. Als analytics minder info geeft, gaan ze op zoek naar andere manieren.

Maar dat is ook precies mijn probleem. Er wordt van alles verzameld, maar niet uitgelegd wat daarmee gebeurd.

En why the hell zou je remote fonts willen gebruiken? Bij mijn browsers staat het in ieder geval uit en uBlock houdt het ook tegen.
Omdat dat zo makkelijk copy-paste van stack overflow / documentatie.
Volgens mij valt het met Google fonts wwl mee, al twijfel ik er niet aan dat daar ook ergens een addertje onder het gras zit. Maar goed, je kan de fonts ook gewoon downloaden en op de eigen website hosten.

Een veelgebruikte Google dienst die wel gebruikt wordt om je te tracken is Google reCaptcha.
Gebruikt op vele miljoenen websites.
Als je dan op zo'n website een formulier wil invullen (kan ook een poll of ecommerce bestelling zijn), MOET je instemmen met de voorwaarden van Google om het formulier te kunnen sturen.
Volgens mij is het zo, dat als je in je browser een actief Google account hebt, je al automatisch toestemming verleend.
Een duidelijke uitleg over wat via reCaptcha uit je gevist wordt vond ik hier:
https://complianz.io/goog...gdpr-a-possible-conflict/

Gelukkig is hier recentelijk een gratis en gebruik(er)svriendelijker alternatief voor:
Cloudflare Turnstile

Niet alleen wordt er gegarandeerd dat er geen data geharvest wordt, het werkt ook fijner.
https://www.cloudflare.com/products/turnstile/
500 years on CAPTCHAs

Humans spend about 500 years each day solving CAPTCHAs - wasting time and creating frustration.
Hehehe, goeie marketing, gezien er in lagelonenlanden (India, China, enz) hele sweatshops zijn waar mensen hele reeksen van captcha's oplossen. Het zal je werk maar zijn maar... dit zorgt dus wel voor een hoger gebruik van.
moet ik hierbij zaken als Ublock of firefox eigen iinbegrepen maatregelen tegen tracking uitzeten?
AuteurTijsZonderH Nieuwscoördinator @atthias7 augustus 2023 15:41
Dat is altijd afhankelijk van of ze deze tools blocken, dat verschilt volgens mij. Beste is om dat wel te doen ja.
Ik zal dit juist niet doen (ik maak nooit uitzonderingen) wellicht wel een goede test om te zien wat er door komt.

Ik heb hier uBlock Origin, de ingebouwde bescherming van Firefox en meestal ook nog pihole erbij :P

[Reactie gewijzigd door GekkePrutser op 23 juli 2024 17:51]

AuteurTijsZonderH Nieuwscoördinator @GekkePrutser7 augustus 2023 15:51
Klik maar, kijken we wat er gebeurt!
Bij mij waren 2 van de trackers geblokkeerd door privacy badger en de de rest in ublock origin.
Raar genoeg is dus de enige die me op die site nog tracked Google, want die tracken de data als je Google fonts gebruikt (en die laten deze tools blijkbaar wel door)
Om deze reden moet je Google ook vermelden in je privacy policy als third party wanneer je Google fonts op je website gebruikt. Bovendien een goede reden om je fonts zelf te hosten!
Heb je het 'Block remote fonts' vinkje aanstaan?
duidelijk ublock vangt bij mij alle door jullie gelinkte tools als zijnde blocked

zal voor jullie tet dus een uitzondering maken
Jullie lijken plausible niet helemaal correct geconfigureerd te hebben, afhankelijk van hoe je wilt testen. Plausible heeft namelijk een proxy-functionaliteit, waarbij al het verkeer door je eigen domein gaat en dus niet geblokkeerd wordt. Volgens ublock en de netwerk-debugger gebruiken jullie echter wel het standaard script bestand dat geblokkeerd wordt. Het zou net interessant zijn om te zien hoeveel verkeer men "mist" door adblockers maar toch geregistreerd wordt door een dergelijke proxy-oplossing.

Zie Stap 2 in https://plausible.io/docs/proxy/guides/wordpress
Je zou zeggen dat als die tools echt privacy vriendelijk zijn, ze niet door Ublock, pi-hole etc. geblockt zullen worden.

Ik zal de test site eens bezoeken met FF (en alle toeters en bellen aan) en Edge (zonder privacy toevoegingen) met in beide gevallen de pi-hole temporary disabled. Wellicht zijn er dan leuke verschillen te zien
Ze kunnen niet privacyvriendelijk zijn, ze kunnen alleen minder privacyonvriendelijk zijn. Tracken = tracken, of dat nou door Google gebeurt of door een self-hosted optie.

Je zou zelfs kunnen stellen dat tools als Matomo minder privacyvriendelijk zijn. Bij Google Analytics gaat al je data een grote bak in, Google gebruikt het alleen om grote statistieken te verwerken en Tweakers zelf krijgt inzicht in gesamplede data. Matomo gebruikt geen data sampling, daar kan Tweakers (indien correct ingesteld) je username intikken en exact zien wat jij zelf hebt gedaan op de website, per bezoek.

Ik zeg niet dat Tweakers het zo gaat gebruiken, maar het is in ieder geval niet zwart-wit, en als tools als uBlock Origin en Pi-hole die niet blocken dan doen ze hun werk niet.
Je zou zelfs kunnen stellen dat tools als Matomo minder privacyvriendelijk zijn. Bij Google Analytics gaat al je data een grote bak in, Google gebruikt het alleen om grote statistieken te verwerken en Tweakers zelf krijgt inzicht in gesamplede data.
...hoe precies is het privacy vriendelijker als Google zelf alleen weet wat het allemaal registreert en Tweakers de subset krijgt die Google verkoopt? Dan ga je er al van uit dat Google transparant is over wat het doet met data, terwijl we inmiddels (hopelijk) toch wel verstandiger zijn geworden dan dat.
Maar zowel Tweakers als Google zijn 'gewoon een bedrijf'. Dat Google in theorie directe toegang tot de rauwe data heeft lijkt me logisch, maar er staat gewoon in de overeenkomst wat ze met welke data mogen doen, net zoals dat bij Tweakers het geval is.
Ik hoop dat we inmiddels wel verstandiger zijn geworden dan doen alsof Google de enige partij is waarvan we niet willen dat die onze data verzamelt.
Ik hoop dat we inmiddels wel verstandiger zijn geworden dan doen alsof Google de enige partij is waarvan we niet willen dat die onze data verzamelt.
Dan ontgaat me alsnog de reden om 'self hosted' in die lijst te zetten? Als je voor trackingvrij opteert dan sta ik daar helemaal achter, maar dat idee krijg ik niet als je stelt dat Google misschien wel beter voor privacy is omdat ze een geloofwaardiger verhaal hebben - ook al komt dat neer op 'just trust me bro'.
Wat ik zeg is dat een trackingtool die data sampling gebruikt altijd beter is voor privacy dan een die dat niet doet. Wat Google op de achtergrond met de data doet zien we niet, maar dat zien we bij Tweakers ook niet.

Ik zeg nergens dat Google altijd beter is voor privacy, alleen dat in deze vergelijking Google Analytics een stuk minder persoonlijke privacygevoelige data opslaat dan bijv. Matomo.
Ik zeg nergens dat Google altijd beter is voor privacy, alleen dat in deze vergelijking Google Analytics een stuk minder persoonlijke privacygevoelige data opslaat dan bijv. Matomo.
En dat is dus niet te stellen, ik mag er voor het gemak vanuitgaan dat je nog nooit de broncode van die services hebt gezien.

Ook weten we dat Google geen directe belangen heeft bij Tweakers maar wel de data die ze verzamelt. Mocht Tweakers zelf analytics gaan hosten, dan is de kans dat die data bewust verkeerd word gebruikt weer kleiner.
Achja, als je niet wil lezen wat ik zeg dan moet je het helemaal zelf weten. Je hebt het weer over hele andere dingen dan ik, zo ga ik geen discussie voeren. Fijne avond verder :)
crisp Senior Developer @Oon7 augustus 2023 21:04
Matomo gebruikt geen data sampling, daar kan Tweakers (indien correct ingesteld) je username intikken en exact zien wat jij zelf hebt gedaan op de website, per bezoek.
Maar de vraag is dan: mag dat wel onder de AVG zonder consent? Dergelijke zaken moet je dan namelijk wel goed kunnen beargumenteren, en de gebruiker daarvan op de hoogte stellen.

Op Tweakers gebruiken we ook serverside-analytics (snowplow), maar dat wordt niet op userbasis verwerkt.
Ik denk inderdaad dat dat zeker niet zomaar mag, helemaal niet als 'zelfs Google Analytics' niet is toegestaan. Google heeft immers ook de optie om je data binnen de EU te houden, lijkt mij dat de zekerheid dát iemand de data per persoon/sessie kan inzien (ipv de onzekerheid over wat er mee gebeurt) het niet minder risicovol maakt.
Interessant @TijsZonderH ! Zijn jullie ook van plan de resultaten bekend te maken? Op Tweakers zitten ook een hoop webontwikkelaars zoals ik en ik ben zeer benieuwd naar de resultaten. Met name een vergelijking in data. Welke data mist er bijvoorbeeld? Welke data komt niet overeen tussen de platformen? Worden bots goed herkend? Dat soort vragen komen dan al snel in mij op. En tot slot, is er een reden om een externe partij / library te gebruiken? Tweaker-devs hebben een aantal oplossingen zelf geschreven (denk aan advertenties), waarom niet iets ontwikkelen voor het analyseren van de website? Simpelgezegd, wat kunnen jullie niet wat een van de genoemde platformen wel kan (niet lullig bedoeld dus, ik denk juist dat het team het namelijk prima kan)?
AuteurTijsZonderH Nieuwscoördinator @Zenomyscus7 augustus 2023 15:48
Zijn jullie ook van plan de resultaten bekend te maken
Welke resultaten bedoel je? Ik wil er een vergelijkend artikel van maken, waarin ik kijk naar wat er met tool X of Y wel kan.
Tweaker-devs hebben een aantal oplossingen zelf geschreven (denk aan advertenties), waarom niet iets ontwikkelen voor het analyseren van de website
Dit artikel komt van de redactie, dat staat los van Tweakers-het-product en wat onze devs ook doen. Daarom wilde ik dit ook extern hosten, zodat ik het best een objectieve situatie voor een gemiddelde tweaker kan nabootsen.
Welke resultaten bedoel je? Ik wil er een vergelijkend artikel van maken, waarin ik kijk naar wat er met tool X of Y wel kan.
Komt er dan eventueel ook een How To-artikel van hoe je ze het beste in kan stellen? Want bijvoorbeeld een Matomo heeft zo te zien wel een gratis variant, maar die moet op je eigen server gehost worden en heeft volgens hun "requires technical knowledge" nodig. Ook zodat het juridisch klopt qua instellingen en niet dat je per ongeluk toch de regels overtreed, dat kunnen jullie bijvoorbeeld bij eigen juridische afdeling laten checken terwijl een normaal persoon dat niet kan.
En aangezien Google Analytics gratis te gebruiken is, wordt het anders beetje lastig om een betaalde variant als alternatief aan te bevelen. Plausible kost namelijk $9 per maand en als het artikel zich echt richt op hobby- of semiprofessionele website vraag ik mij af wie alleen voor analytics $9/m gaat betalen als er mogelijk geen inkomsten tegenover staan.
Plausible is ook gratis als je het zelf host, al kost dat ook weer wat extra als het niet ergens bij kan op een bestaande server en kost het ook weer extra tijd
Echt? Interessant want als ik bij hun naar pricing ga begint het echt met die $9/m optie, terwijl de andere sites ook meteen een gratis variant tonen.
Welke resultaten bedoel je? Ik wil er een vergelijkend artikel van maken, waarin ik kijk naar wat er met tool X of Y wel kan.

Dit artikel komt van de redactie, dat staat los van Tweakers-het-product en wat onze devs ook doen. Daarom wilde ik dit ook extern hosten, zodat ik het best een objectieve situatie voor een gemiddelde tweaker kan nabootsen.
Dat laatste was mij helaas niet duidelijk, maar wat je noemt is precies waar ik benieuwd naar ben. Ik kijk uit naar de resultaten.
Zou het voor de bezoeker ook niet leuk zijn om de resultaten te kunnen bekijken in de verschillende tools? Wel zo transparant. ;)
AuteurTijsZonderH Nieuwscoördinator @Streamert7 augustus 2023 15:40
Ja sommige tools zoals Matomo kunnen dat, maar ik vind het iets te tricky om dat zo te doen. Je zult het moeten doen met de screenshots!
Interessant! Misschien nog wel goed om te weten dat de voornaamste reden voor de blokkades in een aantal landen de doorgifte van persoonsgegevens naar de Verenigde Staten was. Inmiddels is die doorgifte een stuk minder problematisch door het nieuwe Framework dat de EU en VS opgezet hebben.

Het is ook maar erg de vraag of de Nederlandse toezichthouder nog tot een blokkade gaat komen; dit ook omdat die "waarschuwing" al anderhalf jaar oud is.
AuteurTijsZonderH Nieuwscoördinator @Noddahead7 augustus 2023 15:46
Het is ook maar erg de vraag of de Nederlandse toezichthouder nog tot een blokkade gaat komen; dit ook omdat die "waarschuwing" al anderhalf jaar oud is.
Ik vraag ze dit eens in de zoveel maanden, maar krijg altijd hetzelfde 'we kijken nog' antwoord.
Goed initiatief. :) Ik mis alleen wel Simple Analytics in dit lijstje, dat is een Nederlands project! Zie https://www.simpleanalytics.com/nl
Ja inderdaad! Voor de volledigheid is https://usefathom.com/ ook wel een goeie.
Top initiatief, kan het alleen maar toejuichen. Ik klik graag even rond op een paar verschillende devices.
Ik heb jaren geleden GA al vervangen voor Matomo (self hosted), bevalt erg goed!
Nette actie om de community erbij te betrekken!

Goed ook om te zien dat jullie naar betere en potentieel meer privacyvriendelijke alternatieven kijken voor Google, die de laatste jaren toch wel een bedenkelijke reputatie op dit gebied hebben opgebouwd met hun bubbels en datahonger.

Ik kijk met belangstelling uit naar het resulterende artikel.

Om te helpen heb ik alvast vanaf zowel PC, laptop als telefoon de site bezocht met meerdere browsers, en wat rondgeklikt. Zowel met als zonder uBlock Origin.
Brrr, kon de tekst op die testwebsite niet in dezelfde stijl als hier? Het leest erg ongemakkelijk naar mijn zin.
Dat is niet het punt van de test website
Mensen wegjagen dan wel? @TijsZonderH .

[Reactie gewijzigd door PcDealer op 23 juli 2024 17:51]

AuteurTijsZonderH Nieuwscoördinator @PcDealer7 augustus 2023 16:24
Ik heb dozens of minuten in dit werk gestopt, dozens!

Maar serieus, zo erg is het toch niet? En je hoeft er ook geen online Oorlog En Vrede op te lezen he
Jullie zeggen na elke rework van de site dat het ook perfect is en geen aanpassingen nodig zijn. Raad eens, het gebeurt altijd. Nee, ik was snel klaar met de site in deze hoedanigheid.
AuteurTijsZonderH Nieuwscoördinator @PcDealer7 augustus 2023 16:32
Dit websiteje (eigenlijk gewoon vijf html-files in a trenchcoat) heb ik minder dan een half uur in een treinreis in elkaar geklopt. Dit heeft niks met de rest van de website Tweakers te maken dus ik weet niet zo heel goed waar je nou precies op doelt.
Ik denk dat het voor mij zo irritant leest door met name het gebruik van Source Code Pro, een monospaced lettertype in combinatie met de lettergrootte.
Het doel van de site is trackers/analytics tools testen. Niet om een fraaie site neer te zetten.
Dan nog, een ander open web font kiezen kost 0 minuten extra. Source Code Pro is ook al een afwijkende bewuste keuze, en monospaced leest karig voor dingen die geen code zijn.
Het boeit niet wat het font is. Doel was dat men ging klikken, niet om hele artikelen te lezen.

Op dit item kan niet meer gereageerd worden.