Manjaro Linux wil telemetrie gaan verzamelen met eigen analyticstool

Manjaro Linux wil experimenteren met het verzamelen van telemetrie. De ontwikkelaars van de distro vragen gebruikers zich aan te melden voor een test van een zelfontworpen data-analysetool. Die moet in de toekomst opt-out worden.

De ontwikkelaars van Manjaro kondigden de wijzigingen eerder deze maand aan in een blogpost. Na kritiek van gebruikers zeggen de ontwikkelaars nu verder na te denken over vervolgstappen. Het plan is om een eigen analyticstool genaamd Manjaro Data Donor of MDD in de Linux-distro te plaatsen. Daarmee willen de makers meten hoeveel gebruikers de distro hebben. Ook verzamelt de tool hardware- en systeemgegevens.

MDD verzamelt geen IP-adressen, benadrukken de ontwikkelaars in een GitHub-repo. Ook worden unieke identifiers gehasht. De data wordt op een later tijdstip via Grafana beschikbaar gemaakt. In de praktijk bestaat MDD uit een Python-script, dat de ontwikkelaars in de toekomst standaard aan systemd willen toevoegen. De feature wordt vanaf dan opt-out.

De makers van de distro zijn nu op zoek naar testers voor de tool. Op het moment probeert Manjaro nog via Matomo uit te zoeken hoeveel gebruikers het heeft. Matomo is een gratis en opensource beschikbare analyticstool, die Tweakers vorig jaar testte. Matomo is echter voornamelijk bedoeld voor websites, zeggen de Manjaro-ontwikkelaars. Dat had bovendien veel nadelen, zoals het feit dat het zwaar was om te draaien. Bovendien wilden de ontwikkelaars niet op een thirdpartyontwikkelaar vertrouwen om IP-adressen te maskeren, wat Matomo wel doet.

Door Tijs Hofmans

Nieuwscoördinator

13-11-2024 • 17:45

51

Reacties (51)

51
51
26
8
1
21
Wijzig sortering
Waarom houden ze het niet bij een opt-in tijdens installatie in plaats van een opt-out?
Gezien alle ophef rondom het verzamelen van data/telemetry door bijvoorbeeld Microsoft, Apple maar ook Ubuntu lijkt me dat een nettere manier om feedback te vragen van je gebruikers.
Ik zit in het Manjaro team, ik werk zelf aan de immutable en gaming edition maar ben ook actief in de discussie en testing rondom mdd. We zijn we zelf ook nog niet over uit hoe we dit precies gaan implementeren, dit is enkel een test, al snappen media en de gemeenschap dit vaak niet en wordt het gerapporteerd alsof alles al vast staat.

Een van de dingen die we op het oog hebben is een binaire vraag in Calameres, dan moet de gebruiker expliciet ja of nee zeggen. Dan zouden hopelijk meer mensen kiezen om gegevens te delen.

Een andere alternatief is om Pamac de gebruiker lastig te laten vallen totdat men een keuze maakt.

De redenering om het opt-out te maken is dat de data een enorme bias heeft wanneer het opt-in is, dit zal de data vrijwel waardeloos maken. Refereer bijvoorbeeld naar de KDE telemetry, dit project is volledig mislukt omdat ze maar weinig data verzamelden en deze data zit zo vol met bias dat het niet representatief is voor het merendeel van de gebruikers.

Het probleem met de telemetrie van Microsoft enz. is dat het te ver gaat, het is niet enkel technische data maar ook persoonsgegevens om een persoonlijk marketingprofiel te bouwen. Wij verzamelen enkel geanonimiseerde technische data.

[Reactie gewijzigd door Omega op 13 november 2024 18:39]

Ik zit in het Manjaro team, (...) We zijn we zelf ook nog niet over uit hoe we dit precies gaan implementeren, dit is enkel een test, al snappen media en de gemeenschap dit vaak niet en wordt het gerapporteerd alsof alles al vast staat.
Eh ja, het is de schuld van iedereen behalve jullie 7(8)7

Wat dacht je ervan om het gewoon NIET te doen?

Hoeveel machines er op Manjaro staat lijkt me makkelijk te achterhalen met de logs van jullie Pacman-repositories.

Met telemetrie ga je hoe dan ook een vertekend beeld krijgen, of het opt-in is of opt-out.
Wij kunnen niet achterhalen hoeveel gebruikers er zitten op Manjaro via de repos, dit is omdat veel gebruikers op door de gemeenschap beheerde mirrors zitten en niet de primaire repos.

Wij doen op dit moment al een telling door middel van een ping dat NetworkManager uitvoert, maar dit achten wij als onbetrouwbaar.

Het doel van de data is om onze (zwaar gelimiteerde) middelen efficiënter te benutten. Waarom zouden wij bijvoorbeeld oude Nvidia drivers blijven ondersteunen als 95% van de gebruikers uit zichzelf snel upgraden naar nieuwe releases? Ik noem Nvidia expliciet, want die zooi werkt nooit goed.
Wij kunnen niet achterhalen hoeveel gebruikers er zitten op Manjaro via de repos, dit is omdat veel gebruikers op door de gemeenschap beheerde mirrors zitten en niet de primaire repos.
Je zou ze kunnen verplichten om die data door te spelen.
Wij doen op dit moment al een telling door middel van een ping dat NetworkManager uitvoert, maar dit achten wij als onbetrouwbaar.
Dat is eigenlijk ook telemetrie. Waarom blijven jullie ermee doorgaan als jullie het onbetrouwbaar achten?
Het doel van de data is om onze (zwaar gelimiteerde) middelen efficiënter te benutten. Waarom zouden wij bijvoorbeeld oude Nvidia drivers blijven ondersteunen als 95% van de gebruikers uit zichzelf snel upgraden naar nieuwe releases? Ik noem Nvidia expliciet, want die zooi werkt nooit goed.
Als het om zoiets gaat, lijkt mij dat een poll op het forum net zo goed zal werken. (Maar dan moeten jullie de forum software niet voor de zoveelste keer om zeep helpen O-) )
Degenen die dan gaan steigeren als (oude) NVIDIA support ten einde komt hadden maar op het forum moeten zijn. En eraan geloven gaan ze toch wel.

[Reactie gewijzigd door RoestVrijStaal op 13 november 2024 20:25]

[...]
Je zou ze kunnen verplichten om die data door te spelen.
Mirrors zijn vrijwel zero-maintenance, als wij dit soort eisen gaan stellen aan de mirrors dan zullen veel simpelweg stoppen. Ze dragen graag bij aan projecten door bandbreedte te doneren, maar willen daar ook zelf zo min mogelijk werk aan hebben.
[...]
Dat is eigenlijk ook telemetrie. Waarom blijven jullie ermee doorgaan als jullie het onbetrouwbaar achten?
Enkel de ping-methode is onbetrouwbaar, de voornaamste reden is dat meerdere machines achter een enkele NAT als een enkele machine worden geteld.
[...]
Als het om zoiets gaat, lijkt mij dat een poll op het forum net zo goed zal werken. (Maar dan moeten jullie de forum software niet voor de zoveelste keer om zeep helpen O-) )
Degenen die dan gaan steigeren als (oude) NVIDIA support ten einde komt hadden maar op het forum moeten zijn. En eraan geloven gaan ze toch wel.
Op fora zitten enkel actieve communityleden, dit zijn voornamelijk powerusers die actief aan het project meewerken. De oom/tante die Manjaro draait omdat het nichtje zo lief was om het voor hun te installeren die vinden we hier niet. Dus dit is weer een hele biased sample.

Daarnaast gaan mensen vaak niet in op onderwerpen die niet belangrijk zijn, zodra het stoppen/verminderen van de ondersteuning voor iets wordt besproken krijg je voornamelijk mensen voor wie dit wel relevant is in de discussie.
Dan is het toch veel handiger om telemetrie gegevens van die mirrors op te vragen? Is ook veel overzichtelijker dan van al je gebruikers data te moeten ziften.
Als je zwaar gelimiteerde middelen hebt dan kun je ook gewoon zonder telemetrie-gegevens besluiten om keuzes te maken op basis wat aannemelijk is of een beroep doen op de beheerders van de mirrors om download data te delen.

Zo is het aannemelijk dat gebruikers die de keuze willen hebben tussen zowel oudere als nieuwe Nvidia drivers een kleine groep is die prima in staat zijn om zonder hulp van Manjaro oudere versies te kunnen blijven gebruiken. Als een verandering door velen als ongewenst wordt gezien zal de gemeenschap daar zelf over kunnen beginnen.
Zo is het aannemelijk dat gebruikers die de keuze willen hebben tussen zowel oudere als nieuwe Nvidia drivers een kleine groep is die prima in staat zijn om zonder hulp van Manjaro oudere versies te kunnen blijven gebruiken. Als een verandering door velen als ongewenst wordt gezien zal de gemeenschap daar zelf over kunnen beginnen.
Op dat vlak begrijp ik @Omega ook wel.

Als ze gaan berichten dat (oude) NVIDIA niet meer ondersteund gaat worden, krijgen ze een vocale minderheid op hun dak en dat maakt het leven ook niet leuk.

"Fijner" is om het af te laten hangen van een derde partij. Zoals bijvoorbeeld dat met de ondersteuning van fysieke 32-bit x86 is gebeurd. Arch besloot daarmee op te houden, dus voor Manjaro was het makkelijker om ook de ondersteuning te stoppen dan de last voor een minderheid te dragen.
Misschien zouden ontwikkelaars zich moeten onthouden van uitspraken als "die zooi werk nooit goed". Het geeft enkel je eigen frustratie aan én ook al noem je het expliciet het is niet perse waar dit over gaat.
Zoals de meeste mensen binnen de open source ben ik enkel een vrijwilliger, ik heb geen contract of zakelijke relatie met Manjaro of andere derde partijen. Ik ben volledig vrij om voor mijn mening uit te komen, het is tevens mijn mening en niet die van de Manjaro gemeenschap of GmbH.

De eisen die wij stellen qua softwarekwaliteit binnen de open source zijn hoog, Nvidia specifiek met hun gesloten driver heeft heel veel extra aandacht nodig en is een zeer grote bron van issues. Mocht bij een grote updateronde een systeem aan het crashen of locken zijn dan kijken we al snel naar de Nvidia driver, deze is meestal de boosdoener.

Wij proberen softwarekwaliteit te bevorderen, en daar hoort vocaal zijn over issues bij. Nvidia is bewust van de problemen, maar dat interesseert ze maar weinig, hun focus ligt helemaal op compute, workloads die geen plaatje op het scherm hoeven te tonen, zodra er wel een plaatje op het scherm moet komen is het al snel trammelant.

Om deze reden raad ik altijd sterk Intel of AMD aan, deze hebben dit soort problemen niet, dit werkt over het algemeen gewoon.

[Reactie gewijzigd door Omega op 14 november 2024 17:33]

In werkelijk het grootste deel van de tekst waar ik op reageerde heb je het over wij, manjaro en het wel of niet ondersteunen van iets. Ik blijf het onhandig vinden om daar als laatste nog een ongenuanceerde persoonlijke mening aan te plakken.
Grappig detail: ik werk al ruim twee jaar met Manjaro en Nvidia en heb er letterlijk geen enkel probleem mee. Niet met games en ook niet met de productietools die ik gebruik.
Je wilt dus data over je users. Maar als users je zeggen dat je een fout maakt met "opt out" wordt dat genegeerd.

Ook zeg je dat jullie het niet weten, maar de post op Manjaro zegt gewoon dit:
With this systemd service later in place, sending the hardware data with MDD will be opt-out because I believe, if you do opt-in, the data you gather will be so heavily skewed you can just leave it be.
Wat dus niet zegt dat jullie het nog niet weten maar dat jullie al een keuze hebben gemaakt.

Die binaire keuze sta ik wel achter, maar misschien moet je eens bij je team horen om dát te verkondigen inplaats van wat ze nu verkondigen :)
Niks wordt genegeerd. Wij vroegen om feedback, en zoals ik in de reactie boven al aangaf, veel mensen snappen niet helemaal wat dit precies inhoudt.

De feedback die we kregen is min of meer wat we hadden verwacht, maar het heeft de discussie aangewakkerd en mensen zijn met ideeën en alternatieven gekomen.
Wat dus niet zegt dat jullie het nog niet weten maar dat jullie al een keuze hebben gemaakt.

Die binaire keuze sta ik wel achter, maar misschien moet je eens bij je team horen om dát te verkondigen inplaats van wat ze nu verkondigen :)
De keuze is nog niet gemaakt, dat was enkel het idee dat deze ontwikkelaar op dat moment voor ogen had. Gebaseerd op de feedback is dit plan onder revisie.
Veel mensen weten zeker en vast wat het inhoud. En nog steeds zeggen mensen dat ze geen opt out willen.

Verder is die post van het forum letterlijk overgenomen. De post lijkt op een aankondiging en zegt dat de keuze al gemaakt is. Dat jij hier extra informatie wilt geven is mooi. Maar die informatie komt niet overeen met wat iedereen beziet als een officiele aankondiging.
Verplichte telemetrie in Windows is 1 van de redenen waarom ik juist Linux zou willen gebruiken en dan komt er ook dit soort ongein op Linux.

Hier zit ik (en een hoop anderen) echt niet op te wachten. Wat spijtig is, want Manjaro is best een aardige distributie. Maar als er echt opt out telemetrie komt, kijk ik iig verder naar andere distributies.
Het is ook niet verplicht, er is een volledige opt-out mogelijk en er zal expliciet om worden gevraagd. Het enige dat je niet zal kunnen uitschakelen is de telling, maar deze doen wij op dit moment al, enkel dat dit nu door middel van een ping dat wordt uitgevoerd door NetworkManager.
Ben zelf geen fan van telemetrie in het algemeen. Het is een datahark fuik. Opt out zal ook enorme bias geven, want je gaat dan juist de power users missen.
Hoeveel power users zijn er nou, werkelijk?
Een percentage die niet boven 10% uit zou komen, mits je "for the masses" als doel hebt...
Ja Linux is veel hoger qua power users, maar dat wil men juist niet meer... toch?
Onder de gebruikers van manjaro? Waarschijnlijk best veel
Ik vermoed zelf dat dit een miniem percentage betreft, de meeste gebruikers volgen niet actief de ontwikkeling en zullen niet eens weten dat dit speelt.
Denk je dat werkelijk? Of bedoel je dan specifiek "power users van Linux" in plaats van "power users van PCs"? Ik ken namelijk helemaal niemand die een Linux distributie gebruikt op hun laptop/desktop buiten degenen die ik al power user beschouw. Nu ken ik ook een handjevol Linux power users, maar opereren wel weer op een heel ander niveau en dat is al helemaal een niche. Die gebruiken overigens ook geen Manjaro.
Die mis je andersom ook. Bij opt-out krijg je van een bredere gebruikersgroep data, dus minder bias dan bij opt-in.
Dat kun je niet zo stellen. Dat hangt van veel factoren af.
Ik snap de voorkeur die je als ontwikkelaar kunt hebben voor een opt-out. Maar ook al zou het daadwerkelijk gaan om pure "geanonimiseerde technische data", dan nog is een opt-out iets waar velen niet gelukkig mee zijn. Het zal ook gebruikers die een opt-in hadden overwogen kunnen doen besluiten om er toch van af te zien en gebruik te maken van de opt-out. Ook zal het de opvattingen over het team die daarachter zit negatief beïnvloeden, en dat terwijl weinigen moeite hebben met een opt-in, behalve diegenen die principieel iets tegen telemetrie-verzameling hebben. Ik zou toch een andere manier zoeken om toch iets te doen aan de onwenselijke bias van een opt-in.
zolang je data verzameld dat anoniem is zal een linux gebruiker er geen bezwaar tegen hebben. wil je echter weten wat de leeftijden zijn of woon/werk plekken, dan kan je beter kiezen voor een optin. dergelijke gradaties moet je ook altijd duidelijk van elkaar scheiden en goed communiceren.

groot deel van linux installaties worden echter gebruikt als server, dus dan heb je met meerdere gebruikers te maken (ook als desktop versie, denk maar aan docker apps of nextcloud) , linux desktop gebruikers zijn daarintegen wat beter thuis in werken met eigen login, windows gebruikers zit de zoon of dochter vaak ook op zelfde account in dezelfde app. daar is toestemming vragen dus onmogelijk. je moet dus ook goed toestemming weer kunnen intrekken, wissen van cookies zou de verzamende data in de hele verwerkingstraject bijvoorbeeld moeten verwijderen, of als je linux herinstalleerd.

kortom telemetrie is wettelijk nog 1 grote puinhoop.

[Reactie gewijzigd door bbstreams op 13 november 2024 20:37]

Ik snap jullie uitgangspunt maar ook jullie struggle hiermee. Dat is met jouw uitleg een helder verhaal. Het probleem is, wat je ook wel merkt aan de reacties, is dat het woord telemetrie en opt-in/out natuurlijk een hele vieze smaak heeft bij veel tech users. Met name dankzij giganten als MS, Apple, Google etcetera. Het probleem met telemetrie is dat wij als eindgebruikers op die manier eigenlijk niet/nooit kunnen zien wat er om te beginnen gedeeld wordt danwel wat er mee gedaan wordt. Anoniem of niet.

Al moet ik ook erkennen, ik zit ook op het Google EN het MS ecosysteem. Die vergaren ook een data maar dat is veelal zonder opt-out.
Ik snap de behoefte om data en de gedachte om zo min mogelijk persoonsgegevens te verzamelen waardeer ik. Ik zou wel adviseren om, voor zover Europese wetgeving van toepassing is, rekening houden met ePrivacy. In Nederland is dat vertaald in artikel 11.7a Tw of de "cookiewet" (bah! Zijn geen cookies. Laat je niet misleiden door de slechte naam.).

Ik krijg de kriebels als ik steeds meer opensource projecten zie experimenteren met telemetrie op een manier die duidelijk onrechtmatig is.
>De redenering om het opt-out te maken is dat de data een enorme bias heeft wanneer het opt-in is, dit zal de data vrijwel waardeloos maken
Jullie weten dat als de gebruiker een duidelijke, transparante keuze word gegeven, dat deze er dan meestal voor zal kiezen om telemetrie uit te zetten, maar omdat dat jullie niet goed uit komt, maken jullie maar de keuze voor de gebruiker? Snap je dat je daarmee rechtstreeks tegen de belangen van de gebruiker in gaat?

Dit hele gebeuren speelde zich een tijdje geleden ook af in Fedora, en werd (terecht) toen ook met de grond gelijk gemaakt. Opt-out omdat te weinig mensen van een opt-in gebruik zullen maken valt niet goed te praten. Je weet gewoon dat je je gebruikers aan het naaien bent.
Het gebrek aan spyware in Linux was net een reden om over te stappen naar Linux, en nu wordt dat hier ook al ingevoerd, en moet de gebruiker maar gaan uitzoeken hoe die spyware er kan uitgegooid worden.
Spijtig dat Linux distro's ook beginnen mee te doen aan de big brother is watching maatschappij.
Ik ben zelf geen Linux gebruiker. Maar waar het hier over gaat, dat vind ik ronduit schokkend. Waar je op internet ook naar deze materie zoekt, overal is het onder de streep: Als niet wilt dat je bespioneerd wordt, gebruik dan geen Windows, Macos, e.d., maar gebruik een Linux-distro. En nu blijkt dat je met dat OS net zo goed bespioneerd wordt. En dan kun je wel zeggen dat het "niet zo erg" is als hoe Microsoft dat doet, maar ondertussen gebeurt het dus. En als gebruiker heb je geen inzicht in wat je nu wel of niet ontfutseld wordt. Iedereen kan wel roepen dat ze alleen technische data ophalen, maar hoe kan ik controleren of er niettemin ook persoonlijke data meegaan? Techbedrijven op hun blauwe ogen geloven is hetzelfde als beweren dat je niet nat wordt als je in het water springt.
Nou ja, één lichtpuntje. Ik kan nu met een gerust hart bij mijn Macos blijven, en mij de moeite en ergernissen besparen om een nieuw OS te moeten doorgronden. Want Linux is en blijft voor de gemiddelde beginner nog steeds een lastige uitdaging.
Zover ik begrijp hoewel zeker niet altijd nuttig zou ik kde's metrics niet nutteloos noemen: http://blog.davidedmundso...s-in-kde-are-they-useful/

Niet alle data hoeft reprensatief te zijn om nuttig te zijn, belangrijkste is dat je data verzameld waar je echt wat aan hebt en deze ook gebruikt.
Jammer dat Ubuntu/amazon hier steeds weer als voorbeeld de kop op steekt. Dat was zowat 10 jaar terug voor het laatst... Ofzo, maar blijft blijkbaar steken als je t niet zelf gebruikt?
Edit: Niet specifiek als reactie op @Dograver , maar zie het in deze thread en elders nog geregeld opduiken. Begrijpelijk en ook verwonderend omdat we alweer zoveel jaren verder zijn

[Reactie gewijzigd door Uchy op 13 november 2024 18:31]

Het internet heeft een lang geheugen en de open source gemeenschap koestert lang een wrok. Ik ben met je eens dat het bizar is dat dit iedere keer weer wordt opgerakeld, want zoals ik hier uitleg viel het allemaal wel mee. Alleen is een opt-out nooit zo netjes.
Omdat ze willen dat mensen het gebruiken en te veel moeite vinden om het uit te zetten.
Omdat je met telemetry de bulk van je users wil bereiken. De tijd dat Linux voornamelijk gebruikt werdt door devs die de moeite namen bugreports te schrijven als er iets misging ligt achter ons. Tegenwoordig heb je te maken met gebruikers die als er iets mis gaat "4 uur werk kwijt!!! XYZ is bagger!!!!" en maar die nooit zullen doorgeven waarom het misging.

Telemetry is zo ongeveer de enige manier om bugs op te sporen die niet in het nieuws komen, zeker als ze hardware specifiek zijn.
Ah net als Ubuntu, dit keer zal het wel goed gaan. lol
Dat was toch een overeenkomst met Amazon of zo, dat ging wel wat verder?
Is dit anders dan wat Debian ook al jaren vraagt met de 'popularity contest' tijdens installatie, dat is dan wel opt-in.
Ja dat werd een grote rel, omdat je lokale zoekopdrachten naar Amazon gestuurd werd zonder wat te zeggen.
Niet helemaal. Zoekopdrachten in de Dash van Unity (wat destijds de standaard desktop omgeving was op Ubuntu) werden naar servers van Canonical gestuurd en vanuit daar geanonimiseerd doorgestuurd naar Amazon. Het was zeker niet netjes dat het een opt-out was, maar lang niet zo privacyschendend als sommige mensen het over doen/deden komen.
Maakt het zoveel uit dat het via Canonical ging?
De huis, tuin en keuken gebruiker wist het niet en het was compleet onnodig.
Onnodig was het zeker want het betrof Amazon shopping resultaten en ik moet de eerste persoon nog tegenkomen die in het equivalent van het "start menu" van zijn desktop omgeving op zoek gaat naar producten. Canonical is echter lang niet zo'n datahongerig bedrijf als Amazon dus dat Canonical de verzoeken afving en geanonimiseerd doorstuurde maakt voor iedereen met verstand van zaken wel degelijk uit. Dat het een opt-out betrof was natuurlijk nog steeds niet fraai en hun imago heeft daarmee ook wel een flinke deuk opgelopen.
Hun imago heeft zeker een deuk opgelopen, ik ging toen ook naar mint, geen spijt.
Zolang het maar uit kan. ;)
Volgens de info op het officiële telegram kanaal van Fedora, wordt het bij Fedora een opt-in. Dus technisch 'kan' het je het niet uitzetten, zolang deze optie niet is ingeschakeld. Als in, hoe kun je iets uit zetten, dat al uit staat? Of je wilt het uitzetten zelf uitzetten... :+
Als het opt-in is heb ik er geen probleem mee, het vervelende alleen is dat men het meestal opt-out doen omdat anders niemand er gebruik van maakt.
Het is/wordt opt-in bij Fedora, omdat anders een vrij grote/belangrijke groep binnen het Fedora core team een telemetrie vrije/opt-in fork van Fedora zouden opzetten... Althans zo werd het gebracht in de officiële telegram kanaal van Fedora.
Heel begrijpelijk dat op die manier gedaan wordt, ik ben meer van de mint variant. ;)
Zoiets als opt-out naar gebruikers pushen vindt ik tamelijk onrespectvol, en ik ben blijkbaar niet alleen met deze mening.
Als je op het Manjaro forum naar de poll hierover kijkt, zie je dat er een overgrote meerderheid voor opt-in gestemd heeft ipv opt-out.
Voor de volledigheid, er zijn wel nog niet veel stemmen uitgebracht.

Hopelijk luisteren de ontwikkelaars naar de gebruikers, en voeren ze niet hun natte big data droom van gegevensverzameling uit, tegen de wil van de gebruikers.

Op dit item kan niet meer gereageerd worden.