Amazon stuurt Duitser na AVG-verzoek stemcommando's van andere gebruiker

Amazon heeft een Duitser na een verzoek om inzage in zijn data per ongeluk de wav-bestanden gestuurd van alle stemcommando's van een vreemde. Het bleek aan de hand van die bestanden te herleiden wie de vreemdeling was.

Het Duitse magazine c't heeft de vreemdeling opgespoord door de audio te beluisteren en hij schrok van de constatering dat de audio van zijn Echo-apparaten was doorgestuurd naar een vreemde. De man had Echo-apparaten in zijn slaapkamer, douche en woonkamer staan. Amazon stuurde naast de wav-bestanden pdf's en bij Amazon ingevoerde zoektermen mee in zip-bestanden.

Volgens Amazon ging het om een eenmalige, menselijke fout. In eerste instantie had het bedrijf alleen de data van de downloadserver verwijderd en kwam er geen reactie. Nadat het magazine de melding gemaakt heeft, heeft Amazon wel contact gezocht met beide klanten met uitleg over het voorval.

Klanten hebben het recht om bij bedrijven inzage te vragen in data van henzelf. Dat is mogelijk door de invoering van privacywetgeving AVG in mei van dit jaar. Veel bedrijven hebben daarop de inzage van data mogelijk gemaakt.

Data Alexa uit inzageverzoek bij Amazon

Door Arnoud Wokke

Redacteur Tweakers

20-12-2018 • 14:02

190

Submitter: himlims_

Reacties (190)

190
181
76
10
0
83
Wijzig sortering
Furthermore, according to the victim (Neil Schmidt) Amazon didn’t contact him either
Amazon is verplicht onder de AVG/GDPR het slachtoffer op de hoogte te stellen van dit lek. Dat gegeven mag toch niet ontbreken in deze samenvatting van Tweakers, lijkt me. Dit verhaal kan mede daardoor namelijk nog een staartje krijgen.

[Reactie gewijzigd door ourari op 25 juli 2024 22:33]

Niet perse. Als de data niet schadelijk is (en dat is een vage term) en het gaat slechts om 1 persoon en 1 set data, ben je als bedrijf niet verplicht om het te melden, ik citeer:
U hoeft een datalek alleen te melden als dit leidt tot een risico voor de rechten en vrijheden van betrokkenen.
Meer info.
Dit is wel een erg eenkennige uitleg van artikel 34, melding aan de betrokkene.

Hoewel een bewoording als hoog risico misschien doet vermoeden dat het een situatie is die zich niet snel zal voordoen zijn er niet snel situaties waarbij er bij het lekken van persoonsgegevens er geen hoog risico is. Er is al een hoog risico als het lek kan leiden tot lichamelijke, materiele of immateriele schade voor de persoon van wie de gegevens zijn gelekt. En aangezien de kans daarop bij een daadwerkelijke inbreuk niet meer hypothetisch is zal een verwerker aantoonbaar moeten kunnen maken waarom het hoge risco niet kan ontstaan of over moeten gaan tot melden.

Vergeet niet dat een datalek meer omvat dan de situatie waarbij duidelijk dat het lek ook misbruikt is. Ook het verlies van gegevens door ransomware valt onder een datalek. In dit geval gaat het echter om een bestaande inbreuk. Een inbreuk waar ook nog eens zeer persoonlijke gegevens gelekt zijn. Gegevens waaruit ook nog een persoon en contact herleidbaar zijn. En een situatie waarbij de gegevens ook nog onbevoegd gebruikt zijn om de persoon te herleiden en contact mee op te nemen. Dat is op zich al genoeg kans op schade, ongeacht de beste bedoelingen van de inbreukplegers. Die intentie kon Amazon namelijk niet voorzien toen deze gegevens onomkeerbaar aan de verkeerde persoon waren verstrekt.
wat is een farce is dat zeg. Dit is natuurlijk altijd uit te leggen in het voordeel van de overtreder. Wetten zijn in beginsel gemaakt om de consument te beschermen. Organisaties als deze (AP) zijn toch juist voor dit soort lekken/overtredingen/dingen opgericht?

Het is allemaal niet zo moeilijk hoor. Lekken = melden.

[Reactie gewijzigd door Ynst2003 op 25 juli 2024 22:33]

Het is allemaal niet zo moeilijk hoor. Lekken = melden.
Okay, dan moeten we bereid zijn om veel meer ambtenaren aan te nemen want overal worden continue fouten gemaakt. Als die allemaal gemeld moeten worden en alle opgevolgd moeten worden heb je een groot bureau nodig. Maar dan moet jij ook melden als iemand in de tram over je schouder een mail meeleest he? Of als je thuis een geprinte mail van een klant laat liggen en er gasten zijn. Dat zijn allemaal lekken van private gegevens nietwaar?

Ik vind de regel dat als er geen gevaar was hoef je het niet te melden prima.
Tuurlijk snap ik dat het allemaal veel complexer ligt. Waar het mij om gaat is dat de 'lekker' mag bepalen of het voor jouw situatie belangrijk is of niet.
Ik vind de regel dat als er geen gevaar was hoef je het niet te melden prima.
Defiinieer 'gevaar'?
Het gaat er om dat een persoon die duidelijk geen toegang zou moeten hebben tot de gegevens, toegang had tot de gegevens.

Toen realityster Barbie in het ziekenhuis lag, hebben meer dan 80 (!!) onbevoegde personen een kijkje genomen in haar patientendossier. Gelukkig heeft men toch wel melding gemaakt van dit lek. Ondanks 'geen gevaar'.
In het geval van Barbie is er wel degelijk een gevaar dat een van de 80 mensen die het dossier heeft ingezien privacy gevoelige data lekt. Volgens de AVG moet je dit melden.

In het geval van Amazon zou je de case kunnen maken dat de data geen privacy gevaar oplevert. Commando's zoals "speel een spel" of "dim het licht" zijn namelijk generiek. De data was daarbij gelekt naar slechts 1 persoon.

De AVG richtlijn omschrijft het als volgt: Je hoeft geen melding te doen aan de autoriteit als "het niet waarschijnlijk is dat de inbreuk in verband met persoonsgegevens een risico inhoudt voor de rechten en vrijheden van natuurlijke personen"
https://autoriteitpersoon...meldplicht_datalekken.pdf
Dank voor de verduidelijking. Ik ben benieuwd naar de interpretatie van de Duitse DPA.
Data Protection Authority
https://ec.europa.eu/info...ction-authorities-dpas_en

In Nederland is dat de Autoriteit Persoonsgegevens.

[Reactie gewijzigd door ourari op 25 juli 2024 22:33]

En die is wel een stuk minder makkelijk als de Autoriteit Persoonsgegevens.
DPA in de context met Dld is een beetje onhandig, omdat het in D staat voor Deutsche Presse Agentur, vandaar de vraag.
Heb je je eigen artikel pagina 25 d gelezen? Ik denk niet dat er hier twijfel mogelijk is
Zou het zelf best schadelijk vinden als andere kunnen zien wat ik zeg in mijn huis/privé omgeving.
Sure. Maar als er niets over adressen, wachtwoorden, betalingsgevens, persoonsgegevens staat, wat is dan de echte 'schadelijkheid' van de data? Dat iemand hoort dat je naar rare dingen zoekt op internet? Dat doen we allemaal.
We doen ook allemaal bankzaken, toch wil ik niet hebben dat een ander erbij kan.
'een hoop onzin'? Doe een beetje normaal. Ik zeg maar één ding, namelijk dat er een meldplicht is voor lekken. En die bestaat. Iemand anders heeft er al een stuk vriendelijker en constructiever op gewezen dat er nuances bestaan. Je reactie is niet alleen onnodig negatief, maar ook nog eens overbodig.
Die bestaat inderdaad, maar dit lek (waarbij de privacy van 1 individu is geschonden, door een menselijke fout bij Amazon) valt niet binnen de kwalificatie van datalekken die gemeld moeten worden.
Dat ligt helemaal aan wat de data precies behelst. Je kunt niet per se zeggen dat er niet gemeld hoeft te worden omdat het maar om één persoon gaat.
Het gaat hier ook niet om dusdanig gevoelige informatie dat het wel moet.
Volgens mij ben jij degene die de auteur van het artikel ervan beticht onvolledig te zijn, waarna je het vervolgens zelf bent. Het lijkt me dus goed dat je even gecorrigeerd wordt.

Ik reageerde overigens niet alleen op jou maar ook op diegene die het criterium van 'schadelijke data' uit het niets introduceert (het juiste criterium heb ik hierboven weergegeven) en diegene die het vervolgens heeft over een 'Data Protection Agency' (het is Data Protection Authority).

Er gaan een hoop fabels rond over de AVG en dit is dus hoe ze de wereld in worden geholpen. Vandaar mijn reactie. Het was niet mijn bedoeling om jou persoonlijk aan te vallen en als dat wel zo overkwam dan betreur ik dat.
Volgens mij ben jij degene die de auteur van het artikel ervan beticht onvolledig te zijn, waarna je het vervolgens zelf bent. Het lijkt me dus goed dat je even gecorrigeerd wordt.
Correcties zijn oké. Het ging mij om de manier waarop en de herhaling van zetten.
diegene die het vervolgens heeft over een 'Data Protection Agency' (het is Data Protection Authority).
Dat was ik. Slordigheidsfoutje. Ik linkte wel naar een bron met de correcte en uitgebreidere informatie. Ik heb het aangepast.
Het was niet mijn bedoeling om jou persoonlijk aan te vallen en als dat wel zo overkwam dan betreur ik dat.
Helder. Dank.

[Reactie gewijzigd door ourari op 25 juli 2024 22:33]

Weet nu niet wat er erger is, menselijke fout van verkeerde opgestuurde informatie, of het feit dat dat ding dus werkelijk alles opslaat in wav formaat én blijkbaar gekoppeld aan de persoon zelf.
of het feit dat dat ding dus werkelijk alles opslaat in wav formaat én blijkbaar gekoppeld aan de persoon zelf.
Het ding?
Ik denk eerder dat die wav's van de servers van amazon komen omdat het apparaat gewoon alle commando's doorstuurt.
En die wav's komen uit de lucht vallen?

Die staan dus al ergens opgeslagen. Misschien niet als wavs, maar wel ergens. Net zo goed als dat elk callcenter in Nederland elk gesprek opneemt en dit nooit verwijderd en niet slechts "dit gesprek kan opgenomen worden".
Net zo goed als dat elk callcenter in Nederland elk gesprek opneemt en dit nooit verwijderd en niet slechts "dit gesprek kan opgenomen worden".
Wij nemen lang niet alle gesprekken op, alleen in specifieke gevallen. Bovendien worden deze zonder menselijke interactie automatisch verwijderd na 150 dagen (dit omdat in die gevallen het handig is bewijs te hebben bij eventuele issues, en die issues ontstaan zelden of nooit binnen de paar maanden). Het zou ook al te gek zijn - die 5 maanden nemen 100GB in beslag na compressie. Die ruimte kunnen we net zo goed besteden aan andere doeleinden.

Daarna blijft er alleen een log over (Nummer X belde op nummer Y met agent Z op DD/MM/YY HH:ii:ss nadat hij keuze W heeft gekozen in het keuzemenu).

Verder maken we expliciet melding dat we gesprekken kunnen opnemen, en stellen pro-actief alternatieven voor voor als je je gesprek niet wenst te laten opnemen (e-mail, chat).

Ik neem aan dat er altijd cowboys zijn in de contactcenterwereld die indefinitief alles gewoon opnemen en bewaren, maar om alle contact centers dan zo maar te gaan omschrijven? :+
Ik heb bij best wel wat klantenservices e.d. gewerkt, werk nu ook weer op een servicedesk.

Dusver konden ze allemaal jaren terug, Bosch en Unamic/Xerox/whateverhetnuis bv konden no prob jaren terug, mensen die er lang niet meer werken konden nog nageluisterd worden.

Een gesprek is gemiddeld een kb of 4. 100gb aan gesprekken zijn 2,5miljoen gesprekken.

Er zullen allicht uitzonderingen tussen zitten, zoals bij jou bv. Maar de meeste callcenters loggen gewoon elk gesprek en nemen de moeite niet dit te prunen/op te ruimen.

Uitzonderingen bevestigen de regel ;)
Een gesprek is gemiddeld een kb of 4?

Ik weet niet met welke robotcompressie jij werkt, maar hier zijn gesprekken toch echt gewoon .wav bestanden van 256kB per minuut. Als je dan een gesprek hebt van 20 minuten, dan is dat gewoon 5 megabyte.

100GB, ofwel 102400 MB, zijn dan 20,5k gesprekken... (als ze allemaal 20 minuten duren, er zijn er natuurlijk heel veel die maar een paar minuten duren, maar ook uitschieters richting het uur)

[Reactie gewijzigd door b12e op 25 juli 2024 22:33]

256kb per minuut? Sla je het op in hd kwaliteit?

Meestal slaat men dit enkel met de frequenties van de menselijke stem op. Je denkt nog niet dat het oude analoge telefonie zo veel data verbruikte? We hebben het hier over bytes p/s, niet denderend veel data.
maar hier zijn gesprekken toch echt gewoon .wav bestanden van 256kB per minuut.
Dat is dan best een inefficient systeem.
Je hebt het dan over 8 bits @ 4kHz ofzo (effectief 2kHz audio met vrij veel ruis)?
Je kan dan veel beter in een lossy codec opslaan want dat geeft je en hogere kwaliteit en/of kleinere bestanden.
We zitten vast aan 2 opties:
- ADPCM format 256Kb per minute of recording
- PCM format 1Mb per minute of recording

da's gewoon wat de PBX software die we in gebruik hebben ondersteunt. We kunnen dan zelf wel gaan bestanden converteren om ruimte te besparen, maar dat is dan ook weer niet nodig.
Ooh ja. ADPCM heb je ook nog. :)
Anyhow, de opslag kan dus wel degelijk nog een stuk kleiner, maar dan zul je inderdaad de boel achter de PBX nog moeten comprimeren.
Bij mijn weten is de GSM codec het populairst en die gebruikt hier 6MB per uur. Met Speex kun je daar misschien zo'n 2MB per uur van maken. Kleiner (en toch verstaanbaar) heb ik het nog niet gekregen.

Met GSM kom ik dan op 102.4kB per minuut, met Speex op 34kB per minuut.

Het kan inderdaad wel een stuk kleiner dan wat @b12e doet, maar om op 4kB per gesprek uit te komen moet je erg veel hele korte gesprekken hebben.
Ja, mee eens. Die 4k klinkt redelijk verdacht. :)
Ikzelf heb ook bij heel wat callcenters gewerkt en ik herken me meer in het verhaal van @b12e dan jouw verhaal. Wellicht ben jij de uitzondering?

Bij de +- 10 verschillende projecten (elk project een ander bedrijf) werd ongeveer 10% van de gesprekken opgenomen en 2 weken bewaard. Enkele gesprekken werden langer bewaard, welke voor trainingen werden gebruikt. Ik zie eerlijk gezegd ook het nut niet in, om gesprekken langer te bewaren. Normale medewerkers hebben ook niet de mogelijkheid om dit soort gesprekken terug te luisteren.

Net zo goed als dat elk callcenter in Nederland elk gesprek opneemt en dit nooit verwijderd en niet slechts "dit gesprek kan opgenomen worden".

Dat je met twee berichten +2 voor zulke uitspraken krijgt, zal eerder met de heersende stemming onder Tweakers-gebruikers te maken hebben, dan de correctheid van je statement..
Dan zit ik denk ik in een uitzondering. De servicedesk waar ik voor werk neemt dus wel elk gesprek op.
Hoe lang ze precies bewaard blijven weet ik zo niet. Als ik zou willen dan kan ik elk gesprek dat ik heb gehad in de afgelopen maamd in ieder geval terugluisteren. Heel soms zit er een gesprek tussen dat niet os opgenomen maar dat is dan een fout geweest van het systeem.
en stellen pro-actief alternatieven voor voor als je je gesprek niet wenst te laten opnemen (e-mail, chat).
E-mail en chat kun je ook bewaren. Meld je dat ook ?
Nee dat melden we niet, want dat spreekt voor zich.

Zijn geschreven media en de verzender kan er wel van uit gaan dat dat ergens bewaard wordt. Als iemand mij persoonlijk mailt komt dat ook in mijn gmail archief dat al sinds 2008 aandikt (Gsuite Gmail dan wel).

Daarentegen, als iemand mij belt dan neem ik dat niet op. Je gaat er ook van uit dat dat niet wordt opgenomen.

Als iemand een brief stuurt naar iemand anders is dat toch hetzelfde? Dat wordt misschien ook gearchiveerd in een dossier..

[Reactie gewijzigd door b12e op 25 juli 2024 22:33]

Nee dat melden we niet, want dat spreekt voor zich.
Daarentegen, als iemand mij belt dan neem ik dat niet op. Je gaat er ook van uit dat dat niet wordt opgenomen.
Dat zet mij aan het denken. Het is dus eigenlijk beter het gesprek zelf ook op te nemen om te voorkomen dat iemand A zegt en B doet (of helemaal niks) en ik het kan bewijzen dat A gezegd is.
Dossiers aanleggen en hopen dat ze niet nodig zijn.
Dat is inderdaad geen slecht idee - als consument hebben jij en ik het volste recht om zelf ook een call recorder te installeren.
Dit heb ik eerder gehoord over overheden etc, dat bleek uiteindeljk ook niet waar.
Die chat en email worden ook gefiled dus dat is het onderscheid niet. En dat opslaan is inderdaad handig bij een meningsverschil. Alleen ontstaat er wel rechtsongelijkheid want de consument heeft die info niet, en ook de andere kant worden er wel eens fouten gemaakt. Volledige transparantie zou in dat soort gevallen wel welkom zijn.
Eerlijk?

Ik heb totnogtoe geen bedrijfsnaam genoemd (want: ik wil hier geen reclame maken, ik vertel maar wat ik zie/hoor), maar we gebruiken de opnames alleen maar als de klant iets beweerd en we het niet gelijk geloven of kunnen verifiëren met de collega/adhv beschikbare, geschreven data. Als we inderdaad zelf in de fout zijn gegaan - en dat is bijna altijd zo, klanten zijn door de band genomen eerlijk - dan geven we dat ook toe. Meestal hoeft het zelfs niet zo ver te komen, want wat we telefonisch zeggen wordt quasi altijd nog via e-mail bevestigd en dan is het gelijk duidelijk waar het fout is gelopen. De klant heeft die e-mail, en wij hebben die.

Maar mocht het toch tot een dispuut komen met de klant, die er 100% zeker van is dat wij A hebben gezegd, en wij hebben nageluisterd en er is geen sprake van A, maar wel van B, dan zitten we er ook niet mee in om die opname met de klant te delen. Daar heeft ie gewoon recht op.

We zetten dan ook in op 9+ klantervaring, en als de klant gelijk heeft dan heeft ie gewoon gelijk - dat het nu in ons nadeel is of niet.

[Reactie gewijzigd door b12e op 25 juli 2024 22:33]

Net zo goed als dat elk callcenter in Nederland elk gesprek opneemt en dit nooit verwijderd
De helpdesks waar ik heb gewerkt namen ongeveer 1 op de 50 gesprekken op, voor beoordeling van de callcenter agent en (als het gesprek interessant was voor trainingen) voor trainingsdoeleinden. De opnames kwamen als mp3-files in een directory op een netwerkshare (ingedeeld op callcenter-agent) en als ze niet meer nodig waren werden ze gewoon weer gewist.
Hier worden ze op een server bewaard die enkel toegankelijk is door team leads, inderdaad in mapjes per agent. Het systeem verwijdert ze zelf. Als we ze toch moeten bewaren voor legal issues, dan maken we een kopietje en bewaren we die ergens anders tot het niet meer nodig is, maar da's eerder een uitzondering (nog maar 1 keer voorgevallen sinds ik hier werk).
Amazon bewaard inderdaad de stemcommando's die je hem geeft. Die kun je ook naluisteren in de App
Hoe denk je dat het anders kan werken? Als ik tegen de Echo roep ie de auto moet voorverwarmen moet ie toch weten dat het mijn auto is?

En dat het bewaard word is iets waar je toestemming toe hebt gegeven. Je kan het natuurlijk wel wissen. Doe ik elke paar dagen met de data die Google van me verzameld. Dan werkt het allemaal lang niet zo goed maar wel minder gevoelig. Mijn keuze.
Dat verklaard nog steeds niet waarom het opgeslagen word.
Bij deze uitleg moet er inderdaad opgeslagen worden welke auto van jou is, daar moet je ook toestemming voor geven dat hij deze koppeling maakt.
Maar als eenmaal de voice command omgezet is naar een actie hoeft het voice command toch niet te worden opgeslagen?

Ik snap dat ze dat willen maar is het nodig.
Eensch met alle "I told you so" reacties. Serieus, een apparaat in je huis dat continu monitort wat er gezegd wordt? En dan ook nog eens met het Internet verbonden is? Van een bedrijf dat bijzonder goed is in het verzinnen van zaken om geld aan te verdienen?

Hoe kun je nou in godsnaam denken dat dat iets goeds is! Hoe verschrikkelijk naïef moet je zijn om te denken dat dat niet ooit tot problemen gaat leiden?

Zo even in een paar minuten bedacht: al je nachtelijke escapades worden gemonitord. Als je even flink moeite hebt met schijten staat het op tape. Scheldkanonnade als je afsgeschoten wordt in BFV? Staat erop.
En dan heb ik het er nog niet eens over dat je nooit meer een one night stand mee kunt nemen als ze Alexa heet.
Serieus, een apparaat in je huis dat continu monitort wat er gezegd wordt? En dan ook nog eens met het Internet verbonden is?
U bedoelt een smartphone?
Beetje kort door de bocht antwoord. Je kan prima een smartphone hebben zonder 'always listen' (of hoe je dat zou noemen) functie. Wanneer je een Alexa of dergelijk apparaat koopt doe je dat bewust en weet je dat 'ie mee gaat luisteren.
Nee, zo kort door de bocht is het gewoon. Je smartphone kan ook een always listen device zijn. De home assistents doen niets/slaan niets op totdat het hot word is gezegd.

Als je denkt dat ie tóch mee gaat luisteren of dat het gevoelig is voor hacks dat er tóch mee te luisteren is, is die kans bij een home assistent net zo groot als bij een smartphone.

Heb je al eens nagedacht over je smart tv? De meeste hebben ook een camera en mic. En volgens mij zijn die apparaten veel kwestbaarder.
Kom jij maar eens laten zien hoe je tegen mijn telefoon kan praten dan. Op een smartphone kan je dat prima uitzetten en hem alleen op de 'ouderwetse' manier gebruiken, met je handen (in een normale situatie waarbij je telefoon geen rare malware of backdoors heeft natuurlijk).

Alexa e.d. zijn 100% gemaakt om mee te luisteren zodra je het hotword zegt, en kunnen ook niet anders gebruikt worden, dus je weet al vanaf het begin dat je een apparaat in huis neemt dat gaat luisteren naar wat je zegt.

Hetzelfde voor mijn smart tv: een pracht exemplaar met Netflix en apps, maar toch echt zonder microfoon en camera.

[Reactie gewijzigd door Heedless op 25 juli 2024 22:33]

Wat voor OS draait jouw smart-TV?
Kom op, we hebben het er hier nu niet over of je televisie stiekem mee kan luisteren of iets dergelijks.

Het punt is dat je met Alexa bewust een apparaat in huis haalt waarvan je weet dat het geluidsopnames maakt. Een smartphone waarop de voice assistant totaal uitgeschakeld is doet dit niet.
Dat betekend niet dat hij niet toch stiekem zou kunnen luisteren en die hele discussie, maar als gebruiker heb je dan in elk geval niet willens en wetens een apparaat neergezet dat dit doet.

Dat het ene een apparaat is dat KAN luisteren, en het andere een apparaat dat MOET luisteren is het onderscheid dat ik aan wou geven.
Kom op, we hebben het er hier nu niet over of je televisie stiekem mee kan luisteren of iets dergelijks.
Mooi, dat maakt de discussie nog eenvoudiger namelijk:
Een smartphone waarop de voice assistant totaal uitgeschakeld is doet dit niet.
In feite is dit hetzelfde als nooit het hotword zeggen...

En als je dan wél het hotword gebruikt, weet je dat dat wordt opgeslagen en ga je dus geen gekke dingen zeggen. Maar gewoon commando's of vragen. Niet meteen je het gesprek met je vriendin over leven na de dood.

Als je wilt dat zelfs die simpele commando's niet bewaard worden, kun je deze nog verwijderen.
Van wat ik zie aan de logs staan er ook regels in zonder Alexa. Dus tenzij dat niet het hotword is (en het hotword dus niet in de logs wordt opgenomen), wordt wel degelijk alles gelogd. Wellicht wordt echter niet alles uitgevoerd. Maar, ik baseer mezelf slechts op de screenshot.

[Reactie gewijzigd door RV op 25 juli 2024 22:33]

Kan door de 'Follow-up' mode komen. Als je die aan hebt staan hoef je alleen "Alexa" te zeggen voor je eerste vraag en blijft ze vijf seconden luisteren om te horen of je nog meer zegt.
In een lopende interactie hoef je niet steeds het hotword te herhalen, vandaar die regels.
In feite is dit hetzelfde als nooit het hotword zeggen...
Dat is het helemaal niet!

Als je het uit hebt staan wordt er helemaal niet geluisterd: microfoon is uit.

Als je het aan hebt staan zal de telefoon altijd luisteren, altijd de microfoon aan, en altijd wordt wat er gehoord wordt gescanned, want hoe anders kan hij het hotword horen?

Kortom het hotword is onzin, de telefoon luistert altijd maar gaat pas actie ondernemen bij het horen ervan.
Ok, als je over mijn punt wil blijven lezen kan ik daar verder weinig aan doen :X
Uiteindelijk kom je toch steeds bij hetzelfde punt uit, doet de leverancier van de app of het apparaat wat hij/zij belooft. Of je de spraakerkenning uit zet in een app of de knop 'microfoon uit' indrukt is in feite niets anders dan dat jij een signaal geeft "Niet luisteren a.u.b!". Of de app/apparaat dit ook daadwerkelijk doet bepaalt de fabrikant. Met een Google Home / Alexa haal je inderdaad een apparaat in huis met als specifiek doel altijd te luisteren, maar de spraakdata gaat enkel internet over ná het zeggen van het 'hotword'. Met zo'n apparaat is het kinderspel om te achterhalen of deze vaker dan nodig verbinding maakt. Een smartphone wisselt zo goed als constant op de achtergrond wel ergens gegevens mee uit, dat maakt het al een stuk lastiger. Van de Google Home / Alexa is meerdere malen bewezen dat ze doen wat je er van wil dat ze doen. Gezien het aantal fabrikanten van apps + smartphones lijkt mij dit een groter risico op een backdoor dan bij een smart speaker.
Zie ook de post van sys64738 hieronder. Die permissies worden éénmaal gevraagd, een doorsnee persoon zal niet na ieder gebruik van de app deze weer uitzetten. Neem bijvoorbeeld Shazam, hier kun je de functie 'pop-up Shazam' aanzetten. Dan luistert de app continu naar muziek en stuurt deze snippets continu door naar de Shazam-servers. Wat daar mee gebeurt is in feite hetzelfde als bij de smart speakers, deze gegevens zullen niet langer bewaard blijven dan nodig is voor de dienst. Nu is Shazam inmiddels van Apple, qua privacy een zeer serieus bedrijf. Maar het punt is, dat je Shazam met die functie toestemming geeft om 24/7 data te versturen naar hun servers.

[Reactie gewijzigd door Sanchaz12 op 25 juli 2024 22:33]

Met een Google Home / Alexa haal je inderdaad een apparaat in huis met als specifiek doel altijd te luisteren
Dat is mijn punt ^
Alles er omheen over of bedrijven wel netjes doen wat ze zeggen is een ander onderwerp.
Het apparaat luistert altijd naar het naar het hotword. Verder hoort het helemaal niets. Pas als het het hotword heeft gehoord, gaat het pas écht luisteren.

Maargoed. Het wordt hierboven door meerdere mensen duidelijk en beargumenteerd uitgelegd. Als het enige wat jij kunt zeggen is "Ja maar hij luistert!!!" dan houdt het natuurlijk op.
Ik denk dat eigenlijk het meest kwalijke wat veel (potentiële) gebruikers van dit soort apparaten over het hoofd zien is dat zelfs als alle opnames volkomen geoorloofd zijn en je gebruik van de apparaten niet ongebruikelijk is (oftewel je zet het in voor waar het redelijkerwijs voor bedoeld is) er enorm veel over jouw persoon te achterhalen is vanuit de data die beschikbaar is, door dat te koppelen aan andere publiekelijk beschikbare informatie. Ze hebben niks geks gedaan om de eigenlijke gebruiker te identificeren, te bepalen welke apparaten hij gebruikt op welke plekken in huis en zelfs wie zijn vriendin is. Dat wordt helaas toch nog te vaak met "ach, ik heb niks te verbergen" afgedaan.
Kom op, we hebben het er hier nu niet over of je televisie stiekem mee kan luisteren of iets dergelijks.

https://www.theverge.com/...ments-ios-android-samsung

Waarom zou dat hier niet relevant zijn om te vermelden?
Dat het uit te zetten is, wilt niet zeggen dat het ook daadwerkelijk gebeurd en/of ongedaan kan worden. Het blijft software.
99,9999% van alle smartphone gebruikers hebben wel 1 of meerdere partijen toestemming gegeven via App permissies om geluid op te nemen.

Het enge van deze permissie is dat je (waarschijnlijk) aan hele batterij bedrijven toestemming hebt gegeven. En dat zij je geluid kunnen opnemen zodra en zolang zij dit nodig vinden. Zonder dat jij het merkt en waarvan je geen flauw idee hebt wat al die partijen met je data gaan doen. Scared Yet?!?

Bij Alexa en Google Home, wordt er alleen data naar de server gestuurd zodra je "Hey Google/Alexa" roept. Dit is door meerdere tech-sites en zines uitgezocht.

[Reactie gewijzigd door sys64738 op 25 juli 2024 22:33]

Heb je daar cijfers voor? (oprechte vraag, ben eigenlijk wel benieuwd of iemand een idee heeft van de aantallen. Je 99% is natuurlijk overdreven, maar zullen alsnog behoorlijke aantallen zijn denk ik).

Mijn reactie ging over dat 'je smartphone luistert ook mee!!1!' veel te kort door de bocht is. Er zijn genoeg manieren om je telefoon te gebruiken zonder er tegen te praten, iets wat met Alexa niet kan. Dat betekend niet dat ik denk dat een telefoon niet dezelfde functie kan hebben als een dedicated voice assistant.

Naast dat wij hier op Tweakers zitten en wel beter weten ken ik ook genoeg mensen die niet veel van tech weten en dat soort permissies juist hardnekkig uitzetten. Zal niet het merendeel van de gebruikers zijn, maar er bestaan er genoeg die hier wel een beetje over nadenken (al is het maar omdat ze er niet veel vanaf weten en daardoor extra voorzichtig willen zijn).
Je 99% is natuurlijk overdreven, maar zullen alsnog behoorlijke aantallen zijn denk ik).
Vraagt whatsapp niet standaard voor die toestemming of doet die dat alleen zodra je een audiobericht wil opnemen of wil bellen? Vraagt whatsapp dit standaard dan denk ik dat hij met 99,999% niet zo heel ver van de werkelijkheid vandaan zit.
Ik weet niet zeker waar standaard Android die vraag stelt. Heb het idee dat ik soms bij het installeren van een app al zie wat hij wil, maar krijg ook weleens een popup (microfoon, popup, contacten) op het moment dat een functie daadwerkelijk aangeroepen wordt. Maar dat kan ook deel zijn van privacyguard op Lineage.

Dat je whatsapp toegang geeft tot je microfoon wanneer je er mee wil bellen vind ik nog te begrijpen, dat is dan een keuze die je maakt omdat je die functie wil gebruiken (er van uitgaande dat die toestemming inderdaad pas gegeven hoeft te worden bij het eerste keer bellen, niet bij installeren).

Ik dacht zelf meer aan apps die deze permissies willen hebben zonder dat er een goede reden voor is.
Ik ben meer benieuwd naar de hoeveelheid mensen die "OK" zeggen wanneer hun rekenmachine, zaklamp, random spelletje, etc. toegang wil hebben tot privacy gevoelige opties. Als je ziet hoeveel mensen maar willekeurig op een knop klikken om popups weg te krijgen op hun PC, zonder te lezen wat er stond, dan denk ik dat je alsnog schrikt van de aantallen.

Had laatst een kennis die om de paar minuten opeens fullscreen reclames op het scherm van z'n Android telefoon kreeg. Bleek dat hij zich die ochtend in de trein afvroeg welke kant ze precies opreden en een willekeurige kompas app had gedownload die blijkbaar toegang wou tot... nou, alles op die telefoon eigenlijk... Vroeg zich af waar die reclames opeens vandaan kwamen en was zich van geen kwaad bewust.
Volgens mij vraagt Whatsapp bij de eerste start om alle permissies de app ondersteunt, wieger je deze zal hij er later als je de functie wil gebruiken (locatie opsturen, foto willen maken, voice note sturen) er nog eens om vragen. Als je dan weigert werkt het gewoon niet. Bijna hetzelfde met Messenger van Facebook, regelmatig belt een vriend van mij via Messenger, ik kan dan niet opnemen omdat ik eerst naar de instellingen moet om toegang tot de mic te geven (Messenger vraagt er niet nog eens om).
U bedoelt een smartphone?
Kunnen smartphones spraakopdrachten aan ? Dat wist ik niet.
Blijkbaar niet, want er wordt alleen data verzameld nádat je het codewoord hebt gezegd. Niet zo aanstellen dus.

En tuurlijk kunnen er wel eens dergelijke akkefietjes optreden. Goh, nou, ik heb een PostNL bezorger die het presteert om post voor mij gewoon 3 deuren verder in de bus te flikkeren terwijl mijn huisnummer écht wel goed zichtbaar is. Bij m'n ouders van de week was post aan de andere kant van het dorp bezorgd, andere straat, andere postcode, ander huisnummer, andere naam, maar nee hoor we mikken het gewoon door de bus want PostNL haat klanten.

Om daar nou zo'n heisa over te gaan maken... fouten gebeuren.

[Reactie gewijzigd door DigitalExorcist op 25 juli 2024 22:33]

Blijkbaar niet, want er wordt alleen data verzameld nádat je het codewoord hebt gezegd
Nee, er wordt data verzameld nadat het apparaat dénkt dat je een codewoord hebt gezegd. Tal van voorbeelden waarbij het apparaat denkt dat jij iets gezegd hebt terwijl jij dat niet hebt gezegd.
Dit is inderdaad een belangrijk onderscheid. Hoewel ik hier thuis al die assistenten uit heb staan speel ik er wel altijd even mee als ik wat nieuws binnenkrijg. En dan gebeurt het inderdaad regelmatig, vooral als er flink gekletst wordt of de TV aanstaat, dat die dingen om de haverklap reageren met "ik snap je niet".

Bovendien kunnen wij natuurlijk helemaal niet weten of er behalve het bekende codewoord niet ook andere codewoorden zijn ingeprogrammeerd. Extra codewoorden waarop alleen onzichtbaar wordt gereageerd.

Als ik zie dat mijn Pixel 2 XL zonder Internetverbinding of noemenswaardig processor/batterijverbruik 10.000 liedjes kan herkennen ga je mij niet vertellen dat hij niet ook spraakpartonen op die manier kan herkennen.

Het engste van het hele verhaal is overigens niet wat er nu vandaag precies gebeurd. Wat veel enger is, is dat de discussie telkens een beetje opschuift. Op enig moment gaan we accepteren dat zo'n ding altijd naar patronen op zoek is en vertellen we elkaar dat je niks te vrezen hebt zolang je het woordje "bom" maar niet gebruikt.
Godwin alert: Alles monitoren want ik heb niks te verbergen, zelfs lijsten met welke religie je aanhangt. Dat was heel fijn in 1940-1945 ;)
Ja laatst werd ik voor gek uitgemaakt hier op deze site toen ik zei dat deze dingen spionage zijn.
Dit heeft nu eens heel weinig te maken met dat probleem. Het apparaat is niet gehacked en het doel van het apparaat is net reageren op stemcommando's om interactie met het internet mogelijk te maken. Iemand die dit apparaat in huis haalt weet dus heel goed waaraan hij/zij begint.

En dat het opgenomen wordt als je daarmee akkoord gaat is niet eens het probleem. Niemand buiten een server zal in principe horen wat er allemaal gebeurd.

Dat er dan ineens door een menselijke fout deze data toch bij een verkeerde persoon komt is gewoon ... menselijk. We maken allemaal fouten. Jij kan wel zeggen "I told you so", maar deze mensen willen net gebruik maken van diensten die jij niet wenst. Dan is het nog niet aan jouw om hen daarvoor te gaan veroordelen.
Na dit filmpje te zien heb ik alles (dat was gelukkig enkel een hey siri commando) uitgeschakeld dat voice opneemt. Mensen staan hier helaas niet bij stil bij de aankoop van zo’n voice assistant.

Persoonlijk vind ik dat ze, net als bij sigaretten), op de doos moeten zetten dat dit product ten alle tijde geluid opneemt en ook gebruikt wordt voor advertising.

https://youtu.be/zBnDWSvaQ1I
Je stelling gaat niet op. Smart Assistants zoals Amazon Echo, Google Home, Apple Siri of Microsoft Cortana sturen alleen data door na het wake commando (bijv. OK Google). Je moet dus eerst "OK, Google" zeggen en dan pas gaan schijten om het op te sturen naar Google.
Goh ... en dan vragen mensen zich af waarom er zo "paranoide" gedaan wordt over dit soort systemen.

Maar ... "niks aan het handje hoor mensen. Je moet maar gauw je aluhoedje weer opzetten".
Het ging hier om een menselijke administratieve fout, de AVG functionaliteiten om je privegegevens terug te krijgen van bedrijven vergt namelijk nogal wat. Ik vermoed dat als ik dat bij Tweakers zou opvragen, ik, als er al een ingang voor is, eerder met een stagiair te maken ga krijgen, dan een fancy pancy volledig geautomatiseerd AVG-systeem.

Maar prima, grijp het maar weer aan als angsthazerij voor de speakers an sich.
Het probleem zit hem in het feit dat dergelijke privacygevoelige data zo massaal opgeslagen word. Dan is het gewoon wachten op een (menselijke) fout.

Of wat denk je van Facebook die toegang gaf tot prive data. Dat zou een bedrijf dat dit soort gegevens over jou opslaat ook kunnen doen.

Dat is het probleem met dit soort speakers, er word heel gevoelige data opgeslagen en er is vrijwel geen controle op wie daar bij kan en wat er mee gebeurt.
Juist dat soort GDPR-wetgeving vereist wel degelijk steeds meer die controle. Het an sich opslaan en verwerken van persoonsgegevens zie ik niet als een inherent probleem. Juist die toegang en procedures zijn belangrijk, en worden steeds belangrijker. Tweakers, de overheid, je garagedealer, allemaal hebben ze privacy-gevoelige gegevens van je.
Die controle komt er wel steeds meer maar is in praktijk bijna niet af te dwingen. Heb je ooit bij facebook je gegevens opgevraagd? Dan krijg ej vrijwel niets terug en dan moet je maar geloven dat dat alles is dat ze van je bewaren. Zeker bij grote softwarebedrijven is het ook praktisch onmogelijk om te weten wat ze opslaan zonder daadwerkelijk op hun systemen en in hun code te kijken. Iets wat ze niet snel zullen toelaten.

En bij zaken als tweakers e.d. weet je wat ze voor informatie hebben, namelijk wat je hun zelf geeft. Juist zaken die actief luisteren in je huis weet je gewoon niet van wat ze oppikken.
Tweakers kan ook meer achterhouden net zoals Facebook. Daar zit geen inherent verschil tussen. Wat dat betreft is dat een kwestie van vertrouwen. Heb je die niet bij ze, dan moet je er niet mee in zee gaan.

Het bewijzen van iets wat er niet is is ook niet te doen. Na die rondleiding in hun systemen kan je namelijk altijd opwerpen dat er nog een ander datacentrum kan zijn die je niet hebt gezien. Wat dat betreft is het aan de beweerder om te staven dat ze meer opslaan dan ze je geven.
Het verschil zit hem in de range van data. Facebook tracked over heel veel sites heen en gaat vanuit functionaliteit en doel al om met veel meer persoonlijke data. Tel daarbij whatsapp en messenger op en je snapt wat ik bedoel.

Een dergelijk speaker krijgt gewoon veel meer data van je binnen dan 1 website.
Dat is het probleem met dit soort speakers, er word heel gevoelige data opgeslagen en er is vrijwel geen controle op wie daar bij kan en wat er mee gebeurt.
Ik zit even te kijken naar wat mijn Google Homes hebben gehoord in de laatste dagen maar daar zit niet veel gevoeligs bij. Ik bestuur dingen in huis, vroeg wanneer de langste nacht van het jaar was, speelde wat muziek etc.
Jij noemt het angsthazerij en ik noem het naïef als je zo'n speaker in huis neemt. Dit is nog niet het "i told you so" moment, maar dat komt vanzelf. Een bedrijf vertrouwen dat geld moet verdienen aan de informatie van de gebruikers. Dat voelt voor mij hetzelfde als een inbreker mijn alarm laten aansluiten. Hij zal het vast goed doen, maar altijd de verleiding hebben om er misbruik van te maken.
Eens, ik zie het niet als een drempel, een dergelijke speaker in huis zie ik als een mount everest. Ik begrijp niet hoe achteloos mensen dit aanschaffen en gebruiken en dan nog vragen gaan stellen over privacy.

Aan de andere kant, we hebben allemaal smartphones, wie weet wat daar allemaal getracked en afgeluisterd wordt.
smartphones, wie weet wat daar allemaal getracked en afgeluisterd wordt.
Precies, daarom heb ik er geen. ;)
De mens is ook onderdeel van het systeem. Dat het een menselijke administratieve fout is betekend dat het systeem gefaald heeft. Je zou dan het administratieve proces kunnen verbeteren zodat er minder fouten gemaakt worden, of je kunt bijv. minder data lange termijn opslaan zodat de mogelijkheid tot het maken van fouten verkleind wordt of de impact ervan verkleind wordt.
Kan je me 1 goed argument geven waarom die data bewaard worden?
Relevantie, trainen van stemverbetering, voorkeuren bijhouden. Profielverbetering. Het schokkende van het artikel is eerder de procedurefout van het GDPR-verzoek dan het feit dat dit bedrijf data van je bewaard. Daar stem je volledig mee in, en klant zijn van Amazon is nog niet verplicht bij geboorte.

Heb je je ooit afgevraagd waardoor je bij offline pakketten als Dragon Speech hele boeken moet voorlezen en hij je nog amper verstaat, terwijl je bij Google 3 x Okay Google roept en hij je redelijk goed verstaat, zo goed dat hele YouTube-video's, in in ieder geval Engels, keurig worden vertaald. Dat is allemaal deel van die massaverwerking door het groots verzamelen en analyseren van stemmen.
neen, neen en neen.
Ik geef geen toestemming want ik haal zo'n dingen niet in huis.
ik lees geen boeken voor, ik ken Dragon Speech niet eens.
Ondertiteling in youtube keurig? :?
Een organisatie kan volgens mij prima bedenken hoe ie zijn AI kan verbeteren. Ik vraag me stellig af waarom in clear text opgeslagen moet worden wat er gezegd is, wanneer en de desbetreffende wav is opgeslagen. Zo'n AI kan dat mij inziens ook verwerken en de RAW data verwijderen. En als dat niet direct kan, prima, maar maanden bewaren? Niet logisch vanuit privacy gedachte. Wel handig voor de organisatie.
Verbetering van stemcommando's. Je kunt in de App al aangeven of Alexa de opname goed heeft verstaan en waarnodig corrigeren. Ik doe dan even de assumptie dat Amazon middels algoritmes de opnames opnieuw bekijkt om te kijken of de herkenning dan beter gaat
Bij verschillende bedrijven bij de opzet betrokken geweest en allemaal hadden dedicated afdelingen en mensen met redelijke kennis van het AVG gebeuren. (wil niet zeggen dat het overal is, maar niet dat het overal mat stagiaires te maken hebt :)
Vermoedelijk grotere organisaties? Het MKB is hier in Nederland in elk geval de grootste 'werkgever' :). Maar sinds de waakhond wat tandjes heeft gekregen in de vorm van daadwerkelijke handhaving zal op termijn dit ook meer moeten gaan leven bij kleinere organisaties.
Vermoedelijk grotere organisaties?
Ja dat dan weer wel ja
Het ging hier om een menselijke administratieve fout, de GDPR functionaliteiten om je privegegevens terug te krijgen van bedrijven vergt namelijk nogal wat.
Dat denk ik ook. Dit is iemand die na de GDPR request gewoon is gaan zoeken in de bestanden en per ongeluk de verkeerde heeft uitgezocht.

Lijkt me wel interessant om te horen of de namen of IDs etc van de klanten soms ergens overeenkwamen.
Dit sooirt fouten moeten niet eens mogelijk zijn. Als er met privacy gevoelige info wordt opgegaan moet een menselijk partij niet de mogelijkheid hebben om bij de verkeerde gegevens te browsen. Deze fout zou wel eens kunnen duiden op een volledig ontbreken van toegangs controle tot privacy data.
En hoe zie je dan voor je dat een GPDR-verzoeken medewerker elk verzoek kan afhandelen? Elke persoon in de database z'n eigen medewerker? Dream on. Velen hebben volgens mij nauwelijks een besef hoe dit soort verzoeken door klanten worden gedaan en hoe dit aan de kant van de organisatie wordt gedaan.
Het ging inderdaad om een menselijke administratieve fout, dat laat toch maar zien hoe slecht er mee word omgegaan als EEN mens met zn fout al deze informatie over je kan lekken.
Het ging hier om een menselijke administratieve fout
Maar prima, grijp het maar weer aan als angsthazerij voor de speakers an sich.
Het wil maar niet doordringen hè? Hoeveel van die "foutjes" zijn er nog nodig voordat eindelijk het kwartje valt? Ooit bij stilgestaan dat kwade opzet ook tot de mogelijkheden behoort? Of geloof jij nog in de integriteit van mensen?
Het systeem is prima. Daar is inderdaad weinig mee aan de hand. Dat iemand zo onnozel is om verkeerde data op te sturen, ja, dá's een ander probleem. We moesten toch perse met z'n allen dit soort verzoeken in kunnen dienen zonder gegronde reden? Dan kun je verwachten dat bij de uitvoering wel eens iets mis zou kunnen gaan.
Ik vind het nogal frappant dat de persoon die de boel afhandelt dus blijkbaar gewoon bij de gegevens van iedereen kan, in plaats van dat het in het systeem geregeld is dat je een persoon zijn gegevens toe kan sturen zonder dat de persoon die de opdracht daartoe geeft die gegevens kan inzien.

Anderzijds, waarom wordt deze data überhaupt zo lang bewaard? 8)7

[Reactie gewijzigd door .oisyn op 25 juli 2024 22:33]

Dat is verplicht voor de AVG toch? Bewaarplicht sowieso, maar vanuit de AVG moet je tegenwoordig 'de data' die je van iemand hebt kunnen terughalen. Dus moet dat bewaard blijven. En je kunt niet per individuele klant een andere persoon aanwijzen die ergens bij mag. Met 100.000 klanten wordt dat nogal een gedoetje. Dus zijn er mensen die overal bij kunnen nodig.
maar vanuit de AVG moet je tegenwoordig 'de data' die je van iemand hebt kunnen terughalen. Dus moet dat bewaard blijven.
Dat lijkt me een verkeerde uitleg van de wet 8)7. Data mag je überhaupt alleen opslaan als dat een redelijk belang dient, en data moet je weggooien zodra dat belang er niet meer is. Het lijkt me niet dat je de data moet bewaren omdat de gebruiker het moet kunnen inzien - data die er übheraupt niet is geweest valt immers ook niet in te zien.

[Reactie gewijzigd door .oisyn op 25 juli 2024 22:33]

Ja precies, maar wie bepaald 'redelijk belang' ? In mijn ogen zou dat best een uur kunnen zijn, niet langer. En voor research moet het daarna geanonimiseerd worden en dan mag je er verder mee doen en laten waar je zin in hebt imho.

Ik keur het ook niet goed of zo, maar onlangs was er ook een enorme consternatie over Spotify die niet alle data liet zien die er van iemand was. Dat was weer 'te globaal'. Dus wat moeten ze dan..

[Reactie gewijzigd door DigitalExorcist op 25 juli 2024 22:33]

Het kan voor interne verwerking toch ook best anoniem en niet-gekoppeld worden gebruikt? Maar dan nog zou dit de gebruiker haar eigen data zijn waar hij of zij recht op heeft.
Voor interne verwerking weet ik niet. Ik zou het persoonlijk fijn vinden tegen een 'slim' apparaat te zeggen "schrijf een mail naar persoon <x>" en dan dicteer je een mail.

Half uur later mailt die persoon terug. Slim apparaat zegt: "Je hebt antwoord op je mail van <x> uur van <persoon x>". Komt alleen niet á la minute uit. Kwartier later: "Beantwoord die laatste mail" waarna je het antwoord dicteert.

Béétje contextgevoeligheid zou lekker wezen en maakt slimme apparaten een stuk slimmer en nuttiger. Maar dan moet je de context dus wel 'even' opslaan.

Iets anders wordt het als je zegt "Hey <slim device>, maak een reservering bij dat ene restaurant dat ik vorige week geGoogled heb.." en dan "Oh, bedoel je restaurant <y> of <z>?"

[Reactie gewijzigd door DigitalExorcist op 25 juli 2024 22:33]

Ja ik ook, maar velen vinden dat hier weer eng vermoed ik. Wat dat betreft zou dat soort functionaliteit in instellingen of opties wel 1 op 1 gekoppeld mogen worden aan datapermissies. Nu krijg je vaak dat mensen niet willen dat systemen bijvoorbeeld toegang kunnen hebben tot contacten, maar tegelijkertijd wèl de contextuele handigheid die jij beschrijft verwachten. Terwijl die inherente relatie voor veel leken helemaal niet duidelijk is

Een beetje zoals WhatsApp de zichtbaarheid van blauwe vinkjes nu ook uitschakelt als je zelf niet wil dat men dat bij jou ziet.
maar wie bepaald 'redelijk belang
Uiteindelijk gaat een rechter daarover, maar mijn punt was dat jij stelde dat data bewaart moest blijven omdat de gebruiker het moet kunnen opvragen. Dat lijkt me gewoonweg niet waar. Maar goed, ik ken de wet verder ook niet uit mijn hoofd ;)
Ja precies, maar wie bepaald 'redelijk belang' ? In mijn ogen zou dat best een uur kunnen zijn, niet langer.
In Nederland word dat vaak als een jaar gezien, in Duitsland drie jaar. En omdat niemand een fout wil maken en het te lang bewaren minder erg is als te lang (dan heb je weer een boze klant die zegt dat je zijn data niet wil laten zien) slaat vrijwel iedereen nu veel meer en veel langer op als voor de wetgeving. Te gek voor woorden maar wel waar.
> wie bepaald 'redelijk belang' ?
In eerste instantie het bedrijf zelf, totdat er wat mis gaat. Dan heeft de rechter ook een woordje te zeggen. In principe zou ieder (!) bedrijf een 'register van verwerkingen'' moeten hebben met alle verwerkingen van data met op welk moment je de data nodig gebruikt/aanpast, waarom je dat dit en waarvoor je de data nodig hebt (a.k.a. welk doel heeft de verzamelde data).

Redelijk belang kan heel veel zijn. Ik kan rustig alles en iedereen volgen en alle data die ik tegenkom verzamelen, omdat ik betere reclames wil voorschotelen. Als ik dat doe moet ik wel van ieder stukje data kunnen zeggen hoe ik die gebruik, waarom ik precies dat nodig heb voor mijn betere suggesties en moet de gebruiker hier EXPLICIET mee instemmen. (dus geen opt-out, maar een opt-in, en nee een linkje naar je privacy verklaring is NIET genoeg).
Slaat bewaarplicht dan niet meer op boekhoudgerelateerde data? Wat voor zin heeft dat bij stemopnames.
Nee. alles wat de klant met jouw services doet moet opgeslagen worden. Dat is iets wat veel mensen niet snappen. Mijn bedrijven moeten nu vele malen meer opslaan dan dat we voorheen deden. Voorheen werden veel logfiles elke nacht verwijderd, nu moet ik ze twee jaar bewaren. We verzamelde ongeveer 4 mb per dag voorheen, nu is dat 2 gb. Ik zie er geen nut toe maar als ik het niet doe kan ik problemen krijgen. Dus maar weer een disk erbij, en een backup etc)

Het is allemaal lachwekkend. De klant eist dat ik al zijn data verwijder maar houd wel het recht op garantie (hoewel ik dus niet meer kan zien dat het een klant is). Wil je weten hoe makkelijk het nu is om geld wit te wassen? Je voegt gewoon een klant in je systeem toe en geeft die de naam 'alle_data_verwijderd_op_verzoek'. Bij ons was de belastingdienst kwaad omdat we niet alle orders naar een klant konden herleiden (dat is inderdaad een eis in Duitsland). Heb ze maar gevraagd aan welke wegeving ik moet voldoen omdat ik niet aan de nieuwe privacy wetten EN de belastingwetten kan voldoen. Duitsers zijn dol op het laten verwijderen van hun data maar boos als je ze dan niet meer kent.
Zoals gezegd het is allemaal grappig als het niet zoveel geld zou kosten.
Als je het niet opslaat heb je ook geen data en hoef je het ook niet terug te kunnen halen.
Er is geen bewaarplicht, je moet wel weten waar de data staat en de mogelijkheid bieden om deze te laten inzien of deleten. Als je het delete dan valt er ook niets in te zien of te bewaren ter inzage. Problem solved.
Dat is verplicht voor de GDPR toch? Bewaarplicht sowieso, maar vanuit de GDPR moet je tegenwoordig 'de data' die je van iemand hebt kunnen terughalen.
Je hoeft de data niet een bepaalde termijn te bewaren in dit geval. Dat zegt de GDPR helemaal niet. Alleen ALS je de data hebt, moet de persoon over wie deze data gaat deze kunnen inzien.
Even over dat laatste stukje; je kan ook zorgen dat er bij een persoon/klant een knop zit 'stuur gegevens op' waar een medewerker op moet drukken. De medewerker heeft geen inzicht en kan het niet per ongeluk naar een verkeerd persoon sturen (mag aannemen dat ze je mailadres wel hebben).
Dat zou kunnen. Maar dan nog moet je 100% uit kunnen gaan van de ID-veldjes in je database, typfouten van de kant van je klant (naam, achternaam, et cetera) en andere 'unieke' identifiers. Over het algemeen zou dat niet zo'n probleem moeten zijn..... totdat het een keer misgaat.
AVG heeft exact het omgekeerde doel: het zo KORT mogelijk opslaan van persoonlijke data. AVG is geen bewaarplicht, het wil dat je zo weinig mogelijk opslaat, zo kort mogelijk.
En hoe wil je garanderen dat iemand alleen bij zijn eigen data kan? Dan krijg je weer rampverhalen dat iemand die een login kaapte ineens alle privédata kan binnenhalen. Dat soort gegevensverwerking wordt nu nog veel met de hand gedaan en dat soort verzoeken zijn ook nog vrij nieuw, laat staan de verzoekmogelijkheden.

Dit soort GDPR-verwerking kan je leuk in een paar zinnen formuleren, maar de daadwerkelijke technische en administratieve afhandeling is nog aardig complex.
.oisyn Moderator Devschuur® @MsG20 december 2018 14:56
En hoe wil je garanderen dat iemand alleen bij zijn eigen data kan?
Definieer "bij je data kunnen". Moet ik daar helemaal zelf bijkunnen zonder tussenkomst van een derde? Natuurlijk niet. Ik moet een verzoek kunnen indienen om die data naar mij te sturen. Dat verzoek kan gewoon handmatig worden afgehandeld en gecontroleerd. Maar de persoon die dat afhandelt hoeft er niet per se bij te kunnen om zijn werk te kunnen doen.

[Reactie gewijzigd door .oisyn op 25 juli 2024 22:33]

Dat hoeft nu toch ook niet per se te zijn gebeurd? Of ken je de interne details, dan zijn ze wellicht handig als aanvulling in het artikel? Wellicht is er een verkeerde ID ingevoerd, of iets anders verschoven.

Ik kan me voorstellen dat er niet voor elke klant een unieke gegevensstuur-persoon wordt aangenomen, dus er zal logischerwijs 1 of meer personen zijn die deze verzoeken verwerken, los van of deze personen de inhoudelijke data zien, kan deze natuurlijk worden verbonden aan de verkeerde persoon.

Net als de vroegere doorverbinder van telefonie je verkeerd kon verbinden, de apotheekbediende toch even de verkeerde zak medicijnen kan pakken, zonder de inhoud zelf te kennen. Of de postbode die weleens een belangrijke brief in de verkeerde brievenbus stopt, in een flat met vele brievenbussen en alleen nummers.

[Reactie gewijzigd door MsG op 25 juli 2024 22:33]

.oisyn Moderator Devschuur® @MsG20 december 2018 15:10
Wellicht is er een verkeerde ID ingevoerd
Persoon X heeft de data gekregen van persoon Y. Mijn punt is dat dat niet zou moeten kunnen. Daarvoor hoef ik helemaal niet te weten hoe die interne processen werken, puur aan het feit persoon X data heeft ontvangen van persoon Y geeft al aan dat er iets mis is. En dat gaat verder dan gewoon "verkeerde ID invoeren" (sowieso, ID invoeren 8)7), want dan zou het hoogstens betekenen dat persoon Y zijn eigen data ontvangt nadat persoon X een verzoek heeft ingediend.

[Reactie gewijzigd door .oisyn op 25 juli 2024 22:33]

Dat dat niet moet kunnen lijkt me nogal een captain obvious, en dat er iets mis is gegaan wordt ook door helemaal niemand hier ontkend, leuke stroman. Jij impliceert dat iemand die de data nu verwerkte ook inhoudelijk bij die data kon, terwijl dat nergens uit blijkt. Er is slechts data bij de verkeerde bezorgd, dat staat compleet los van het vraagstuk of medewerkers daar zelf ook inhoudelijk bij kunnen.

En je kan wel lachen om ID invoeren, maar uiteindelijk moet er toch een koppeling worden gemaakt met iemands account en het GDPR-verzoek. Men doet dat zeker niet noodzakelijkerwijs via het eigen account, en dat zou ook niet per se de beperking moeten zijn.

[Reactie gewijzigd door MsG op 25 juli 2024 22:33]

.oisyn Moderator Devschuur® @MsG20 december 2018 15:14
Jij impliceert dat iemand die de data nu verwerkte ook inhoudelijk bij die data kon
Dat is de enige conclusie die ik kan trekken. Als je in een systeem op kan geven dat data van persoon X naar persoon Y gestuurd moet worden, dan kan de persoon die dat regelt de data dus ook naar zichzelf sturen.
En je kan wel lachen om ID invoeren, maar uiteindelijk moet er toch een koppeling worden gemaakt met iemands account en het GDPR-verzoek. Men doet dat zeker niet noodzakelijkerwijs via het eigen account, en dat zou ook niet per se de beperking moeten zijn.
Dus dan zoek je iemand op in het systeem, en de rest doe je van daaruit. Dan ga je toch geen ID opzoeken in het ene systeem en dan weer in moeten voeren in het andere systeem :P

[Reactie gewijzigd door .oisyn op 25 juli 2024 22:33]

Nou ja ik weet niet wat de gebruikte referentiedata is, ik werk niet bij Amazon, een persoonsnummer wordt vaak genoeg gebruikt, zeker met bij Amazon miljoenen 'Joe Plumbers' in de database zou ik eerder van een uniek gegeven uit gaan :-P.

Maar goed, dat ze in theorie via een omweg alsnog bij je data zouden kunnen zie ik als hetzelfde kaliber als dat iemand van de RDW bij je data kan, iemand van de bank, iemand van het GBA. Met goede audit trails is dat ook helemaal niet per se het probleem. Het naar de verkeerde persoon sturen is m.i. hèt probleem. Maar hoe je dat elimineert zonder dat en GDPR-verzoek alleen vanuit het ingelogde account kan worden gedaan, is weer een tweede.
Het voelt even absurd aan als naar Tweakers een mailtje sturen dat je uw machtwoord verloren bent en dat iemand van de administratie even op de server kijkt en mij in plain text het naar me maild.

Op youtube zijn er talrijke filpmjes van Android gebruikers die beweren dat ze in browser reclame ads van Google kunnen sturen door er in de buurt van hun telefoon over te praten.... ik moet dat nog gaan geloven!
Nou ja bij Tweakers moet je formeel ook een GDPR-verzoek kunnen doen, dus als alle 300K geregistreerde leden dat eens zouden doen kan ik je nu al vertellen dat dat ook echt wel ergens fout zou gaan.
Ok, Ze kunnen uw posts exporteren en profiel info, maar niet uw wachtwoord ;-) Het punt is waarom iemand van de administratie van Amazon gewoon aan al uw (en dus alle andere mensen) gesprekken kan

[Reactie gewijzigd door Coolstart op 25 juli 2024 22:33]

Het voelt even absurd aan als naar Tweakers een mailtje sturen dat je uw machtwoord verloren bent en dat iemand van de administratie even op de server kijkt en mij in plain text het naar me maild.
Erger is het als jouw gegevens naar mij gestuurd worden.
Sorry, maar nee, daar mag je geen fouten in verwachten. Daar verwacht ik een volledig geautomatiseerd proces voor, zonder tussenkomst van mensen.
.oisyn Moderator Devschuur® @TMDevil20 december 2018 14:54
Enige nuance is daar wel op z'n plaats, maar inderdaad, bij zo'n grote partij als Amazon, met zulke gevoelige data als audio-opnames in de privésfeer, ja daar mag je echt wel bij stellen dat dat gewoon is geautomatiseerd en goed is afgedicht.
Dus jij wilt echt dat een computer beslist of de gebruiker die toegang vraagt ook die data moet krijgen? Niet een mens die even checken of het wel okay lijkt? Je hebt veel vertrouwen in programmeurs! In mijn bedrijven zal dit NOOIT maar dan ook nooit geautomatiseerd worden. Als een programma een fout maakt kan er zo veel data weglekken. Als een medewerker ziet dat er 500 verzoeken per uur binnen komen dan ziet ie dat er wel wat mis is.

Alle privacy gevoelige data die het pand uit gaat moet door een medewerker gezien zijn en moet hij/zij reden aangeven waarom dat gebeurt.
Ik ben toch bang dat je het type medewerker wat hiervoor ingezet wordt zwaar onderschat. Vooral als alle verzoeken handmatig worden moeten worden afgehandeld heb je veel mensen nodig, die weinig opleveren (voor een bedrijf zijn het eigenlijk alleen kosten). Daarnaast is het nog een flexibel iets, de ene maand zijn er veel aanvragen (als iets in het nieuws is geweest), de volgende maand bijna geen.
Het gevolg is dat dit werk gedaan wordt door uitzendkrachten die 0,0 binding met het bedrijf hebben.

In geschreven code zullen altijd fouten kunnen zitten, dat klopt, echter, die kan zo fail-safe mogelijk iets maken dmv test-driven development.
Dit soort processen zijn veel minder foutgevoelig dan een random flexwerker die maar op wat knoppen moet drukken. Want die medewerker kan een slechte dag hebben, gewoon niet goed ingewerkt zijn of gewoon niet opletten (omdat die liever met die andere medewerk(ster) flirt).

Toch gek dat we wel graag autonoom willen rijden omdat een computer minder fouten maakt, maar voor een relatief eenvoudig proces zijn we bang dat het verkeerd gaat ..
.oisyn Moderator Devschuur® @Verwijderd20 december 2018 15:39
Dus jij wilt echt dat een computer beslist of de gebruiker die toegang vraagt ook die data moet krijgen?
Dat staat er toch niet 8)7. Ik wil dat de persoon die die beslissing maakt alleen maar op een knop hoeft te drukken, en niet zelf de data kan opvragen of zelf kan beslissen waar de data naartoe moet worden gestuurd.

[Reactie gewijzigd door .oisyn op 25 juli 2024 22:33]

Oh ja, want geautomatiseerde processen gaan altijd goed. Ok....
Ik denk dat je verwachting dan niet geheel strookt met de realiteit. Terecht of niet, de GDPR/AVG komt voor miljoenen bedrijven als een draak van een module, die ineens met een druk op de knop moet zorgen dat je bij de bakker in plaats van 3 krentenbollen, ineens om een uitdraai van al je persoonsgegevens die zij van je hebben, moet kunnen vragen. En daarnaast ook nog eens moet kunnen verwijderen.

Dit botst bij de meeste pakketten al met de belastingdienst vereisten om gegevens op z'n minst 7 jaar nog te mogen opvragen, en daarnaast zit dit soort functionaliteit vrijwel nooit standaard in de pakketten die men gebruikte.

De enige organisatie die ik zelf ken die dit jaren voor de inwerking treding van de GPDR al aanbood was Google. En bij Hyves kon ik vlak voor dat het ter ziele ging al mijn data downloaden.

Denk dat momenteel het aandeel bedrijven waar een GDPR-verzoek intern wordt afgehandeld als een officieel gestroomlijnd proces een hele hele kleine minderheid is. En bij de rest van de wereld, óf handwerk, óf er nog niet aan kunnen voldoen.
En toch wisten (en weten) alle bedrijven al een heel tijd dat de GDPR er kwam (en nu is). Dus zeggen dat de druk er "in eens" is, is voor mij een grote smoes.
En Amazon is natuurlijk geen bakker van om de hoek, Amazone was afgelopen jaar het meest waardevolle bedrijf op de beurs geweest maakt miljarden winst.

En volgens mij gaat het opvragen van je gegevens bij Facebook en Google automatisch, zonder tussenkomst van medewerkers.
Dat mensen fouten maken is niet nieuws. Zoals je zegt: je moet verwachten dat het bij de uitvoering mis kan gaan. Een goed ontwerp houdt daar rekening mee, bijvoorbeeld door dit soort gevoelige gegevens niet of niet centraal op te slaan.
Ik maak me meer zorgen dat het geen geautomatiseerd proces is en er blijkbaar mensen bij de data kunnen.
Ik maak me meer zorgen dat het geen geautomatiseerd proces is en er blijkbaar mensen bij de data kunnen.
.. en dat die mensen jouw data aan een ander kunnen sturen.
Verwijderen ze dan ook mijn gegevens als ik dat vraag, of die van een ander ?
Ik heb hetzelfde gezegd bij de introductie van een dergelijk apparaat, toen werd ik als gek weggezet.

Het geeft ook duidelijk aan dat alle opnamen dus gewoon wel opgeslagen worden door de fabrikant, wat ik toen ook aangaf wat, werd als toen als onmogelijk bestempeld.
Ik weet niet hoe het bij Amazon is, maar alle opdrachten die ik via mijn Google Home naar de servers van Google heb gestuurd kan ik gewoon terug luisteren via mijn account pagina (en zijn dus opgeslagen). Google doet daar helemaal niet geheimzinnig over.
Dat wordt ook nooit ontkend. Dat kan je bij Google op dag 1 van de Speaker ook allemaal opvragen bijvoorbeeld. De 'I told you so' is gewoon niet te maken vandaag helaas. Wie weet over een paar jaar.

Net als dat 1 ongeluk van een zelfrijdende auto meteen betekent dat we die niet kant op moeten gaan natuurlijk...
Bijzonder dat er wav's van worden opgeslagen!
Wat is daar vreemd aan, dataverzameldevices zijn er om data te verzamelen, dat doen ze dus prima.
wav is volgens mij niet per se het beste formaat om data in op te slaan. Het is een container format, dus het is niet per se duidelijk wat voor codec er onder hangt, maar de kans is groot dat het uncompressed audio is, waardoor het nogal groot kan zijn. Gezien amazon (en google en apple en alle bedrijven die dit soort apparaten aanbieden) nogal veel van dit soort bestanden zullen hebben, kan het snel uit om een compressed format te nemen wat wel kwaliteit behoud (zoals ogg-vorbis) om zo ruimte (en dus geld) te besparen.
Ik vraag me in de eerste plaats af waarom ze deze audio opnemen en voor lange tijd opslaan. Vindt ik persoonlijk onwenselijk.

Wat betreft het gebruik van het wav formaat ( linear PCM ) dit hebben ze neem ik aan gedaan zodat de klant het gemakkelijk kan afspelen zonder eerst een bepaalde codec te moeten installeren. Amazon zal intern wellicht een vorm van lossless compressie gebruikt. Maar dan nog, waarom moeten ze dit voor zo'n lange tijd opslaan? Is er ook een mogelijkheid om expliciet aan te geven deze opnamen niet te maken en niet op te slaan? En wie controleert daarop?
Ik zou niet vreemd opkijken als binnen enkele jaren een nieuwsbericht verschijnt dat soortgelijke data van miljoenen gebruikers is uitgelekt. Dus laat dit een waarschuwing zijn voor iedereen dat je geen privacy gevoelige data deelt met diensten zoals deze. Je weet maar nooit in de toekomst hoe je zoekgeschiedenis tegen je kan worden gebruikt.
Je leest vrijwel dagelijks dat er ergens weer miljoenen klantgegevens worden gelekt. Naar, en niet wenselijk, maar het is ook weer niet zo dat dat blijkbaar voor een massale ontregeling zorgt. Er wordt blijkbaar goed genoeg op geanticipeerd. Ik vermoed dat inmiddels iedereen's data wel al een keer èrgens gelekt is.
Hoewel dit natuurlijk heel sukkelig is ben ik ervan overtuigd dat het verzamelen van al jouw data 'omdat jij onder het mom van AVG inzage wilt in jouw data' bij een heel groot deel van de bedrijven een handmatig karweitje is met veel Printscreen en CTRL-C + CTRL-V werk. En waar mensen werken worden fouten gemaakt. Dus dat op deze manier verkeerde gegevens bij verkeerde mensen terecht gaan komen zie ik de komende tijd nog wel veel vaker gebeuren.

Bij een bedrijf als Amazon had ik verwacht dat dit wel goed geregeld zou zijn, maar dit neigt ook erg naar een stukje handwerk aangezien ze het hebben over 'een menselijke fout'. Ik denk niet dat er veel organisaties zijn die met een druk op de kop een kant-en-klaar rapportje kunnen generen waar alles in staat wat ze van/over jou hebben opgeslagen.

[Reactie gewijzigd door RickyHeijnen op 25 juli 2024 22:33]

Je vraagt je wel af hoe nauwkeurig – en dus hoe bruikbaar – die algoritmes zijn als je dit leest en steeds leest dat filters van muziek etc niet eens verschillende versies uit elkaar kunnen houden.
Er werd hier niks door een algoritme gedaan he, een menselijke administratieve fout.

Als muziek in bepaalde gedeelten grotendeels overeenkomt met een ander muziekstuk is het logisch dat een algoritme daar niks mee kan. Het zou hoogstens op basis van andere data kunnen voorspellen welk muziekstuk het in potentie kunnen zijn. Een algoritme is geen magie, eerder vernuftige wiskunde.
Juist computers zijn vaak beter in het objectief vergelijken, nauwkeurig meten etc van data.

Bij röntgenfoto’s en dergelijke kunnen algoritmes nu beter afwijkingen vinden dan zelfs getrainde specialisten.

Een uitvoering van de vijfde van Beethoven klinkt altijd een beetje anders door andere uitvoerenden. Ik wed dat alleen al het tempo nooit precies hetzelfde is. Dan zou je dus verwachten dat YouTube daar geen fouten mee maakt, je weet wel, met hun filters voor rechthebbenden.
Te mooi ook. Je kon er op wachten.
Ach, je zal in Duitsland ook wel meerdere Peter Jansens hebben (maar dan het Duitse equivalent natuurlijk), dus als dit inderdaad door mensen verzameld en verstuurd wordt, is dat best een logische fout.

Vervelend, natuurlijk, maar niet vreemd.

Mooi leermoment voor Amazon en dat zullen ze vast niet nog een keer doen.

Op dit item kan niet meer gereageerd worden.