Cookies op Tweakers

Tweakers is onderdeel van DPG Media en maakt gebruik van cookies, JavaScript en vergelijkbare technologie om je onder andere een optimale gebruikerservaring te bieden. Ook kan Tweakers hierdoor het gedrag van bezoekers vastleggen en analyseren. Door gebruik te maken van deze website, of door op 'Cookies accepteren' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt? Bekijk dan ons cookiebeleid.

Meer informatie

Google stopt tijdelijk met beluisteren Nederlandse Assistant-opnames

Google stopt tijdelijk met het verzamelen en analyseren van Nederlandse audiofragmenten via de Google Assistant. Het bedrijf wil na de ophef vorige maand kijken hoe het kan verduidelijken wat het met de gegevens doet.

Het bedrijf is daarmee gestopt nadat vorige maand geluidsopnames van Nederlandse Assistant-gebruikers uitlekten naar journalisten van de NOS en de Vlaamse VRT. Na dat lek ontstond veel ophef onder gebruikers die vaak niet doorhadden dat personen binnen Google de opnames in sommige gevallen persoonlijk beluisterden. Dat deed het bedrijf om beter te begrijpen wat gebruikers tegen de Assistant zeiden, of door welke geluiden het wekwoord onterecht werd geactiveerd. De stop duurt 'tijdelijk', maar het is niet bekend hoe lang dat is. "Ondertussen bekijken we hoe we nog duidelijker kunnen maken wat we met gegevens doen om onze spraaktechnologie te verbeteren", schrijft het bedrijf. Google zegt dat het 'kort nadat we hadden gehoord dat er fragmenten waren gelekt' is gestopt met het transcriberen van zulke fragmenten.

Tegelijkertijd maakt Google het verzamelen van data optioneel bij het gebruik van de Assistant. Tot nu toe was het verplicht voor gebruikers om 'spraak- en audioactiviteit' met Google te delen als zij de slimme assistent gebruikten, maar inmiddels is die functie opt-out geworden. Gebruikers kunnen er dus voor kiezen het verzamelen van zulke audio uit te schakelen.

Google zei eerder al een onderzoek te zijn gestart naar het lekken van de audiofragmenten. Eerder deze week bleek bovendien dat Apple-medewerkers konden meeluisteren met Siri-opnames.

Wat vind je van dit artikel?

Geef je mening in het Geachte Redactie-forum.

Door Tijs Hofmans

Redacteur privacy & security

01-08-2019 • 18:08

107 Linkedin

Reacties (107)

Wijzig sortering
Ik snap niet dat mensen echt geloven dat machines zelf leren wat alles betekent. Dat wordt door mensen geïnterpreteerd zodat de algoritmen daar van kunnen leren. Ik zou niet weten hoe je dat op een andere manier zou kunnen doen dan naar de commando's te luisteren.

Dit gebeurt overigens ook bij beeldherkennning. Die CAPTCHA waar je verkeersborden moet aanklikken om te bewijzen dat je geen robot bent worden voor diezelfde doeleinden ingezet. Daar zitten mensen achter. Jij dus in dat geval.
In essentie klopt dit, maar dit betekent niet dat een bedrijf maar willekeurig haar gebruikers moet gaan afluisteren. Calibratie / verbetering kan ook gebeuren door onderzoek in een lab en door op grote schaal personeel hiervoor in te huren en gebruiken. Personeel dat hiermee instemt. Ja, dat is duurder, maar het is wel een manier van ontwikkeling die het afluisteren van iedereen niet normaliseert.

Wat mij betreft zou wat Google hier doet bij wet verboden moeten zijn. Er is een groot maatschappelijk belang om vrij, zonder opgenomen te worden, uitingen te kunnen doen.
Hoezo afluisteren? Je stuurt toch alleen de spraak commando's naar Google als je het hotword gezegd hebt? Dat deze per ongeluk getriggerd wordt lijkt me geen opzettelijk gevolg van grootschalig afluisteren.
Je zet zelf de microfoon aan. En je koopt zelf een Google home apparaat. Er zit zelfs een fysieke knop op die het onmogelijk maakt voor het apparaat om naar je te luisteren.

Bovendien is wat jij voorstelt niet optimaal. Alsof een kleine groep mensen alle mogelijke scenario's en accenten en zoekopdrachten kan nabootsen van een complete maatschappij.

[Reactie gewijzigd door TJRef op 1 augustus 2019 18:30]

Ik maak zelf geen gebruik van dergelijke diensten, maar bij vrienden/ouders die dit wel doen springen G assistant / Siri / Alexa te pas en te onpas vanzelf aan. Daarnaast: deze apparaten moeten altijd luisteren om het hotword te herkennen. Wie zegt dat Google / andere bedrijven dit niet 'analyseren', voordat er überhaupt iets geroepen is?

Dat het niet optimaal zou zijn boeit mij weinig. Deze bedrijven hebben genoeg vermogen om dit goed te ontwikkelen zonder mensenrechten te schenden. De optie van @CAPSLOCK2000 hierboven is ook prima: verzoeken kunnen indienen om fragmenten te laten analyseren.

Als ik nabij een apparaat ben waarvan ik vermoed dat deze meeluistert / mee zou kunnen luisteren, dan pas ik aan wat ik zeg. En ik heb een vrij normaal gedachtengoed...

[Reactie gewijzigd door Pastafarian op 1 augustus 2019 18:40]

Er is al meerdere malen discussie geweest over wanneer iets naar de server wordt gestuurd. En dat is pas na een hotword. Het apparaat zelf is alleen in staat om een hotword te herkennen en de rest door te sturen. Als het niet getriggerd wordt wordt er niks verstuurd.
Dat hebben ook mensen zelf getest en bevestigd. Dat kun je gewoon meten door de netwerk activiteit van het apparaat te monitoren.
Dat geloof ik best. Maar weet wel dat je niet de code in kan zien en dus alleen het gedrag hiermee test.
Gezien er al aardig wat malware is wat alleen draait als er aan specifieke eisen worden voldaan(mac addressen etc) kan het maar zo zijn dat sommige apparaten wel al gewoon aan het afluisteren zijn.
Of eventueel een update binnenkrijgen over een paar maanden.

Dit is uiteraard op niks gebaseerd, maar dat zijn de onderzoeken van "oh er gebeurd niks op Wireshark dus de apparaten zijn safe". Terwijl de apparaten van dag tot dag kunnen verschillen qua updates etc.
... kan het maar zo zijn dat sommige apparaten wel al gewoon aan het afluisteren zijn.
En je denkt dan dat dat afluisteren lokaal op het toestel gebeurt?
Als er geluisterd wordt moet dat naar een server gestuurd worden. Dat is heel makkelijk te controleren.
Moest dat effectief gebeuren dan had je er nu wel al wat van gelezen of gezien in het nieuws...
Het is inderdaad heel makkelijk te controleren dat er iets verstuurd wordt naar Google. Wat dat is is een stuk lastiger.
En ik zeg zeker niet dat dit op grote schaal gebeurd, maar op een kleine/custom schaal zal dit kinderlijk eenvoudig zijn.

Niemand die deze producten gebruikt analyseerd het netwerkverkeer 24/7. En zelfs dan is het nog makkelijk te omzeilen..

Neem random 5 seconden op.. Verstuur het pas als de gebruiker daadwerkelijk iets aan Google vraagt.
Gebruiker kan toch niet zien wat er precies verstuurd wordt.Wordt er 1 commando verstuurd of 3? Lange/korte zinnen etc. Want encrypted.

Grootte zal ook geen probleem zijn als je het lokaal omzet naar een string.
Zelf geen idee hoe krachtig Google/Sonix hier in is. Behalve dat het blijkbaar erg goed werkt.

Uiteraard wordt dit niet grootschalig gebruikt want dan worden ze inderdaad vanzelf betrapt. Maar als ze het alleen doen als je bent verbonden met een Wi-Fi netwerk in Den Haag of w/e wordt het een stuk moeilijker om te vinden.
+1Anoniem: 120539
@TJRef2 augustus 2019 07:33
Het probleem ontstaat juist als het apparaat ‘denkt’ dat het hotword werd gezegd, maar dat dat niet werkelijk het geval was.
Juist dan is wat er daarna wordt gezegd niet logisch; er was geen hotword, dus er volgt geen commando; de gebruiker was immers helemaal niet bezig een opdracht te geven, maar gewoon aan het praten of in een gesprek.
De AI bij de leverancier begrijpt er niets van, en markeert de opname als ‘niet automatisch analyseerbaar’.
Opnames met dat vlaggetje zijn dus juist interessant om handmatig verder te onderzoeken; het lijkt er immers op dat er iets werd gezegd wat voor het apparaat bedoeld was. Mogelijk kan een mens wel iets met het fragment, en kan het bedrijf erachter (en daarmee de AI) er iets van leren.

Het gevolg is dus dat in verhouding juist veel meer onbedoelde opnames door mensen worden gehoord dan bewuste opdrachten die gewoon niet goed begrepen werden.
Prima maar meer dan die eerste 5seconden hoeft er dan niet beluisterd te worden.
Je hebt helemaal gelijk. Het hotword is lokaal geregeld met een chip en is uitgebreid getest en gemeten door mensen.
Een probleem is echter dat het apparaat soms iets verkeerd 'verstaat'. Het apparaat denkt dat het hotword wordt gezegd, terwijl dat niet zo is. Het gaat dan dus wel dingen opnemen en doorsturen zonder dat dat de bedoeling van de gebruiker was.
Wie zegt dat Google / andere bedrijven dit niet 'analyseren', voordat er überhaupt iets geroepen is?
Mensen die data verkeer analyseren na het roepen van het commando.
"maar bij vrienden/ouders die dit wel doen springen G assistant / Siri / Alexa te pas en te onpas vanzelf aan"

Heeft er dan iemand een spraakgebrek waardoor alles klinkt als ok Google??
Ik heb al jaren de Assistant in huis. Het aantal keren dat deze per abuis begon te luisteren is nog altijd makkelijk op 2 handen te tellen (en inmiddels is dat nog minder dan in het begin) en in alle gevallen wist ik er van doordat het ding meldde niet te begrijpen wat er gezegd was. (Je kunt de opnames terug luisteren, ik kijk daar af en toe naar, dus weet dat er niet meer opnames zijn waar ik geen weet van heb)
Je zet zelf de microfoon aan.

Nee dus, je kunt bij een Android telefoon niet eens de microfoon uitzetten. Deze staat altijd aan.
Telefoon is inderdaad discutabel, maar een Google home zet je echt niet in je huis om het apparaat nooit te laten luisteren. Het grappige is wel dat je de microfoon kunt uitzetten, maar dat je vervolgens wel het hotword kunt zeggen en dan een reactie krijgt dat de microfoon uit staan. Ik begrijp dat de hotword kan worden herkend zonder datadeling, maar 'microfoon uit' klopt dan niet.
Het grappige is wel dat je de microfoon kunt uitzetten, maar dat je vervolgens wel het hotword kunt zeggen en dan een reactie krijgt dat de microfoon uit staan.
Zojuist getest op een Nest Hub en Home mini, maar beide doen helemaal niks als de microfoon uit staat. Er wordt alleen vlak na het uitschakelen gezegd dat de microfoon uitgeschakeld is.
ik zal het vanmiddag nogmaals proberen als ik thuis ben, maar volgens mij was het iets als dit:

Ik: "OK Google, mute microphone"
Google: "Ok, the microphone is muted"
Ik: "OK Google"
Google: "The microphone is muted"

Check mijn reactie waarop je reageerde en onderstaande reactie voor nuance.
En dit soort onwaarheden maken dat er steeds ophef komt over niks....
ik krijg het niet meer voor elkaar, maar heb het echt zelf meegemaakt. Nu vind ik het niet zo erg, aangezien alleen het gedeelte aan staat wat de hotword kan detecteren en er verder niks wordt verstuurd, maar ik had destijds wel het gevoel dat "Microphone muted" wel duidelijk was, maar ook misleidend.

Ik denk dat het als volgt was: je kunt de Google Home en Home Mini muten met een schakelaar op de achterkant, maar je kunt hem ook met je stem muten. Als je hem met je stem mute krijg je exact hetzelfde gedrag als met de schakelaar: 4 oranje leds en de melding dat de microfoon gemute is. Als je dan 'hey google' zegt reageert hij met het feit dat hij gemute is.

Ik snap dat dit ergens ook wel gebruiksgemak is: wellicht kun je hem niet meer unmuten als je hem hands-free mute (een moeilijk bereikbare plek o.i.d.), maar het is toch wel raar voor de leek die niet begrijpt dat de hotword en daadwerkelijke communicatie met het internet 2 losstaande feiten zijn.
Ah zo. De hardware switch op het apparaat schakelt fysiek de microfoon uit. Dus dan weet je écht zeker dat er niks opgenomen en eventueel opgeslagen wordt. Via een stemcommando muten is inderdaad een ander verhaal. Dan blijft de microfoon actief (zodat je weer met de stem kunt unmuten), maar tot die tijd wordt er ook geen opname gemaakt (als het goed is!). De detectie van het hotword (hey google) gebeurt lokaal op het apparaat zelf en niet via de Google services. Ik weet niet hoe hij de detectie van de opdracht om te unmuten dan doet...? Ook lokaal?? Ik mag dat ergens wel hopen - in dat geval is ook de spraakopdracht mute wel degelijk een echte mute wat betreft het verzenden van data naar de servers van Google.
Bij de Google Home Mini is het inderdaad een schakelaar met 2 standen. De 'schakelaar' op de grote Home is een microswitch, deze schakelt dus niet zelf, met de mogelijkheid dat de lijnen naar de microfoon altijd ononderbroken blijven en de microfoon dus altijd aangesloten is (tenzij een ander circuit daadwerkelijk onderbroken wordt.

De Google Home Mini teardown laat mij ook niet duidelijk zijn dat de aansluitingen van de fysieke mute-schakelaar serieel zijn aangesloten aan de microfoons, dus ik betwijfel of die daadwerkelijk de microfoons loskoppelt.

Ik heb gisteren nogmaals geprobeerd de hierboven beschreven reactie uit de Google Home te krijgen, maar het is me niet meer gelukt.
Zit nu op het werk, dus kan maar beperkt Googlen, maar ik meen op meerdere plaatsen gelezen te hebben dat mensen de Home Mini uit elkaar hadden gehaald en geconstateerd hadden dat de mute knop daadwerkelijk hardwarematig de microfoon uitzet, en niet software-matig.... Maar Pin mij er niet op vast - kan het nu immers niet (gemakkelijk) opzoeken....
Nee, dit is verre van een situatie waarbij je kan stellen dat het maar een probleem van de eigenaar is omdat die het product heeft aangeschaft en je het woord afluisteren kan afschuiven.

Een belangrijk punt van de ophef is dat de assistent ook zonder hotwords opnames maakt omdat het systeem meent dat geluiden op de hotwords zouden lijken en hoe gevoellig dat kan zijn. Bijvoorbeeld een ritssluiting die een geluid maakte dat er op leek, of een persoon die op de achtergrond een woordcombinatie gebruikte dat er op zou lijken, of combinaties van geluidbronnen waar het systeem een hotwoord in meent waar te nemen. En dat zijn nu precies de situaties die de meest gevoelige details, onbedoeld door de eigenaar of de omgeving, bij Google of andere spraakdiensten kunnen laten belanden. Dan kan je niet simpel stellen dat het aan de eigenaar ligt. Google heeft dan een groot deel in verantwoordelijkheid om te voorkomen dat het dat soort onbedoelde opnames en gevoelige details gaat verwerken. En die verantwoordelijkheid neemt het nauwelijks.

Dat het systeem foute keuzes kan maken is logisch, maar Google zorgt er eerst voor dat de klanten alles maar moeten toestaan dat die gevoelige momenten ook door Google gebruikt kunnen worden en vervolgens maakte ze er een gedeeltelijke opt-out van om nog maar genoeg informatie te kunnen blijven verzamelen. En al die tijd terwijl Google zich ook wel bewust had moeten zijn hoe gevoellig de inhoud voor hun klanten zou kunnen zijn.

Ik denk dat het vergelijkbaar is met camerabeelden en dat er regels zijn wie onder welke omstandigheden gegevens mag verwerken. Google kan niet aantonen dat de opnames alleen betrekking hebben op de eigenaar. Dan kunnen die geluiden van gesprekken waarschijnlijk al niet verwerkt worden voor het verbeteren van de diensten, in ieder geval niet onder een verplichting of onder een opt-out. Verder is het laakbaar dat Google de omgeving waar het opnames kan maken niet de gelegenheid geeft om er controle over te hebben. De enige controle die ze wensen is dat de eigenaar een keuze maakt en dat het standaard aan staat. Dat is niet in het belang van de eigenaar, laat staan in het belang van ieder van wie er onbedoeld opnames gemaakt worden.

Dit soort spraakgestuurde systeen horen thuis in een huishouden waar iedereen weet heeft dat het er staat en iedereen controle heeft over wat Google wel of niet ontvangt. Niet in een publieke ruimte, niet in een situatie waarbij omstanders perongeluk en onbewust hun details bij Google of wel ander bedrijf dan ook dat voor ze werkt de opnames kan verwerken. En als iemand dan toch opnames wil laten maken, dan met een zeer duidelijke waarschuwing dat Google bezig is met opnames maken. En wat mij betreft kan dat een vrij irritante geluidsmelding zijn dat het apparaat aan geeft dat het opnames maakt, waarvoor en hoe je kan voorkomen dat die opnames verwerkt worden.
Of je geeft zo’n product 6-12 maanden in beta om zoveel mogelijk te leren bij een populatie van 1.000-2.500 mensen. En daarna kan je eventueel nog een R&D groepje maken die je helpt met het verbeteren van het product en geef je die elk jaar een gratis apparaat.

Hoef je ook niet op illegale wijze mensen af te luisteren.

Om deze reden koop ik geen slimme dingen. Ik word al moe van Siri, als ik haar nodig heb reageert ze niet en wanneer ik tv kijk of op discord zit met vrienden reageert die trut op alles...
Dus je geeft zelf al aan dat de huidige dataset te klein si (want Siri reageert onterecht), en daarom kom je tot de conclusie dat de dataverzameling met een factor 1000 omlaag moet?
Ja! Nou ik weet niet of de huidige Siri dataset te klein is. Ik weet alleen dat ze niet goed op mijn stem reageert; Hey Siri! En dan blijft het stil. Maar als Harry Potter op de tv is en Sirius Black genoemd wordt slaat ze aan.

Spraak-naar-tekst werkt ook niet altijd even goed bij mij, en ik heb een gewoon ABN accent.

Moet de dataset met een factor 1.000 omlaag. Poeh, goede vraag maar het absolute antwoord kan ik je hierop niet geven. Maar wat ik je wel zeg is dat consumenten niet zonder toestemming en vooraf geïnformeerd te zijn gebruikt mogen worden als een soort tweede generatie beta testers met allerlei privacyschendingen.
Ik weet vrij zeker dat er in de voorwaarden van google (die je zelf heb geaccepteerd bij t instellen van je google home/android telefoon) iets staat over gesprekken opnemen
Calibratie / verbetering kan ook gebeuren door onderzoek in een lab en door op grote schaal personeel hiervoor in te huren en gebruiken
Tja, Microsoft laat zien hoe goed dat werkt, die hebben een hoop personeel voor het testen van nieuwe patches.... en in de praktijk gaat er dus nooit iets fout.
Dat gaat nooit werken, iemand die betaalt wordt voor het "inspreken" weerspiegelt totaal niet de praktijk.
Wat mij betreft zou wat Google hier doet bij wet verboden moeten zijn. Er is een groot maatschappelijk belang om vrij, zonder opgenomen te worden, uitingen te kunnen doen.
Er is ook een groot maatschappelijk belang om vrij zelf te beslissen wat je met de persoonlijke data doet. Als ik er mee instem dat Google me "afluistert" wie ben jij dan om mij die vrijheid af te nemen?
Ik snap niet dat mensen echt geloven dat machines zelf leren wat alles betekent
Als je weet hoe het werkt is het duidelijk. Als je het niet weet dan is het net magie. Je kan mensen moeilijk kwalijk nemen dat ze niet weten hoe de geheime saus van Google werkt.
Ik zou niet weten hoe je dat op een andere manier zou kunnen doen dan naar de commando's te luisteren.
Dat is het probleem ook niet. Het probleem is dat mensen niet beseffen hoe ver hun toestemming wel niet gaat, en zonder een universitaire opleiding in AI én een in recht kun je dat eigenlijk ook niet van ze verwachten. Wat je al helemaal niet kan weten is wanneer zo'n apparaat per ongeluk begint op te nemen en hoeveel er dan wordt doorgestuurd.

De oplossing is heel simpel. Voeg een optie toe waarbij mensen zelf kunnen aanvragen om een fragment door een mens te laten controleren. Er is niemand die beter weet of een fragment goed is begrepen of niet dan de gebruiker zelf. Tevens kan die ook het beste beoordelen of dat fragment gedeeld mag worden of niet.
Dat zou een opt in scenario zijn neem ik aan? Dat lijkt me toch wel een cruciale overweging om spraakherkenning überhaupt te kunnen laten slagen. Ik snap dat er mensen zijn die het niet snappen. Maar is dat niet met heel veel dingen? Wat mij betreft gewoon een eenmalige melding ter informatie en de mogelijkheid om het uit te zetten.
Het is opt-in. Het probleem is dat niemand de voorwaarden leest voordat ze op ‘Ja’ klikken.
Dat zijn neem ik aan algemene voorwaarden die je bedoelt? Dan is het opt-in in de vorm van, wel of niet gebruik kunnen maken van het apparaat of de dienst.
Nee. Op het moment dat ik voor het eerst Siri activeerde werd me uitgelegd dat wat ik tegen Siri zeg opgenomen wordt, naar Apple servers verstuurd wordt, dat het daar enige tijd opgeslagen wordt en dat het kan gebeuren dat delen langer bewaard worden en door mensen beluisterd kunnen worden voor ‘verbeteringen’ aan het product.

Google zal daar niet minder licht mee omgaan en je dat even duidelijk uitleggen.

Is het hun schuld als jij later gaat lopen janken dat je voorwaarden niet gelezen hebt?
Dat is, zeker in het geval van Google, echt de fout van de gebruikers.

Je kan veel zeggen over Google, maar hun voorwaarden en andere documenten zijn vaak heel toegankelijk en goed leesbaar geschreven.

Daarnaast krijg ik, in ieder geval, regelmatig de vraag om mijn veiligheids- en privacy instellingen te controleren.
Een hele A4 pagina met tekst of melding in assistant. ‘Door deze optie te activeren worden mogelijk uw actieve als passieve zoekopdrachten door derden beluisterd. Wilt u doorgaan?’

Dat is teminste duidelijk in 1 zin wat we gebeurt met een duidelijke ja/nee vraag
Ik ben het compleet met je eens, maar het moet wel een goede UX blijven, wil je een soort feedback knop of commando toevoegen. Heb je ook een idee hoe dit zou werken zonder dat iedereen gelijk opt-out? Want ik denk dat de grote voicebot spelers hierom het maar in de kleine lettertjes hebben gezet.

[Reactie gewijzigd door bobberg op 1 augustus 2019 18:55]

Als iedereen opt-out dan betekent dat dan toch dat dat is wat iedereen wil. Niet?

En eigenlijk hoort het opt-in te zijn. M.a.w. als niet iedereen opt-in, dan betekent dat dat niemand het wil.

Als Google dan graag onderzoeken doet, dan moet Google maar mensen overtuigen om te opt-innen.

En dus niet andersom.
[...]

Als je weet hoe het werkt is het duidelijk. Als je het niet weet dan is het net magie. Je kan mensen moeilijk kwalijk nemen dat ze niet weten hoe de geheime saus van Google werkt.


[...]
Het is geen geheime saus van Google. Geen enkel autonoom product leert zichzelf het juiste aan. Daar zijn altijd mensen bij betrokken. Iemand moet een computer zeggen wat goed en fout is. Welk product je ook koopt, er zitten altijd mensen achter die het werk controleren totdat het uitontwikkeld is. Gezien spraaksturing zeker geen uitontwikkeld product is weet je dat er mensen zijn die controleren.
Jij en ik weten dat. Minder technisch aangelegde mensen niet ;)
De oplossing is heel simpel. Voeg een optie toe waarbij mensen zelf kunnen aanvragen om een fragment door een mens te laten controleren. Er is niemand die beter weet of een fragment goed is begrepen of niet dan de gebruiker zelf. Tevens kan die ook het beste beoordelen of dat fragment gedeeld mag worden of niet.
Een nog veel eenvoudigere oplossing is dat de Google Assistent aan de gebruiker zelf vraagt om duidelijk te maken wat met een bepaald audio fragment bedoeld was. Bv. zodat hij via een website van het toestel een lijst krijgt met fragmenten die onduidelijk waren. Zodat de gebruiker zelf de transcriptie kan maken.

Met daarbij dan de optie: "ik wil dat anderen dit voortaan voor mij doen" en "ja laat maar, dan weet Google het maar niet wat ik bedoelde (dat dan ook als default ingesteld staat)".

ps. Bij kennissen die zo'n Google Assistent hebben vraag ik trouwens altijd waar dat ding staat en/of het uitgeschakeld kan worden wanneer ik in de buurt ben. Ik vermijd absoluut gesprekken in de buurt van zulke toestellen. M.a.w. mensen die zulk toestel in huis halen veroorzaken dat bepaalde gasten die hen bezoeken minder zullen spreken en/of minder sociaal zullen zijn.
Ik snap niet dat mensen echt geloven dat machines zelf leren wat alles betekent. Dat wordt door mensen geïnterpreteerd zodat de algoritmen daar van kunnen leren. Ik zou niet weten hoe je dat op een andere manier zou kunnen doen dan naar de commando's te luisteren.
Ik zou daar wel eens het bewijs voor willen zien dat dat leren alleen op die manier kan. Er zijn werkelijk ontelbare audio-opnames voorhanden, dagelijkse journaals, radioprogramma's, podcasts, historische opnames, noem maar op... werkelijk te veel om er zelfs maar een overzicht van te hebben. Als ze daar hun leeralgoritmes op los zouden laten heb je zowat elke mogelijke betekenis van elk mogelijk woord in elke mogelijke taal ter beschikking. Wat heeft het zinnetje "schat, breng je straks een brood mee?" die de buurvrouw in haar telefoon roept dan nog voor toegevoegde waarde?
Denk dat openbaar beschikbaar materiaal niet voldoende zal zijn om alles te kunnen interpreteren. Iedereen spreekt anders. Accenten, klemtoon, etc. Sommige mensen spreken onduidelijk.

Bovendien denk ik wel dat openbaar geluidsmateriaal ook wordt gebruikt. Maar men spreekt toch net wat duidelijker als je het bewust voor andere mensen inspreekt.

En dan ook nog achtergrondgeluiden. Muziek etc. Daar moet ook doorheen geleerd worden. Of 2 mensen tegelijk praten. De tv op de achtergrond met iemand die het nieuws presenteert..
Alles wat je opnoemt is ook al lang beschikbaar in openbare - en dus privacyvriendelijke - opnames. Accenten, klemtonen, onduidelijk gebrabbel, achtergrondgeluiden... je vindt het ook allemaal in het gemiddelde interview in het ochtendjournaal - om maar wat te noemen. Als het echt alleen om de geluidsopnames gaat heb je sowieso meer aan een interview van tien minuten dan aan het 30 seconden durend telefoontje van de buurvrouw.

Reken maar dat "onze spraaktechnologie verbeteren" niet de enige reden is dat Google en consorten je afluisteren.
Je maakt al een fout...Google luistert niet af. Ze laten opgenomen opnames analyseren, dat is een heel groot verschil.

Dat ze die analyse niet alleen voor spraaktechnologie gebruiken is logisch en zelfs gewoon bekend...Dus welk punt je nu wilt maken?
Opgenomen opnames van ingesproken tekst analyseren zonder medeweten of toestemming van de betrokkene lijkt toch verdomd veel op afluisteren als je het mij vraagt. Of geloof je echt dat degene die dergelijke opnames 'beluistert/analyseert alleen maar naar de fonetische klanken 'luistert ? Zo naïef ben je toch niet echt hè?
Hier hoeven we niet over te speculeren. Er ís inderdaad zo'n openbare dataset.

Alleen, ik denk dat er daartegen precies dezelfde bezwaren heersen - die set is de Google AudioSet. 2 miljoen geluiden, stuk voor stuk door mensen geannoteerd.
Ik zou niet weten hoe je dat op een andere manier zou kunnen doen dan naar de commando's te luisteren.
Door ze naar alle Nederlandse TV zenders en radio uitzendingen te laten luisteren misschien?
Leek me niet meer dan duidelijk dat ze de opnames daarvoor gebruikten. Hoe maak je anders een goede voicebot? Wel goed dat ze de opt-out hebben toegevoegd.
Via opt-in.
Laat mensen zelf maar aangeven wanneer een fragment niet goed is begrepen. Dan kun je ze nog eens extra waarschuwen dat er een mens naar het fragment gaat luisteren als ze dat insturen.

Het probleem is namelijk vooral dat er op de achtergrond dingen worden opgenomen zonder dat de eigenaar weet dat het apparaat actief is.
Je veronderstelt nu een zwart-wit beeld. Een geluid is wél of niet goed begrepen. Alleen: alle moderne AI geeft een analoge uitkomst, bijvoorbeeld 0.85. Dat is niet eens een 85% kans dat het goed geinterpreteerd is, het wil alleen zeggen dat het zekerder is dan een 0.84 uitkomst.

Als Apple zijnde wil je dus je False Positive/False Negative ratio verbeteren door je grenswaarde te optimaliseren. Dat vereist dat je geluiden verzamelt in de omgeving waar je denkt dat die grens ligt.
Je veronderstelt nu een zwart-wit beeld. Een geluid is wél of niet goed begrepen. Alleen: alle moderne AI geeft een analoge uitkomst, bijvoorbeeld 0.85. Dat is niet eens een 85% kans dat het goed geinterpreteerd is, het wil alleen zeggen dat het zekerder is dan een 0.84 uitkomst.
Vanuit de gebruiker is het wel zwart-wit. Die krijgt het gewenste resultaat of niet.
Als Apple zijnde wil je dus je False Positive/False Negative ratio verbeteren door je grenswaarde te optimaliseren. Dat vereist dat je geluiden verzamelt in de omgeving waar je denkt dat die grens ligt.
Ik snap wel waarom ze dat willen, net zoals ik wel gratis geld zou willen krijgen en iedere dag vakantie, maar dat gaat niet. Ze zullen een andere oplossing moeten bedenken. Ze zouden mensen kunnen betalen om met een microfoon rond te lopen (als werk).
.

[Reactie gewijzigd door CAPSLOCK2000 op 2 augustus 2019 09:54]

Eigenaren weten heus wel dat hun Google home altijd luistert. En opt in zal er voor zorgen dat niemand toestemming verleent. Of veel te weinig mensen om deze techniek te kunnen verbeteren zodat iedereen verstaan kan worden.
Google home (en de versies van de concurrentie) luistert niet altijd mee.
Pas na het roepen van het juiste commando gaat er een dataverbinding open.
Het is wel zo dat zo nu en dan het ding denkt dat er een commando geroepen is, maar dat is dan niet zo.
Dus, luistert ie nu wel of niet altijd mee? Wat is het nou? Hoe 'hoort' het device nu wanneer het magische woord uitgesproken wordt? Door continu te luisteren of dat ene woord, of iets dat er op lijkt, uitgesproken wordt. Ergo sum, het device luistert altijd. En als deze dat toch doet is alles wat er naast het magische woord wordt gesproken ook wel handig om te weten. Wie weet kan er nog een aanbieding voor het een en ander gedaan worden.
Ja maar tijdens het luisteren naar het magische woord stuurt het device geen data, dat zegt ie toch! Dat Google wanneer ze maar willen nieuwe firmware erop kan flashen waarbij dat misschien verandert, daar praten we niet over...
Denk je nou echt, dat het apparaat zelf de woorden herkent?
Daarvoor gebruikt het ook de AI in de cloud.
Ga voor de gezelligheid maar eens permanent het data verkeer van zo'n "assistent" bekijken en analyseren, vooral, als je niet het "magische woord" hebt geroepen.

Rinaldootje zet zijn alu hoedje weer op
Mwa ik geloof best dat ie zonder data woorden kan herkennen, ja. Vroeger bestond er ook al speech recognition software dat offline werkte.
Zoals ik al zei: heb je al eens gemeten/geanalyseerd?
Ik wel, alles gaat (encrypted) naar de cloud...
Nee dat heb ik niet, want ik zou zo'n apparaat nooit in huis nemen.
Het is opt-in, tijdens de installatie is er een optie om Google anonieme gegevens te versturen om hun dienst te verbeteren, als je die uit laat staan, dan zal Google deze niet verwerken.

Dat probleem dat er dingen opgenomen worden zonder dat de eigenaar weet dat het actief is, is namelijk een zeer goede kandidaat om geanalyseerd te worden, zodat Google hun offline algoritme/firmware kan verbeteren zodat die Home dit bij een volgende update lokaal kan herkennen als een false positive.
Het probleem is namelijk vooral dat er op de achtergrond dingen worden opgenomen zonder dat de eigenaar weet dat het apparaat actief is.
Bron?
Dat gebeurt...eigen ervaring...Punt is dat een Google Home soms "denkt" dat het hotword gezegd wordt, ook al is het niet zo. Dat komt met name voor als er woorden worden gezegd die de klank "oe" bevatten(op TV bijvoorbeeld). M.a.w. dingen die lijken op "Hey (of OK) Google".

Op dat moment wordt de GH geactiveerd en vanaf dat moment wordt dus van alles opgenomen. Ik weet dat, snap dat en vind het ook niet erg. Ik heb dat "ingecalculeerd" bij mijn aanschaf.
Dat is dus niet "zonder dat de eigenaar het weet" want je ziet het.
Maar dit is het probleem
Er wordt ook genoeg verstuurd zonder het hotword.
Het kunnen wel onschuldige verhalen zijn, maar t gaat erom dat er wordt meegeluisterd

En je kan wel je google home stekker eruit trekken
Maar je heb altijd je telefoon nog (:

Dus er zijn 2 opties
1. Op een berg leven zonder enige vorm van technologie
2. Accepteren dat t zover gekomen is
Weten als in “bewust zijn” denk ik. Als de verhalen kloppen, dan denk ik niet dat de betrokken zich altijd bewust waren dat sommige zaken zijn opgenomen, laat staan dat ze weten dat die ook nog eens worden doorgestuurd en beluisterd door derden.

Persoonlijk vind ik het ook vervelend om te weten dat sommige vrienden of collega’s zo’n ding in huis hebben. Ik wil helemaal niet dat iemand me afluistert tenzij ik daar expliciet toestemming voor geef. Het is net zoals bijvoorbeeld Facebook die mijn telefoonnummer heeft geplukt uit de contactenlijst van mijn vrienden en collega’s die ongevraagd mijn privacy schenden...
Het is algemeen bekend, dat bots nu niet de juiste grammatica van het Nederlands beheersen, maar als men van de mensen wil leren hoe het dan wel moet, mag men dat NOOIT doen zonder dat deze mensen dat weten.
En dan komt er nog bij (ik ben een dinosaurus van 77 jaar), dat het gros van de Nederlanders van tegenwoordig zeer weinig beheersing over hun eigen taal heeft. Ik noem hier alleen maar de verwerking van d of dt, waar zeer velen moeite mee blijken te hebben.
Dus zorg, dat de vertalers weten hoe iets in het Nederlands gezegd wordt en laat de medewerkers weten dat het dankzij HUN hulp is.
Als je de AI wil trainen met Nederlands kun je ze ook naar de Nederlandse TV (inclusief de regionale zenders) laten luisteren. Daar hoef je echt niet mensen voor af te luisteren.
Een TV programma is toch echt heel anders denk ik dan een persoon die commando's wil geven aan een Google Home apparaat. Maar je zou er zeker een stuk verder mee komen.
Inderdaad, het is wellicht wat kort door de bocht, maar het zou helpen. Vooral regionale omroepen voor alle accenten en dialecten. Toch zul je altijd ondervertegenwoordiging hebben voor een bepaalde groep en dat kan je waarschijnlijk enkel trainen.

Toch denk ik dat er ook een middenweg in te vinden is. Als Google traint om je stem te herkennen, waarom dan niet om je commando's te herkennen, zonder dat dit toegepast hoeft te worden voor de gehele samenleving en daarom mensen aan de pas komen?
Veel programma's worden ondertiteld, dus dat is relatief makkelijk te implementeren.
Beheersing van de Nederlandse taal staat niet geheel direct in relatie tot het juist interpreteren van wat een stuk tekst probeert te vertellen. Daarbij zeggende dat er ook teksten zijn die wel heel erg geschreven zijn naar niveautje "jurist". Als een introducerende of waarschuwende tekst door iedereen gelezen en begrepen moet worden, mag dat prima à la "Jip en Janneke"-taal zijn, met verwijzing naar de officiële, juridisch dicht gebouwde bepaling(en.)
Maar mensen hebben toch gelezen wat in de EULA staat?
Blijkbaar niet en sowieso staat die niet boven de wet.
Veel internet-giganten lappen de publieke mening aan hun laars, de mensheid wil toch bedrogen worden?
Zoveel sites die ik bezoek hebben hun eigen interpretatie over privacy, en de meeste mensen blijven dan alsnog reageren zonder eerst te lezen wat er staat.
Gezond verstand is een eerste vereiste, maar als ik dan zie dat bij een negatieve daad van de een of andere site er nog steeds mensen zijn die geen bezwaar maken of het maar op zijn beloop laten ga ik heel erg twijfelen aan de intelligentie van het kuddedier mens.
Ik heb altijd geleerd dat Nederlands voor buitenlanders erg moeilijk te begrijpen is, omdat onze grammatica en zinsbouw wezenlijk afwijkt, maar tot nu toe heb ik zeer weinig sites ontdekt die moeite doen het te begrijpen.
Dat is net als films waarin men mensen talen laat spreken die door de juiste mensen zouden moeten worden gesproken, met als resultaat dat deze talen door de mensen die er mee zijn opgegroeid niet te verstaan zijn.
Maar zolang er mensen zijn, die laten zien hier geen moeite mee te hebben, zal hier nauwelijks iets aan veranderen.
Intelligentie of gewoon luiheid?

Beter verwoord van mijn kant, hoop ik: Een deel van de argumentatie ervaar ik als vreemd. Het ligt niet aan de intelligentie, maar het kan simpelweg zijn: de moeite niet nemen het te lezen, het niet boeiend vinden van privacy (want wij hebben niks te verbergen toch? TOCH?) of gewoon erboven staan en weten dat de echt belangrijke dingen met een beetje moeite wel verborgen blijven.

Bovendien, "gezond verstand" is slechts een moment-opname, wat is passend gedrag (ofwel in de volksmond "boerenverstand") in de huidige tijdsgeest?

Eens: internet-giganten "don't care", absoluut.

[Reactie gewijzigd door SkyStreaker op 1 augustus 2019 21:30]

Ik dacht op @E.p.Huigens te reageren, maar doe het maar gewoon bij jou want jij maakt het nog een stukje erger.

Het is dus een gebrek aan intelligentie of ik ben lui omdat ik het niet erg vind dat Google mij hoort zeggen dat het licht in de woonkamer aan moet? Of als ik vraag hoe warm het morgen wordt?

Ja, inderdaad, ik zie mijn Google hier soms ook plots luisteren als hij iets verkeerd interpreteert als 'ok google'.
Heb ik daar problemen mee? Nee. Had ik daar wel problemen mee, dan ging het ding gewoon de deur uit...

Ik zou het dus leuk vinden moest je misschien mensen wat minder beoordelen op wat JIJ denkt dat hun probleem is.
Mijn reactie was eigenlijk puur om hem gericht en niet bedoeld als waardeoordeel naar jou of enig ander iemand naast Huigens. Ik zal dat eens even een stuk beter verwoorden. Hierbij ben ik wel van mening dat jij je wel heel erg aangevallen voelt en mogelijk de boel iets uit de context trekt wegens mijn gebrek aan context.
Sorry, het kwam inderdaad misschien iets agressiever over dan ik het wou.
Maar ik ben het gewoon wat beu dat er steeds maar weer gezegd wordt dat mensen met een Google-apparaat (of Amazon) in huis niet weten wat ze doen en 24/7 afgeluisterd worden, etc...

Het is allemaal lang en breed in het nieuws geweest. Het is dus gewoon je eigen keuze om te beslissen of je 0.01% van je gesprekken door Google wil laten beluisteren. En dat misschien 10% daarvan onbedoeld verstuurd werden neem ik er gerust bij.
Dat is je goed recht. Wat wel een belangrijk iets is om hier bij te melden denk ik, is dat dit volgens het nieuws naar voren kwam dat er veel andere mensen die zo'n smart speaker ding hebben zich er niet bewust van zijn dat ze afgeluisterd kunnen worden. En dat is potentiaal best wel gevaarlijk vind ik. Mensen zijn er dus niet bewust van dat tech bedrijven (Google, Amazon, MS, Apple etc) van alles en nog wat kunnen opnemen (de speakers worden weleens onbedoeld getriggered of door iemand anders in de ruimte); potentieel gevoelige informatie kan dus relatief onopgemerkt bij deze partijen terecht komen wat in principe misbruikt kan worden (nu of in de toekomst).
Hetzelfde geld natuurlijk voor bijv mobiele telefoons, hoewel je daar de microfoon permissies wel kan weigeren.

[Reactie gewijzigd door ochhanz op 1 augustus 2019 23:39]

Het stomme aan het hele verhaal is dat de documentaire vol staat met voorbeelden die vrijwel zeker niet zijn opgenomen door Google home speaker. Er wordt namelijk steeds genavigeerd en in de regel ga je thuis niet met je speaker navigeren... De documentaire vergeet blijkbaar dat die Google assistant ook gewoon in je smartphone zit. Dat is waar ongetwijfeld die opnames vandaan komen. Waarom wordt dit steeds op die speakers gegooid?

Heb jij overigens ooit een toestemming popup gekregen voor Google assistant op je telefoon? Ik niet namelijk.
Dat zou kunnen (hoewel ik ook over voorbeelden las van ouders die ruzie maakten oid), echter denk ik dat het wel goed is als smart speakers ook in de schijnwerpers staan. Ze hebben betere microfoons (die meer bereik hebben) en zitten niet een groot deel van de tijd in je broek dus kunnen ze geluid helderder opnemen (lijkt mij tenminste). In die zin hebben telefoon gebruikers zich zelf er meer mee qua privacy terwijl smart speakers potentieel iedereen beter kunnen opnemen in de ruimte (dus ook visite oid).

Ik heb de laatste paar jaar een Windows Phone gehad :+ dus geen idee over google assistant popups.
In tegenstelling tot de telefoon geeft een speaker als de google home (mini) via lampjes aan dat hij aan het luisteren is. Zeker in de context van bijvoorbeeld een donkere slaapkamer is dat niet te missen. Voor paranoia visite wordt dat de boxjes goed in de gaten houden :+ .
Ik heb er wel wat op tegen dat een "slimme speaker" soms per ongeluk het codewoord denkt te verstaan en dan vrolijk alle gesprekken (of andere geluiden) opneemt en doorstuurt. Je hebt ook nog eens geen enkele keuze of jouw "commando's" door mensen beluisterd gaan worden. Naar mijn mening hoort zo'n speaker dat netjes te vragen als een commando niet begrepen wordt.

Ik vind die dingen toch al eng. Wie garandeert je dat de firmware niet zomaar wordt ge-update en dat zo'n ding gewoon 24/7 luistervinkje staat te spelen?

Voor mij geen Google Assistant of Siri op de telefoon en er komt geen slimme speaker in huis!

Niet dat ik iets te verbergen heb, maar met wat ik thuis doe heeft niemand verder iets te maken, ook de tech-giganten niet.
Er is een heel duidelijke opt-out als je niet wilt dat jouw opnames beluisterd worden. Is er bij mijn weten ook altijd al geweest.

Niemand garandeert dat het ding niet stiekem gaat luistervinken. Maar als Google (of Apple/Amazon) dat zou doen is dat in no time publiekelijk bekend en kan betreffend bedrijf de biezen pakken wat betreft de digitale assistent. De tech giganten hebben er dus absoluut geen enkel belang bij om zoiets te doen. Het levert ze weinig tot niks op en de kans op gigantische en zeer kostbare imagoschade is 100%. En dus is er niks engs aan deze apparaten, zo lang je gewoon even leest hoe ze werken en met welke voorwaarden en daar vervolgens wat gezond verstand op los laat.

Iedereen heeft dingen te verbergen, ik ook (al zou ik zo niet weten wat), desondanks staat bij mij al jaren een Google Assistant in huis, en inmiddels zelfs meerdere exemplaren.
Is dit vergelijkbaar met een telefonische helpdesk die vooraf meldt: "Dit gesprek kan worden opgenomen voor trainingsdoeleinden"?
Laatst had ik er een die was heel netjes, die vroeg of ze mochten opnemen, maar zonder actie beller deden ze dat niet.
+1Anoniem: 498327
1 augustus 2019 22:35
Ik vraag me ook wel eens af wat Google met Youtube films doet. Die worden automatisch voorzien van ondertitels (die nergens op lijken), maar ik vraag me af of ze mijn handmatige titels koppelen aan audiospoor en zo hun AI trainen. Ik zoek nog steeds de optie om dat automatisch vertalen uit te zetten.
Is het niet mogelijk om Google home lokaal te gebruiken voor alleen domotica?

Dan maar geen verbinding meer met het internet.
Nee, de 'rekenkracht' zit in 'de cloud'.

Zou best offline te doen moeten zijn zou ik zeggen.
Software die stemmen herkent bestaat al vele vele jaren (natuurlijk niet zo goed als de huidige diensten, maar toch)
"Ondertussen bekijken we hoe we nog duidelijker kunnen maken wat we met gegevens doen om onze spraaktechnologie te verbeteren", schrijft het bedrijf.
Zou haast denken dat dat niet meer nodig zou zijn na al die heisa, maar blijf me soms toch verbazen over de (willende) onwetendheid van techniek en computertechniek in het bijzonder.
Niemand krijgt vat op privacy bij al die bedrijven.

Dit moet centraal geregeld worden en individuele gebruiksovereenkomsten of eula's moeten aan banden gelegd worden of verboden worden.

Het slaat nergens op dat je een rechtsgeleerde moet zijn om die dingen te doorgronden.
Ik lees ze altijd door.... niks ingewikkeld aan en ik ben echt geen rechtsgeleerde.
Ik wist dus ook al sinds dag 1 dat opnames gebruikt konden worden voor analyse om de techniek te verbeteren.
Het enige waar ik mij rond deze ophef over verbaasd heb is de massale verontwaardiging van mensen dat Google iets doet dat prima uitgelegd is in de voorwaarden én bij de smart speakers ook nog expliciet en met opt-out vermeld wordt bij de installatie....
Na dat lek ontstond veel ophef onder gebruikers die vaak niet doorhadden
Daarbij helpt het natuurlijk niet dat uitgerekend VRT in het nieuws reclame staan te maken voor de nedelandstalige Google assistent zonder enige kritische noot. Het zou hun eerder sieren van eens de alternatieven van Google producten toe te lichten.

Op dit item kan niet meer gereageerd worden.


Apple iPad Pro (2021) 11" Wi-Fi, 8GB ram Microsoft Xbox Series X LG CX Google Pixel 5a 5G Sony XH90 / XH92 Samsung Galaxy S21 5G Sony PlayStation 5 Nintendo Switch Lite

Tweakers vormt samen met Hardware Info, AutoTrack, Gaspedaal.nl, Nationale Vacaturebank, Intermediair en Independer DPG Online Services B.V.
Alle rechten voorbehouden © 1998 - 2021 Hosting door True