Smart Compose in Gmail krijgt later functie om eigen taalgebruik te emuleren

Smart Compose in Gmail, een functie om te gokken wat mensen willen schrijven in een mail en dat als optie in te vullen, krijgt later een optie om eigen taalgebruik te emuleren. Op die manier moeten de suggesties persoonlijker worden.

Het team achter Smart Compose noemt dat 'personal language models', blijkt uit een blogpost van Google. Het is nog onbekend wanneer de functie in Smart Compose zal komen, Google zegt alleen dat het team eraan werkt om dat te integreren. Verdere uitleg over de nieuwe functie ontbreekt, behalve dat het 'ontworpen is om preciezer de schrijftstijl van een individu te emuleren' en dat in het systeem te verwerken.

Google kondigde de autocomplete-functie voor e-mail vorige week tijdens ontwikkelaarsconferentie I/O. De functie werkt in elk geval in het Engels, maar in de blogpost verwijst de zoekgigant specifiek naar dat het systeem moet werken voor alle 1,4 miljard Gmail-gebruikers. Daardoor lijkt het erop dat Smart Compose in alle door Google ondersteunde talen zal werken.

De blogpost legt verder uit dat Smart Compose suggesties voor autocomplete moet laten zien binnen honderd milliseconden om ervoor te zorgen dat gebruikers tijd besparen door de functie. Bovendien was het trainen van het algoritme complex, omdat ze geen toegang hadden tot e-mails van gebruikers en dus andere uitingen van taal moesten gebruiken om het algoritme te trainen. Daarnaast hechten de ontwikkelaars aan het voorkomen van genânte situaties door een bias in de suggesties, door bijvoorbeeld ongewenste zaken voor te stellen via autocomplete. Smart Compose moet later deze maand beschikbaar komen voor alle Gmail-gebruikers.

Gmail Smart Compose (Google I/O 2018)Gmail Smart Compose (Google I/O 2018)

Door Arnoud Wokke

Redacteur Tweakers

16-05-2018 • 20:16

27

Reacties (27)

27
26
21
6
0
0
Wijzig sortering
Leuk hoor, maar er zit een schaduwkant aan. Je schrijfstijl zegt enorm veel over je, en deze feature moet terugverdiend worden. Dus wordt wat je schrijft waarschijnlijk ook geanalyseerd op:

- Sentiment: gebruik je positieve woorden? Ben je een blij mens?
- Emotie: in welke stemming is deze persoon? Of ben je zelfs suicidaal?
- Zijn de dingen die je zegt geregeld objectief correct? Of lieg je veel? Of ben je goedgelovig?
- Woordenschat: hoe intelligent is deze persoon? Heeft deze persoon doorgestudeerd?
- etc etc

Die data wordt ook echt niet alleen gebruikt om je betere advertenties te laten zien. Een groot deel van het geld dat in de data economie wordt verdient zit in de verkoop van 'risk management' producten. Dus dit soort data komt uiteindelijk als 'nog net vaag genoeg om geen persoonsgegeven te zijn' afgeleide score bij je toekomstige werkgever, verzekeraar, bank of politicus terecht.

Er zijn al browser plugins die je taalkgebruik proberen te verbeteren zodat ze er naar de algoritmes toe beter uitziet. Het is ook geen gek idee om ook de sociale media uitingen even door deze tool te halen voordat je iets post.
"Wellicht suicidaal" noem je "vaag genoeg om geen persoonsgegeven te zijn"?!

Het is een medisch gegeven, dat is de meest beschermde categorie persoonsgegevens. De verantwoordelijk Data Protection Officer krijgt meteen een hartaanval als die dat ziet; dat wordt rapporteren aan de overheid en hopen dat de boete meevalt omdat je jezelf vrijwillig meldt.

En Google kan uiteraard niet die data in het geheim verzamelen én delen met alle werkgevers, verzekeraars, banken en politici. Dat is niet wat het woord "geheim" betekent.
Nee, databrokers leiden een reputatie score af. Zoals Cambridge Analytica een psychologische (ocean) score maakte. In de VS is het makkelijker om per persoon een score te maken, in de EU is dat inderdaad moeilijker. Hier maak je dan een score als "Emmastraat 1-5 heeft een hogere negatieve levensuitzichts index". In NL is iets een persoonsgegeven als het tot minder dan 10 mensen te herleiden is.

Google deelt/lekt op allerlei manieren data, bijvoorbeeld bij het bieden op advertenties.

Belangrijk om te begrijpen is dat het dus niet zo zwart wit is als mensen denken. Door ergens een score van te maken, door het naar net iets meer mensen te laten wijzen, dat zijn een paar truukjes om gevoelige informatie over mensen te delen zonder dat het technisch gezien een persoonsgegeven is.
Ik heb het net aan de gang gekregen in mijn Gmail..

- Geswitched naar nieuwe Gmail versie
- Taal op Engels(US) ingesteld
- Onder general settings "Experimental Access" aangevinkt > Save
- Pagina ververst, en toen onder general settings "Smart Compose" aangevinkt > Save

Ik ben niet erg onder de indruk.. Alleen als ie 99% zeker weet wat je gaat zeggen, doe hij een suggestie..
Alsof hij de top 100 meest gebruikte zinnetjes in een email kan auto-completen.

Ik kreeg de volgende suggesties:
- Happy birthday
- It was nice to meet you
- See you soon
- Talk to you soon

Voor de rest kreeg ik geen enkele suggestie.. Heb 5 minuten geprobeerd zinnen te starten, maar hij maakte niks af zoals in deze demo getoond word.

Om dit Artificial Intelligence te noemen gaat erg ver.. Ik zou dit zelf in een avondje in elkaar kunnen zetten met javascript & php.
Maar he, mail jij de afgelopen tijd in het Engels? Zo niet, dan is het logisch dat er weinig te voorspellen is.
Yes, ik mail in 99% van de tijd in het engels.
Wanneer features zoals SmartCompose en ook Duplex gemeen goed worden, denk ik dat onze huidige gewoonten van digitaal communiceren niet langer meer blind te vertrouwen zullen zijn. Je kan nooit meer met zekerheid zeggen of het bericht daadwerkelijk van de persoon komt, of zijn apparatuur. Met deepfakes zijn ook video boodschappen niet langer absoluut betrouwbaar.. Moet dan elke vorm van digitale communicatie in een soort blockchain worden opgenomen om te waarborgen dat de oorsprong van het bericht authentiek is? Dat je met het toevoegen van een wachtwoord (of andere authentication) aan de hash kan garanderen dat er met de communicatie van a naar b niet mee geknoeid is?
Kunnen we ophouden bij alles blockchains te noemen? Alles wat je nodig hebt is een simpele cryptografische handtekening (private key voor iedereen) en klaar.
Inderdaad. Blockchain wordt tegenwoordig voor van alles toegepast, maar vaak volstaat een veel simpelere oplossing ook. Helaas kun je geen kickstarter ICO starten met een simpele oplossing..

(@Veronnix)
Je kan nooit meer met zekerheid zeggen of het bericht daadwerkelijk van de persoon komt, of zijn apparatuur.
Dat kon vroeger ook al niet. Je weet nooit zeker of die brief die je ontvangen hebt wel echt van je baas kwam, of misschien was het toch z'n assistent. Of misschien wel je buurman, die zelf de brief in je brievenbus stak.

Het verschil is dat die assistent nu digitaal wordt, en we cryptografische handtekeningen gebruiken om te controleren of bepaalde mailservers wel berichten van een bepaald e-mail adres mogen verzenden (om vervelende buurmannen uit je brievenbus te houden).
Moet dan elke vorm van digitale communicatie in een soort blockchain worden opgenomen om te waarborgen dat de oorsprong van het bericht authentiek is? Dat je met het toevoegen van een wachtwoord (of andere authentication) aan de hash kan garanderen dat er met de communicatie van a naar b niet mee geknoeid is?
Je bedoelt een Hash genereren van je Message om zo een Authenticatie Code te genereren waarmee het bericht geverifieerd kan worden? Dat heet HMAC. Daar heb je geen blockchain voor nodig. Immers hangt de authenticiteit van jouw bericht niet af van alle berichten die daar voor verstuurd zijn en is het niet nodig dat de hele wereld jouw e-mail gaat verifiëren. Dat hoef je alleen zelf te doen (of door je e-mail client te laten doen).

Als je je e-mail verkeer wil gaan beveiligen, moet je eens naar PGP kijken. Dat is een standaard protocol om je e-mail te versleutelen en/of ondertekenen met public-key cryptografie.

TL;DR: Jij versleutelt berichten met de public key van de ontvanger, en ondertekent ze met je eigen private key. De ontvangen kan ze ontsleutelen met zijn eigen private key en jouw handtekening verifiëren met jouw public key. En daar komt geen blockchain bij aan te pas. Gewoon ouderwetse, simpele cryptografie :)

[Reactie gewijzigd door Laloeka op 26 juli 2024 14:27]

Om eerlijk te zijn: dit is nu juist een situatie waarin de blockchain wél relevant kan zijn.

Uiteraard niet voor het uitwisselen van berichten, veel te inefficient. Maar het klassieke probleem van cryptografie uitrol is public key exchange. En laat dat nu precies zijn waar de blockchain goed in is: openbaar, kleine datavolumes maar hoge mate van betrouwbaarheid en non-repudiation. Een paar miljard keys uitwisselen gaat prima.
Feit blijft dat cryptomining uiterst energie inefficiënt is, om maar een voorbeeld te noemen, en systeem als dns of een keyexchange werkt daar ook prima voor
Stel je eens voor dat je voortaan kunt inloggen met je digiD om daar je pubkey te registreren samen met je online contact gegevens. Die worden vervolgens met je bsn in een database ter beschikking gesteld waardoor bsn voortaan een referentie is en niet meer een identificatiebewijs

Vervolgens moet je om je bij diensten te identificeren denk bank, uwv, gemeente, belasting, zaken ondertekenen met je private key. En klaar is kees

Een grote nationale databank lees BRP+ met wat extra gegevens en je hebt in potentie een stuk minder fraude omdat niemand (zelf de overheid niet) de key weet waarmee jij stukken ondertekent

[Reactie gewijzigd door i-chat op 26 juli 2024 14:27]

Het was altijd al mogelijk om iemands account te hacken en nepmail te sturen
Taalbarrières hebben daar nauwelijks effect op gezien de honderden mensen die in de mails uit Nigeria trappen
En sleutels gaan ook niet werken want wie bewaard ze of vertaald jou paswoord in een volwaardig keypair
Lekken en kwetsbaarheden te over
Al met al is dit geen nieuw probleem e behoeft denk ik ook gen nieuwe oplossing

[Reactie gewijzigd door i-chat op 26 juli 2024 14:27]

Anoniem: 310408 @Veronnix16 mei 2018 21:03
Vanaf 1995 kan je ervan uitgaan dat een goed deel van de vragen die je per mail of telefoon stuurt aan een grote firma beantwoord door een stuk software. In het begin door een goedkope kracht in een lage loon land die oplas wat er op papier stond , en nu steeds meer door een computer die goed genoeg is om je te begrijpen. Als dat je verbaasd ben je geen tweaker.

Ik zie daar geen probleem in. 90% van de mails die wij krijgen zijn vragen. "Is dat en dat compatible met win10?". In mijn ervaring is ons zeer dure software systeem sneller, beleefder en meer accuraat dan een persoon. Hoe meer automatisering hoe hoger klant tevredenheid. Werkelijk waar. Snelheid is alles.

Als jij een mail stuurt wil je dan een antwoord of de garantie dat het een mens is die antwoord geeft? Als jij aan Alexa iets vraagt denk je dan dat er iemand heel snel zit te Googlen om antwoord te geven? Net wilde ik weten wanneer Bladerunner uitgegeven werd dus roep ik ' Hey googoo, when was bladerunner released?" Ik prefereer dat Google antwoord gaf en niet een mens.
Nee. Men zal moeten accepteren dat er geen zekerheid is in het leven. Zoals alle generaties voor ons ook hebben gedaan.

[Reactie gewijzigd door Origin64 op 26 juli 2024 14:27]

Het gaat om het antwoord dat je krijgt, niet om wie het schrijft. Toch?
Mijn taalgebruik is niet emuleerbaar - elke AI wordt IA dankzij mijn onvoorspelbaar karakter. Hoe zou dat werken bij Trump eigenlijk? :+
Hoe zou dat werken bij Trump eigenlijk? :+
Als ik "AI" lekker ruim op mag vatten voor deze vraag, dan is dat al een keer getest. Begin een nieuw bericht op je iPhone, type "The nuclear " en klik (zonder nadenken) simpelweg elke keer op de eerste suggestie. Het resultaat is... verbazend, grappig, en oh ja, ontzettend zorgwekkend! Als je wilt weten waarom ze het getest hebben: begin te kijken op 3:05. Als je alleen benieuwd bent naar het resultaat, dan kun je beginnen op 4:15. In beide gevallen ben je op 4:50 in principe klaar (maar John Oliver maakt nog een heleboel andere goede punten, dus als je geïnteresseerd bent, kijk dan vooral de overige twintig minuten ook gewoon af).
Komen dit soort functies dan ook in Inbox?
Nu Google nieuwe functies uit Inbox aan Gmail toevoegt, zoals de snooze functie, neem ik aan dat Inbox over een tijdje niet meer bestaat. Op mijn telefoon heb ik de Inbox-app al verwijderd en werk ik alleen nog met de gmail-app, aangezien snooze het enige was dat ik miste.
Aha Gmail maar eens bekijken, gebruik het ook alleen nog maar voor de snooze
Anoniem: 310408 16 mei 2018 20:40
Ik ben ZEER onder de indruk van Smart Compose (nadat ik door had dat ik de tab toets moest gebruiken). Minstens 25% van de mails die ik moet beantwoorden kunnen nu via een klik. Dat zijn ervaringen in Duits en Engels, niets in Nederlands.

De mensen die datacollectie haten zullen er niet blij mee zijn maar ik heb enkele malen gezien dat er informatie gebruikt werd die NIET in de mail stond en dus via de informatie die Google over mij wist ingevuld werd. Beetje eng maar erg knap.
Dat is dus ook het ding, die data wordt verzameld om te kunnen voorspellen wat je wil typen. Nogal wiedes dat het ook dingen kan voorstellen die niet in de mail stond ;) Exact het punt wat ontzettend privacy gevoelig is ook en naar mijn mening compleet nutteloos.
een optie om eigen taalgebruik te emuleren
Gaatd GMail dan allerlij schrijfvauten produceren die velen mensen zelf ook maken?

Want ehmm, ik zie niet helemaal hoe je iemands taalgebruik kunt emuleren en tegelijkertijd correcte spelling en grammatica gebruiken. Het zou een beetje jammer zijn als een (potentieel) handige feature zoals dit nog veel meer gebroken Engels (en Nederlands) aan de stortvloed toevoegt...
Over 5 jaar krijgt hij de functie om jou te emuleren. Eerst doet hij alleen je werk, maar na verloop van tijd zal hij je sociale contacten gaan onderhouden en na een paar jaar zul je ineens je vrouw in bed vinden met jouw mobiel tussen d'r benen.
Begint bijna eng te worden dit.
Net als koeien die zure melk zullen gaan geven als er ineens stoomtreinen langs komen rijden, of dat je chronisch dood gaat als je in een auto zit die harder rijdt dan 30 km p/u?

Alles wat nieuw is, is eng.

Op dit item kan niet meer gereageerd worden.