Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 29 reacties

Google heeft zijn spraakherkenningstechnologie verbeterd, waardoor voicemails opgenomen in de Voice-dienst met 49 procent meer nauwkeurigheid worden omgezet. Hiermee wil het bedrijf gebruikers helpen die te maken krijgen met slecht verstaanbare voicemails.

Google VoiceOp zijn blog legt Google uit hoe het zijn spraakherkenningsdienst heeft verbeterd. Op basis van voicemailberichten die door Voice-gebruikers beschikbaar zijn gesteld heeft Google zijn algoritmes aangepast. Daardoor moeten voicemails waarin de persoon die een bericht inspreekt slecht is te verstaan, met meer nauwkeurigheid worden omgezet naar tekst. Volgens de internetgigant is het aantal fouten in transcripties dus met bijna de helft afgenomen.

Volgens Google gaat het om een grote verbetering, maar komen er in de toekomst ook nog vernieuwingen aan om de nauwkeurigheid verder op te hogen. Overigens zitten de verbeteringen in de spraakherkenning ook in Project Fi, Googles telecomdienst die vooralsnog alleen op uitnodiging is te gebruiken.

Voice is al jaren beschikbaar maar is sinds vorig jaar geïntegreerd in de chatapplicatie Hangouts. Daarmee is het met de app mogelijk om te bellen naar telefoonnummers, onder meer in Nederland.

Moderatie-faq Wijzig weergave

Reacties (29)

Misschien een beetje gek, maar ik vind het helemaal niet zo'n prettig idee als een online adverteerder transcripties kan maken van voicemail berichten die ik stuur.
Precies. En je kan wel zeggen gebruik dan geen Google, maar als je de voicemail van een 06 nummer inspreekt is de kans 80% dan het bij Google terecht komt.
Afgezien of je dit wil zegt de uitspraak van google nog helemaal niets.
De helft minder fouten maar hoeveel fouten worden er nu nog gemaakt.
Als het eerst 70% is, is het nu 35% hetgeen nog steeds veel is.
De foutmarge van speech to tekst, zal zeker niet niet rond de tientallen procenten liggen.
Toen ik in 2004 Dragon NaturallySpeaking (8.0) gebruikte was het foutpercentage al <3%. In tien jaar tijd is er een hoop verbeterd, en verwacht ik dat bij alle partijen het foutpercentage onder de 1% zou moeten liggen. De 'laatste' foutjes zijn vaak het moeilijkste te repareren, dus de helft minder fouten is op zichzelf best een nette performance.

Controversieel of bijzonder is niet de foutmarge van voice, maar dat de transcriptie van je communicatie over de telefoon mogelijk gebruikt mag worden voor ' andere doeleinden' binnen Google. Uiteraard kun je stellen dat het 'een keuze' is om te kiezen voor de goedkope of gratis Voice of Fi-dienst van google, maar jouw keuze raakt direct ook de privacy van al de contactpersonen waarmee je belt.
Het verschil met Dragon NaturallySpeaking toen was dat je toen letterlijk pagina's vol met tekst moest lezen om het programma te trainen, voordat de spraakherkenning werkte. En steeds 'corrigeer dat' moeten zeggen was ook niet zo leuk.
Zoals je al zegt je moest het aanleren. google heeft natuurlijk veel voicemail bestanden echter bekijk onze taal eens en de verschillende dialecten binnen Nederland. Ook in de USa heb je met dialecten te maken. Voor de ene is het dialect te verstaan voor de ander niet. Google zal identiek dezelfde problemen hebben.

<3% foutmarge geloof ik al helemaal niet. Het kan in het gunstigste geval misschien lukken met algemene woorden en als de software getraind is. Bij minder gebruikelijke c.q technische termen zal het stukken moeilijker worden.
En als er 10.000 mensen zijn die een kwart bladzijde aan tekst inspreken heb je toch al gauw 2500 pagina's aan tekst als input voor je spraakengine.
Het gaat hier specifiek om slecht hoorbare voicemails. Daarvan zal het foutpercentage nog niet onder de 3% liggen.
Ja dat klopt. En er staat ook niet hoeveel fouten mensen maken bij het intepreteren van slecht verstaanbare voicemails. Dus eigenlijk zegt het hele artikel niet zo veel.
welke providers zijn dan zo groot in nederland die samenwerken met google?
Geen 1. Is dat nodig dan? In Android M komt visual voice mail. Bij Hi/KPN heb je een app die je voicemails automatisch afluistert en als mp3 op je telefoon zet. Google kan ook zo'n soort app maken, waarbij de gesproken tekst wordt omgezet in geschreven. Geheel met toestemming van de ontvanger, maar niet van de verzender.
logisch, maar nog altijd een functie op een telefoon en zoals ik het nu zie worden alle voicemail berichten toch nog altijd door de provider bewaard, dus 0.0% komt bij google terecht
Niet? En waar zal de analyse plaatsvinden? Net als met google now op de servers van Google.
Hoezo, ik ken niemand die google voice gebruikt?
Bijvoorbeeld via de visual voice mail die in Android M komt. Maar misschien komt er ook wel een andere manier. Misschien komt er wel een optie in Android waarbij een Google app meeluistert als je je voice mail afluistert. Geheel met instemming van de ontvanger, maar niet met de verzender.
Dan had je maar geen voicemail moeten inspreken. Het is aan de ontvangende partij om te bepalen hoe deze af te handelen. En als die bv Google Voice gebruiken heb jij als verzender daar geen controle over. Idem voor SMTP (wie weet waar dat naar geforward wordt) en zelfs ouderwetse brieven kunnen worden gescanned op weg naar de beoogde ontvanger en worden omgezet naar SMTP (maar nog geen groot succes tot nu toe (Digital Post is niet meer, Privver lijkt ook dood)).
Waarom is dat niet prettig?
Omdat Google met zijn advertenties helemaal niks te maken heeft met wat mensen in mijn voicemail inspreken misschien?
Mensen kiezen bewust voor Google Voice, dus dat is een non-argument. Bovendien is dit waarschijnlijk uit te schakelen.
Dit is geen non argument, ik vind het niet prettig. Hij zegt toch ook niet: Ik kies er bewust voor? Hij zegt alleen dat hij het niet prettig vind dat Google hier wat mee te maken heeft. Jij als Google profeet vind sowieso wel een argument waarom het goed is maar sommige mensen willen gewoon niet dat Google hier ook maar wat mee te maken heeft.
Overigens zitten de verbeteringen in de spraakherkenning ook in Project Fi, Googles telecomdienst
Project Fi is het telefoon-provider project van Google, dat hotspots en telefoonnetwerk combineert voor mobiele data en voip-bellen.

Dat Google ook van haar klanten alle telefoongesprekken kan, gaat of mag gaan transcriberen vind ik een hoogstens bijzondere ontwikkeling. Wanneer een overheid verdachten van criminele zaken afluistert kan ik daar inkomen maar wanneer je telefoonprovider dit ook standaard doet, en je spraak omzet naar tekst vind ik een beetje eng. Het lijkt een beetje op een digitale versie van de film van ' das leben der anderen' in plaats van een ambtenaar schrijft nu een computer alles neer wat je over de telefoon deelt met je geliefden.
Niet helemaal gerelateerd, maar sinds dat Google de community mee laat helpen met het vertalen van woorden voor Google Translate is de kwaliteit behoorlijk omhoog gegaan voor sommige talen. Wel zo fijn.
Het verschil tussen '49% minder fouten' (in de titel) en '49% meer nauwkeurig' (in het artikel) is enorm.
De eerste zou het verschil kunen zijn tussen 99.5% en 99.75% accurraatheid, terwijl in het tweede geval de accurraatheid vroeger niet boven de 66% gezeten kan hebben, anders is een toename van 49% gewoon niet mogelijk.

Overigens staat in de blog 'we cut our transcription errors by 49%.'
Het zou fijn zijn als ze dit ook door weten te voeren bij hun Youtube spraakherkenning, want die werkt nog voor geen meter.
Of bij AL hun software.
Voorheen:
  • 1% goed
  • 99% fout
Nu:
  • 2% goed
  • 98% fout
Een verbetering van 100%
Zegt toch helemaal niets dit soort getallen.

-edit: ja, verhip. je hebt gelijk skndd-

[Reactie gewijzigd door MrMonkE op 25 juli 2015 23:51]

Je formuleert het incorrect ;). Van 1 naar 2 is een verbetering van 100%. Een verbetering van 50% zou neerkomen op 1,5.

Er worden volgens google 49% minder fouten gemaakt. In jouw voorbeeld geldt dus 99*0,51=50,49 fout in de nieuwe situatie.
Er staat 49% minder fouten ipv 49% meer goed. Je rekenvoorbeeld is dus sowieso verkeerd ;)

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True