Microsoft geeft snelheidsboost aan stemherkenning Windows Phone

Microsoft heeft de stemherkenning in Windows Phone naar eigen zeggen flink verbeterd. De herkenning van Bing Voice Search zou nu twee keer zo snel verlopen en de accuraatheid zou vijftien procent beter zijn, dankzij technologie van Microsoft Research.

Het Bing Speech Team heeft in de afgelopen jaren samengewerkt met Microsoft Research om de beperkingen van de oude spraakherkenning zo veel mogelijk op te heffen. Er wordt gebruikgemaakt van 'deep neural networks'-technologie, waar Microsoft Research onderzoek naar doet. In dat kader ontwikkelen onderzoekers netwerken die samen een computersysteem vormen dat geoptimaliseerd is voor patroonherkenning.

Microsoft heeft algoritmes verfijnd, meer rekenkracht toegevoegd aan de netwerken en datasets uitgebreid om de spraakherkenning van Bing Voice Search te verbeteren. Daarnaast is het de fabrikant gelukt om Bing Speech spraakpatronen beter te laten herkennen bij storend achtergrondgeluid. Spraakherkenning is een van de gebieden waarvan Microsoft hoge verwachtingen heeft; ook de Xbox One krijgt geavanceerde mogelijkheden met stembediening. Concurrenten Google en Apple werken er eveneens hard aan om hun stemherkenningsprojecten te verbeteren.

Vooralsnog wordt de update uitgerold in de Verenigde Staten, wanneer andere landen aan de beurt zijn, is nog niet bekend.

http://hub.video.msn.com/embed/5c9155cc-c40d-45ed-9ee0-64327142e1e5/?vars=bGlua2JhY2s9aHR0cCUzQSUyRiUyRnd3dy5iaW5nLmNvbSUyRnZpZGVvcyUyRmJyb3dzZSZsaW5rb3ZlcnJpZGUyPWh0dHAlM0ElMkYlMkZ3d3cuYmluZy5jb20lMkZ2aWRlb3MlMkZicm93c2UlM0Zta3QlM0Rlbi11cyUyNnZpZCUzRCU3QjAlN0QlMjZmcm9tJTNEdXMtYiZjb25maWdDc2lkPU1TTlZpZGVvJmJyYW5kPXY1JTVFNTQ0eDMwNiZzeW5kaWNhdGlvbj10YWcmbWt0PWVuLXVzJmNvbmZpZ05hbWU9c3luZGljYXRpb25wbGF5ZXImZnI9c2hhcmVlbWJlZC1zeW5kaWNhdGlvbg%3D%3D

Door Christophe van Bokhoven

18-06-2013 • 11:03

31 Linkedin

Reacties (31)

31
30
18
2
0
5
Wijzig sortering
Goed begin! De spraakherkenning wordt steeds beter, maar toch twijfel ik of het echt aan gaat slaan. Veel vrienden met een iPhone / Siri gebruiken het ook niet; puur omdat het 1) onwennig is om tegen je telefoon te praten, en 2) het net zo snel gaat als met de toetsen.

Misschien brengt Google Glass hier in de toekomst verandering in, door werkelijk alles te kunnen besturen met de stem. Laten we het hopen!
Ik denk dat het in normale omstandigheden ook niet veel uit zal maken, maar voor momenten waar je even bezet bent (zoals in de auto) is dit wel gewoon handig. Even snel een sms sturen of iets opzoeken zonder dat je je handen van het stuur hoeft te halen of op het scherm hoeft te kijken.

Verder is Google Glass nu nog aardig verwaarloosbaar. Het levert geen echt nieuwe mogelijkheden, alleen op een andere manier. Dat zal nog wel een paar jaar duren voordat het echt wat toevoegt.

Zelf vind ik de oplossing van de laatste Total Recall film wel cool waarbij je gewoon in je hand een soort smartphone hebt zitten (idee is ook niet nieuw overigens). Maar een lens indoen en daar beelden op weergeven lijkt me imo nog steeds een betere oplossing dan Google Glass. Maar dat zal nog wel wat jaar gaan duren.
Even snel een sms sturen of iets opzoeken zonder dat je je handen van het stuur hoeft te halen
Dat mensen het überhaupt in hun hoofd halen om een SMS te sturen in de auto terwijl je rijdt is al achterlijk. Daar heb ik geen spraakherkenning voor nodig. Ik zie de noodzaak nooit om persee in de auto terwijl ik rij een SMS te moeten sturen. Wat een onzin.

Maar goed. Leuke ontwikkeling natuurlijk. Ze leren hier natuurlijk ook weer veel van wat ze weer op andere gebieden kunnen toepassen. Patroon herkenning is altijd nuttig. Behalve dan voor de paranoïde mens onder ons :)
Anoniem: 80466
@Fabbie18 juni 2013 12:03
Dat mensen het überhaupt in hun hoofd halen om een SMS te sturen in de auto terwijl je rijdt is al achterlijk
Als je vertraagd bent voor een afspraak is een berichtje sturen vanuit je auto toch niet zo slecht.
TEXT Eric work
I am delayed. See you in 20 minutes
SEND
Je verwart twee zaken met elkaar: hoe graag je iets wilt en of het verstandig is of niet. Het feit dat het handig is om op zo'n moment een berichtje te sturen, maakt het nog niet verstandig. Je kan ook even stil gaan staan en dan doorsturen dat je 21 (i.p.v. 20) minuten vertraagd bent...
Kost veel tijd, energie en geld (brandstofverspilling) bovendien kun je bezig blijven. En handsfree is ook gevaarlijk. Een Nummer opzoeken op je telefoon duurt vaak veel langer dan speech
(Bijv zoals het voorbeeld dat al eerder is genoemd)
En hiermee maak je ook direct duidelijk dat die zaken niet in het Nederlands werken.. Spijtig, want die spraakherkenning werkt wel degelijk in onze taal
Waarom zou je niet gewoon handsfree bellen? Of idd even stoppen onderweg?
Als je te laat bent, is stoppen ook niet echt een optie lijkt me. Verder kan ik me voorstellen dat het niet alleen om afspraken gaat, maar ook bij groepsgesprekken of simpele berichtjes.
Bij een vergadering zijn vaak meerdere mensen betrokken, om die nou allemaal te bellen is ook weer zo.

Maar hoe ga jij iemand bellen dan? Dat doe je dan toch ook liever met spraak? Sure, je kunt je parrot bedienen of op je telefoon iets inzoeken, maar ook dan is het handiger.

[Reactie gewijzigd door Martinspire op 18 juni 2013 16:42]

Het gaat ook niet om lange berichten, maar simpele reacties als "ok, doe ik", "ok ik ben present", "ik ben er bijna", "ik ben wat later, waarschijnlijk 10 minuten" of "ik zie je straks".

Maar stel ik ben eten aan het maken en heb net vette vingers, maar iemand belt. Dan is het toch handig als ik hem op speaker kan zetten of een berichtje stuur met dat ik zo even terug bel? Het gaat verder niet alleen om communicatie, maar ook informatie opzoeken of iets opstarten lijkt me rete handig. Wat is sneller? Zeggen dat Wikipedia opgestart moet worden met zoekwoord X of de applicatie opzoeken en vervolgens weer handmatig het zoekwoord invoeren?

Zijn legio mogelijkheden te bedenken, maar het feit is dat we gewoon weinig kunnen uitvinden waar het wel of niet werkt als we de kans niet krijgen.

[Reactie gewijzigd door Martinspire op 18 juni 2013 16:45]

Verder is Google Glass nu nog aardig verwaarloosbaar. Het levert geen echt nieuwe mogelijkheden, alleen op een andere manier. Dat zal nog wel een paar jaar duren voordat het echt wat toevoegt.
Het succes ervan heeft er weinig mee te maken, buiten dat het officeel niet eens uit is...

Punt is dat je bij Google Glass 2 inputs hebt en stem besturing daar toch wel primair is (naast touch), oftewel dat forceert vooruitgang in de stem besturing. Waar bij telefoons de primaire input nog altijd touch is (voor interactie, voor bellen natuurlijk niet XD)...

[Reactie gewijzigd door watercoolertje op 18 juni 2013 11:19]

Ik gebruik siri zeker wel als je onderweg bent en je telefoon zit in je zak en je hebt je oortjes in voor muziek is het onwijs handig omdat je siri dan activeert en aanstuurt met je headset en dit werkt top! scheelt ook veel tijd maar het blijft jammer dat het nog steeds niet in het Nederlands werkt.
Anoniem: 80466
@neos199118 juni 2013 12:04
ik vind het ontbreken van de taal vooral lastig met namen.
CALL Annelies
begrijpt de telefoon toch echt niet.
Ik gebruik het vooral voor het opbellen van mensen. Ik heb meestal geen zin om in mijn People lijst te gaan zoeken. 'Call pietje' roepen is dan een stuk sneller.
De spraakherkenning op mijn Asus TF300 werkt goed. Hele zinnen worden goed omgezet naar de juiste tekst. Soms geeft het wel eens hilarische uitkomsten. Je hebt er zelf geen erg in wat voor zinnen je kan creëren als een eerste letter of deel van een woord gemist wordt.

Ook de intonatie en toonhoogte zijn belangrijk bij het inspreken. Helaas hebben we niet allemaal een Nieuwslezer stem. Achtergrondgeluiden vooral andere gesprekken die meegenomen worden verminken de herkennings score.

Al met al heeft men inmiddels erg goede resultaten bereikt en hoop ik dat er een update voor mijn Lumia 620 snel beschikbaar komt.
1) onwennig is om tegen je telefoon te praten

Ben dan wel benieuwd hoe jij je telefoongesprekken voert... }:O
Beetje dom om te doen of het hetzelfde is om tegen een telefoon te praten of tegen een mens (via een telefoon). |:(
Zo... wat een reactie zeg!

Volgens mij is het al 30+ in jouw hoofd!

Je bent zeker geen ster in het onderscheiden van sarcasme en grapjes... Take it easy, take a sisi. ;)
Wanneer je sarcastisch bezig bent moet je het een beetje laten blijken.
Ik dacht ook nooit een nut te hebben voor spraakherkenning. Nu heb ik voor mij de eerste nuttige functie gevonden, het opstellen van mijn boodschappenlijstje. Al pratend tegen mijn telefoon loop ik een rondje door mijn huis en spreek ik alles in wat ik wil gaan halen. Ideaal. Verder moet ik nog maar zien wat het gaat brengen, maar er zullen vast nog wel wat meer "nuttige" functies voor komen :)
Is het iemand anders opgevallen dat Stefan Weitz (links) een Pebble horloge om zijn pols heeft?
Een horloge dat niet samenwerkt met WP8?

Dus, of onze vriend praat graag over Windows Phone maar gebruikt stiekem toch een ander apparaat? Of Microsoft is aan het proberen met Pebble samen te werken aan iets?

Ik vermoed eigenlijk het eerste :X
Om Microsoft de quoten:
With Windows Phone 8.0 developer platform, SSP apps can now be implemented on Windows Phone 8. Using RFCOMM, a developer should be able to get a socket via peerfinder and build an SSP implementation on top of that. This was done for a couple demos (e.g., Tim Laverty built an SSP implementation to control a Minstorm robot in his Build 2012 networking talk). Moving forward, the team is planning on providing some deeper sample code…and there are a couple community projects that are implementing SSP on top of the platform and publishing it. So while there isn’t a native SSP API set on the developer platform, it is now possible to implement an SSP solution on WP. As such, I’m marking this as ‘Started’. As such, download the WPSDK and give it a try
Pebble gebruikt SSP, dus theoretisch is het gewoon mogelijk als het dev.team van Pepple er tijd voor uit trekt.
Blijft wel gaaf om te zien altijd die spraakherkenning. Snellere verwerking is altijd wel mooi meegenomen.

Toch hoop ik dat we hier in Nederland ook eens die spraakherkenning krijgen en ook de andere Bing services die momenteel missen op Windows Phone. Het heeft nu wel lang genoeg geduurt imo.
Ook op Android en iOS heb je nog geen NL spraak herkenning. Dus als MS hiermee komt op WP8, dan hebben ze een streepje voor op de rest!
Volgens mij had Samsung het wel zelf ingebakken bij hun Android-schil, maar inderdaad. Blijft erg jammer dat hier niet wat meer progressie in zit. Het hoeft van mij ook niet meteen in het begin vlekkeloos, maar zelfs al heb je minder commando's of een strikter script waar je je aan moet houden, dan is dat al een mooi begin.
Het is wel een mooie technologie, alleen spijtig dat hij meestal niet in het Nederlands beschikbaar is.
er is hoop :P

als er nederlandstalige support komt voor de X1, zou dit toch bijna 1 op 1 moeten zijn.
Ik gebruik toch wel vaak spraakherkenning voor kleine dingen als ik thuis ben, vooral tijdens het koken om te multitasken en kookwekkers te zetten of reminders te plaatsen zoals "remind me tomorrow to check the ebay listings", verder simpele conversions zijn ook altijd handig van het metrische naar imperial system bijv.
Het werkt voor dit soort kleine taken perfect en bespaart tijd en geeft me wat snelheid, maar in het openbaar of voor moeilijkere taken gebruik ik het persoonlijk nooit, maar ik zie de techniek wel steeds verder ontwikkelen en ik ben helemaal voor!
Leuk dit, maar zorg eerst maar dat m'n windows 8 phone de Nederlandse taal begrijpt. Inspreken en voorlezen kan ie alleen in het Engels. M'n binnengekomen sms berichten worden dus zowat onverstaanbaar uitgesproken.
Ik gebruik mijn spraakherkenning eigenlijk alleen in de auto. Het kan voor Windows Phone idd beter. Goed dat ze het zelf ook inzien.

Op dit item kan niet meer gereageerd worden.

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee