Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Je kunt ook een cookievrije versie van de website bezoeken met minder functionaliteit. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , reacties: 34, views: 9.516 •

Google heeft een nieuwe bètaversie van zijn Chrome-browser uitgebracht waarin ondersteuning is toegevoegd voor de Web Speech-api. Hierdoor kunnen ontwikkelaars van websites en webapps ondersteuning voor stembesturing aan invoervelden toevoegen.

De Web Speech-api is gebaseerd op de public speech-api die momenteel in ontwikkeling is bij W3C en werkt op basis van JavaScript. Hoewel Google het niet expliciet vermeldt wordt de ingesproken tekst hoogstwaarschijnlijk eerst naar servers van Google verzonden waar de omzetting van spraak naar tekst plaatsvindt. Daarna wordt de tekstuele weergave van de ingesproken tekst teruggestuurd naar de browser. Een demo van Google toont een aangepast invoerveld met in de bovenhoek een icoontje van een microfoon. Als deze aangeklikt wordt kan begonnen worden met tekstinvoer via spraak.

De nieuwste bèta van Chrome brengt ook verbeteringen met zich mee rondom het installeren van extensies. Via een register-methode was het tot nu toe mogelijk om stilletjes extensies toe te voegen aan Chrome op Windows-machines. Die mogelijkheid was er om gebruikers een opt-in te bieden als ze software installeerden die additionele Chrome-extensies wilde toevoegen. De bèta van Chrome 25 maakt dit onmogelijk en deactiveert extensies die op deze wijze geinstalleerd zijn automatisch, waarbij de gebruiker de keuze krijgt deze handmatig weer te activeren. 

Reacties (34)

De Web Speech-api is gebaseerd op de public speech-api die momenteel in ontwikkeling is bij W3C en werkt op basis van JavaScript.
Wacht wat, zie ik daar een zin waarin wordt bevestigd wat alle web ontwikkelaars Microsoft al jaren geleden verwijten? Jaja, inderdaad.
Mijn ervaring met spraakherkenning is dat het wel aardig werkt als je van tevoren weet wat je wilt gaan schrijven. Meestal weet ik dat niet precies en vormt een emailtje zich na een tijdje door te schuiven met zinnen, woorden aan te passen e.d.. Daar kan ik best een half uur mee bezig zijn om alles duidelijk in beeld te krijgen.
Met spraakherkenning werkt dat gewoon niet zo handig. Als je met spraak zinnen moet schuiven en aanpassen ben je veel langer bezig.
Simpele korte berichtjes heb je wel voordeel aan, maar goed, dat heb je ook binnen enkele minuten getypt.
Combineer dat met een interface die meestal niet spraakgestuurd is en je zit alsnog aan te toetsenbord en muis om dat emailtje te versturen.

Ik zie heel weinig voordelen hier.
't Is eigenlijk erg, maar met het ten onder gaan van L&H (Lernout & Hauspie) is er veel goeie technologie ook verloren gegaan op vlak van spraak herkenning en besturing. Maar ik vind het geweldig dat we over enkele jaren gewoon e-mails kunnen dicteren aan de tablet of PC.

Dit zal voor veel mensen weer een nieuwe wereld openen, zoals bv. oudere mensen die niet zo handig zijn met een toetsenbord (of zeer traag), die kunnen dan alles gewoon dicteren en toch makkelijk e-mails versturen. Super!
met het ten onder gaan van L&H (Lernout & Hauspie) is er veel goeie technologie ook verloren gegaan op vlak van spraak herkenning en besturing
Kun je een voorbeeld noemen? Ik lees namelijk dat de spraakafdeling gewoon overgenomen is door Scansoft.
Ik heb de update, maar zie nergens een microfoon. Ik meen me zelfs te herinneren dat op google.com eerst wél een microfoontje getoond werd?
Mwah, ondanks dat er veelbelovend uitziet mag je nog de helft gaan aanklikken. Daarnaast mag je voor elke punt period gaan zeggen. Ik vraag me af of ik dan niet sneller klaar ben als ik ga typen. Gevaar is natuurlijk dat we er zo aan gewend zijn door in onze smartphones te spreken dat we straks in onze normale real life gesprekken ook de hele tijd period gaan zeggen als we aan t eind van een zin zijn (dubbele punt, haakje sluiten)
Dit was al mogelijk vanaf minimaal versie 23 geloof ik..?
Volgens mij begrijp ik iets niet; waarom hoort dit in de browser thuis? En zit dat soort software niet al ingebakken in het OS (e.g. Android), danwel kan geinstalleerd worden? Dat soort software kan dan toch ook textvelden invullen, net zoals je er emails mee kunt inspreken? Waarom moet hier dan een hele browser API voor gebakken worden?

Goed dit zijn alleen maar vragen, ik hoop dat ik geen steekjes heb laten vallen. Trouwens, is het niet zo dat goede resultaten met speech-to-text voornamelijk behaald worden na training op de stem van de gebruiker?

[Reactie gewijzigd door TheWickedD op 15 januari 2013 10:23]

Google's filosofie is dat *alles* de browser in gaat.
En dat die browser dus groter, lomper, trager en onveiliger wordt. Nee, dank je. Dit zie ik liever als een plug-in o.i.d.
Nee, je wilt geen plug-ins. Dan is er weer actie nodig van een eindgebruiker om bepaalde functionaliteit te willen gebruiken. Het hele idee van "alles in de browser" is juist dat je alles altijd en overal (ongeacht het device) werkt zonder dat je daar apps of wat dan ook voor moet installeren.

WebRTC bijvoorbeeld schept bijvoorbeeld de mogelijkheid om voice en video calls op te zetten zonder specifieke apps (zoals bijv. Skype).
http://9292.nl/ heeft dit ook al een tijdje. Dit werkt ook zonder de api :)

[Reactie gewijzigd door maarud op 15 januari 2013 08:48]

De grootste aanpassingen/vernieuwingen in Chrome 25 gaan gebeuren in WebRTC: VP9 en Opus audio.

Dit zijn echte next-gen audio en video-codec (royalty vrij en open source).
Opus is een open standaard van de IETF.

VP9 zal weer een proprietary codec zijn die 100% eigendom is van Google.

Dat is een enorm verschil.
Opus heeft een BSD licentie. Een licentie die zoveel vrijheid biedt dat zelfs Microsoft er broncode van leende voor Windows.

VP9 weet ik nog niet van wat de exacte licentie zal zijn, maar aangezien VP8 een copyleft licentie had verwacht ik dat VP9 dat ook zal hebben. Wat is er exact proprietary aan een copyleft licentie?

Kortom, op welk verschil mik je?
Opus heeft een BSD licentie
Je hebt het vast over de source code van één specifieke implementatie van de codec is vastgelegd.
Het Opus standaard formaat valt onder de IETF license policy.
maar aangezien VP8 een copyleft licentie had
Dat was de libvpx API/codeimplementatie. Dat is een google open source implementatie van de VP8 codec.

De VP8/VP9 formaten zijn even open als de oude binaire Office formaten.doc/.xls/.ppt formaten van Microsoft. De specificatie is beschikbaar en er is een technologiebelofte voor implementerende partijen. Beide formaten zijn echter eigendom van een private partij die de volledige controle heeft over het formaat en de aanpassingen daaraan in de toekomst.

[Reactie gewijzigd door hAl op 15 januari 2013 13:58]

Dat is een google open source implementatie
En dat is voldoende. Je kan er vervolgend de wereld bij verzinnen, maar één open source implementatie is voldoende. Die kan je, als daar goede redenen voor zijn forken. De eigenaar *kan* daar geen bezwaar tegen maken.

Van de office formaten bestaat geen 100% werkende open source implementatie en die zal hoogst waarschijnlijk ook nooit bestaan. daarvoor is het formaat een te grote puinhoop.

Dat het format zelf eigendom is van iemand maakt vrij weinig uit. Dat wil je sowieso niet op de schop gooien, tenzij je een volledig nieuwe standaard wil gaan opzetten.

Binnen het huidige formaat blijkt genoeg te winnen, dus een nieuwe standaard lijkt me niet aan de orde.

Maar ik snap nu in elk geval je misleide gedachte dat het niet open zou zijn. Je wil het vrijer maken dan nodig is. Je gaat ook geen volledig nieuw compressie algoritme aan h264 toevoegen omdat bijna niemand dat vervolgens kan decoderen.

Wat dat betreft zijn h264 en VP8 en 9 even proprietary.

Kortom, je speelt met definities om de boel te vertroebelen... Alweer...
De specificatie is beschikbaar en er is een technologiebelofte voor implementerende partijen.
Precies, de specs zijn open en er hoeven geen royalties betaald te worden. Dat is niet hetzelfde als een patentvrije standaard. Die zijn bijzonder zeldzaam in video-land, bijna alle interessante video compressie technieken zijn ooit gepatenteerd.
"VP9 is an open and royalty free video compression standard" zie oa. wikipedia of http://www.webmproject.org/
Je verward hier een open en royalty vrije standaard met een patentvrije standaard.

Op dit item kan niet meer gereageerd worden.



Populair:Apple iPhone 6Samsung Galaxy Note 4Apple iPad Air 2FIFA 15Motorola Nexus 6Call of Duty: Advanced WarfareApple WatchWorld of Warcraft: Warlords of Draenor, PC (Windows)Microsoft Xbox One 500GBTablets

© 1998 - 2014 Tweakers.net B.V. Tweakers is onderdeel van De Persgroep en partner van Computable, Autotrack en Carsom.nl Hosting door True

Beste nieuwssite en prijsvergelijker van het jaar 2013