Hoofdcategorieën
Device Settings

Google Chrome 11 bèta krijgt 'speech input'-api en css 3d

Door Dimitri Reijerman, woensdag 23 maart 2011 12:48, views: 15.781

Google heeft Chrome 11 het bètastempel gegeven. De browser is uitgerust met de speech input-api voor html 5, waardoor spraakbesturing mogelijk wordt. Intussen geeft Google aan dat het de bestandsomvang van Chrome wil reduceren.

Chrome 11Google heeft de speech input-api in Chrome 11 ontwikkeld in samenwerking met de HTML Speech Incubator Group. De api maakt het in combinatie met html 5 mogelijk om gesproken woorden binnen webapplicaties om te zetten naar tekst. Om dit mogelijk te maken, worden audio-opnames naar een server gestuurd, waarna spraakherkenningssoftware deze moet omzetten naar bruikbare tekst. Google gebruikt soortgelijke technologie al in Voice Actions op zijn Android-platform.

Versie 11 biedt verder ondersteuning voor css 3d transforms. Hiermee kunnen elementen in drie dimensies geplaatst worden met behulp van de opmaaktaal css. Bij het renderen van css 3d-objecten kan de gpu ingezet worden. Google heeft Chrome 11, verkrijgbaar op Windows, OS X en Linux, ook van een nieuw logo voorzien.

Voor de komende Chrome-versies wil Google de bestandsomvang van zijn browser terugbrengen. Woog de eerste release nog 9MB, Chrome 10 is uitgegroeid tot meer dan 26MB. Dit zou problemen geven bij het uitbrengen van Chrome-updates in landen waar de downloadsnelheden nog beperkt zijn. Om verdere uitdijing van de bestandsgrootte te voorkomen, is binnen het Chrome-ontwikkelteam een werkgroep opgezet.

Volgende 12:58 Pc-versie Crysis 2 krijgt direct na release zijn eerste patch
Vorige 11:52 Gemeente mag vingerafdruk in paspoort eisen
Advertentie

Reacties

«  1  2  »

Leuk aangepast Logo van Google. Hierdoor zag ik dat er een nieuwe versie was geinstalleerd :)

Vind het nieuwe logo juist spuuglelijk, staat echt niet mooi in m'n Dock.. De oude stond veel mooier! Maargoed het logo is bijzaak.

Ook goed dat ze naar de bestandsgrootte kijken, bij veel dingen wordt daar niet meer op gelet omdat de meeste mensen toch genoeg snelheid en schijfruimte hebben.

Idd bijzaak, je kan hem zelf aanpassen ;)

Door een icon-changer te gebruiken, of in Chrome zelf?

In Windows kan je gewoon rechtermuisklik doen dan eigenschappen dan icoon veranderen. In Linux en Mac OS X weet ik het niet.

Ik vergis me telkens tussen het logo van WMP en google chrome

Ik heb al wel een beetje (slechte) ervaring met spraakbesturing. Naar mijn ervaring werkt dit nog niet altijd even lekker. je moet echt heel overdreven duidelijk praten, en het soms wel 10 keer herhalen voordat er naar je geluisterd wordt. Wel leuk IMO dat dit gewoon wordt geïntegreerd in een gratis webbrowser. Ben benieuwd naar de kwaliteit van de woordgevoeligheid. Marja, ergens moet een begin zijn, niet? ;)

[Reactie gewijzigd door _-SaVaGe-_ op woensdag 23 maart 2011 12:53]


Net alsof je tegen je vrouw praat dus

Leuke ontwikkeling, ben ook erg benieuwd naar de 3D weergave van objecten binnen HTML. Logo is even wennen, ik vond het oude logo juist futuristisch staan, maar volgensmij houden ze alles liever simpel, net als dat het algemene Google logo toendertijd ook 'versimpeld is'.

Spraakherkenning is volgensmij toch nog iets wat (Zoals al vele jaren) nog flink doorontwikkeld dient te worden voordat dit echt goed zal werken.

Safari/webkit deed dat al een tijdje:
http://www.webkit.org/blog/386/3d-transforms/
(werkt in Safari)

chrome is ook op webkit gebaseerd maar ondersteunde CSS 3D nog niet, maar nu kennelijk wel

[Reactie gewijzigd door RM-rf op woensdag 23 maart 2011 13:33]


Naast de vraag hoe goed/slecht de spraakherkenning zou werken. Vraag ik me vooral af waarom en waarvoor mensen dit zouden willen gebruiken( naast de fysiek beperkten). Waarschijnlijk vooral op tablets fijn om te gebruiken, verder zie ik het nut er niet echt van in.

De beperkten dus...
Op elke Windows PC staat bijvoorbeeld "Vergrootglas" maar ik heb het tot nu toe alleen nog gebruikt voor de lol (voor de tijd dat ik wist dat "CTRL" + "+" ook werkte

Bij mij op school zat iemand met heel zware dyslexie, en die had wel de spraak herkenning echt nodig.


De doelgroep is niet zo groot, maar ze moeten toch niet achtergesteld worden. Bioscopen en theaters bijvoorbeeld, hebben vaak ook een invaliden ingang. wordt minder vaak dan de gewone gebruikt, maar als die er niet is stel je een bepaalde groep mensen achter...

Aha, ik vroeg me echt af waar al die voice drukte nou om te doen was; hier zit toch niemand op te wachten. (jaja mijn mening) maar inderdaad, het zou perfect passen in het rijtje vergrootglas, hoog-contrast enzovoort.

Eigenlijk wel goed gezien van Google. Naar buiten toe ("de gewone gebruiker") gebruikt men steeds afgeronde versienummers, de grote massa zal dit wel aangenamer vinden. Op tech savvy sites gebruikt men dan subversienummers.

Ze stijgen wel snel moet ik toegeven :)

Naar de gewone gebruiker toe gebruiken ze gewoon geen nummering. Google op "download chrome", installeer het, start te gebruiken, en je bent aan het surfen zonder 1 keer een versienummer gezien te hebben. De massa krijgt dus geen kans om dit aangenamer te vinden, want ze zien het gewoon nergens :)

Nummering is irrelevant geworden. Het doet ook nergens toe, er zijn automatische updates, je krijgt automatisch de nieuwste en beste versie van de browser. Vooropgesteld dat er goed getest wordt, is er enkel voordeel.

Ben wel benieuwd naar deze feature, maar kan niet direct een test-website vinden...
Iemand enige idee waar je die spraakfunctie kan gebruiken/testen?

Hier vind je een voorbeeld HTML code:
http://lists.w3.org/Archi...b/att-0020/api-draft.html

Voorbeeld demo van Speach input:
http://slides.html5rocks.com/#speech-input

Verder vind je dit soort informatie op de blog van Google Chrome:
http://chrome.blogspot.com/

[Reactie gewijzigd door Cyw00d op woensdag 23 maart 2011 13:09]


Deze: http://www.jeremyselier.com/s/demo/speech_attribute.html
Zou moeten werken, heb het zelf nog niet kunnen testen (microfoontje in notebook is niet echt geweldig)

Heb de 3D translaties wel al mogen bewonderen (lang leve de dev branch), ziet er keurig uit, zien de online folders er ook weer goed uit :P.

Hop, en nu gaat er nog meer data naar de servers van Google. Allemaal leuk features hoor, maar het gemak waarmee mensen hun data aan een third-party geven zonder te weten wat die er precies mee doet (en KAN doen!) is verbijsterend.

Opera heeft al sinds jaren support voor een spraak-XML om websites te besturen. Het is geen volledige speech-to-text, maar het werkt tenminste wel volledig op de lokale machine, waar het hoort.

Helemaal met je eens.
Google wil veel en veels te veel van je weten!
Kort gezegd willen ze alles wat je digitaal doet kunnen bekijken, gebeurt het niet online dan sturen ze wel een autotje langs om de wifi te sniffen.

Eerlijk gezegd heb ik meer vertrouwen in de beveiliging van Google dan de beveiliging van de overheid.

Als ik zou moeten kiezen aan wie ik mijn gegevens moet geven dan Google boven de overheid any day

Wat is het verschil tussen informatie invoer via je toetsenbord of via een mic?...

De grootste lek vindt nog altijd plaats via social network sites en apps op telefoons. Dus ik snap al dat privacy gezeik niet echt.

Privacy's grootste vijand: naïviteit.

Deze API kan ook binnen andere websites gebruikt worden. In effect heeft Google hiermee dus nog meer gegevens over welke website jij bezoekt en wat je daar doet.

Ik werk in de ICT en ik weet hoe laks sommige mensen met privacy kunnen omgaan. Soms zelfs willens en wetens, uit gemakzucht of financieel gewin.. En denk maar niet dat dat bij Google veel anders is.

Enige probleem is natuurlijk, dit is geen speech-to-text, hier gaat het om text-to-speech.

Ik vermoed dat voor het laatste veel meer processor en database-kracht nodig is om er hopelijk goede resultaten uit te krijgen. Want tot nu toe valt het vaak tegen.

Het privacy probleem begrijp ik helemaal trouwens.

Zoals ik al zei heeft Opera al jaren een speech-to-text ingebouwd. En die werkt opmerkelijk goed. Hell, zelfs de spraakcommando's op m'n 3 jaar oude Nokia werken best OK. Je overschat hoeveel CPU en database je nodig hebt voor basic S2T. Daar heb je echt geen "cloud" voor nodig.

Ik vind het knap dat ze chrome zo klein houden, terwijl ze wel steeds meer functionaliteit krijgen. Ik heb Extensies gezien die bijna groter zijn dan de 26 MB die Chrome nu weegt.

Ik heb mijn hele familie al aan de chrome. Het is gewoon zoveel makkelijker uit te leggen dan IE of FF :D

En ze gaan proberen om die 26 MB ook nog naar beneden te krijgen. linkje

Gaan we nu ook al beta versies vermelden?

Ben benieuwd wanneer Chrome de achterstand gaat goedmaken op de nieuwe IE en FIrefox op het gebied van GPU acceleration.

Ook is het nog steeds vervelend dat op sommige sites (zoals het AD) de video's niet worden geladen

[Reactie gewijzigd door Pyrone89 op woensdag 23 maart 2011 13:37]


off topic:
Bij mij lukt het wel ( AD) video's afspelen, misschien een andere probleem

Bij alle chrome installaties die ik heb is het probleem aanwezig. Clean install van nieuwste Stable.

Op IE en Firefox werkt het wel gewoon.

Het is gewoon dat je een heel wit vlak ziet (je dus niet eens een flash onderdeel waar je op kunt klikken)

Voor de gebruikers van spraakherkenning hier een paar tips die wellicht kunnen helpen:
* Zorg ervoor dat je commando's drie lettergrepen bevatten of meer. (of meerdere woorden) Dan wordt de herkenning een stuk beter.
* Als je overdreven duidelijk moet praten dan is er wat misgegaan met de training. (Teveel getraind kan ook) Wellicht kan je een nieuw profiel aanmaken en opnieuw gaan trainen.
* Als je gaat dicteren, dicteer dan de complete tekst en ga later verbeteringen aanbrengen, dat gaat een stuk vlotter en scheelt heel veel tijd. Afhankelijk van de gebruikte software kan je de audiofile synchroon laten lopen aan de herkende tekst.

....

En spraakherkenning overbodig behalve voor mensen met een beperking... mmm ja... vaak is de implementatie niet doelgericht. Wanneer echter het uitgangspunt is dat de spraakherkenning een toegevoegde waarde moet zijn voor alle gebruikers, dan kan het zomaar heel erg handig worden. Maar dat vergt een goede macro editor en even diep nadenken wanneer het nuttig is en wanneer niet.... de gebruikers zijn uiteindelijk leidraad hierin.

Ah leuk, api die alleen op chrome werkt en niet op andere browsers.

Lijkt me meer dan logisch, Die andere browers moeten hun zaken op orde hebben en/of innoveren. 8)7

Ik heb deze technologie op mijn android telefoon ook, ik moet zeggen dat ik tevreden ben over het resultaat maar als het een beetje rumoerig is dan werkt het meestal incorrect, desondanks mooie toevoeging voor Chrome. Lees er meer over bij hun blog
«  1  2  »

Op dit item kan niet meer gereageerd worden.

Volgende 12:58 Pc-versie Crysis 2 krijgt direct na release zijn eerste patch
Vorige 11:52 Gemeente mag vingerafdruk in paspoort eisen
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011