Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 14 reacties
Bron: C|Net, submitter: T.T.

Bij C|Net lezen we dat IBM een spraakherkennings-toolkit ge´ntroduceerd heeft voor Linux. Hiermee kunnen ontwikkelaars van software spraakherkenning gaan implementeren en gebruiken. De toolkit is gebaseerd op de XHTML+Voice specificatie, ook bekend als X+V. De kit bevat herbruikbare stukken code en een op Opera 7 gebaseerde simulator voor Windows. Ondanks het feit dat spraakherkenning nog niet veel gebruikt wordt, is het uitermate geschikt voor vele doeleinden. Een voorbeeld hiervan is een mobiel apparaat dat te klein is om een volledig toetsenbord te bevatten.

IBM logo (vrijstaand)Ook neemt de interesse in de techniek toe nu deze steeds beter wordt. HP wil zich ook mengen in de spraakmarkt en maakte afgelopen woensdag bekend dat men bezig is om PipeBeach, een in voice-technologie gespecialiseerd bedrijf, over te nemen. Ook IBM is doelgericht bezig met de implementatie van de techniek. Het bedrijf heeft een helpdesk ontwikkeld voor bedrijven als T. Rowe Price die gebruik maakt van spraakherkenning. Een beller kan antwoorden vinden door simpele vragen te stellen. Micorsoft is momenteel ook bezig met de ontwikkeling van een zelfde soort helpdesk voor het midden- en kleinbedrijf.

Moderatie-faq Wijzig weergave

Reacties (14)

MMM het gaat dus allemaal beter worden.

Ik mag wel hopen dat de software zo te trainen is dat enkel de stem van de eigenaar commando's en tekst in kan geven, anders wordt t wel erg lastig als er veel achtergrond geluid is (bijv in de trein/tram met al die bellende mensen)

Voor mijn Palm V zou het super zijn, dat gefriemel met dat stylo staafje blijft behelpen, vooral in een bewegend voertuig (auto/tram/trein) wil het niet altijd even makkelijk lukken.(ik weet t linux is geen PalmOS).

Wachten is op de combi van spraakherkenning en uitvoering van de ingegeven tekst.

Mag je wel op letten als je straks hardgrondig tegen je pc roept, ' ach kreng brandt toch door' of iets dergelijks. Of 'mik alles maar in de /dev/null' ;)

Aan de andere kant wel lekker want dan had ik dit stukkie kunnen dicteren ipv 4x backspacen om fouten weg te halen (typen met het bekende 5 vinger systeem ;) )
Zie jij jezelf al hardop pratend tegen je pjoetertje in de tram/trein/bus zitten dan?

Nee dus.
Ten eerste sta je zwaar voor l*l, en ten tweede wil je vast niet dat iedere voorbijganger mee kan luisteren.
Vergelijk dat eens met bellen
Mooi zo. Hoe snel ik ook typ ik praat nog steeds een beetje sneller, hoewel het tegenwoordig niet zo veel meer scheelt.
Laten we hopen dat spraakherkenning ook snelle sprekers kan verstaan ..

Bij ons op het werk (ziekenhuis) gebruiken we spraakherkenning om (onder andere) radiografieŰn door dokters te laten protocolleren (bespreken dus :P ) zodat ze die zelf niet moeten uittypen, maar de stemmen van sommige dokters zijn nog erger dan hun welbekende geschriften, met alle gevolgen vandien.
Ja, je zal je wel een beetje moeten aanpassen lijkt mij. Als ik gewoon harstikke met een drents accent ga lopen praten, kan ik me ook wel voorstellen dat zo┤n programma daar niets mee kan.

Als die dokters niet de moeite willen doen om te artikuleren, gaan ze toch lekker (meestal met 1 vinger) de tekst zelf lopen tiepen? :)

Vind het ook altijd verwonderlijk dat ik met mijn dokter┤s recept toch steeds het goede medicijn krijg...
Het probleem met spraakherkenning is ondertussen niet meer het herkennen van commando's maar van natuurlijke zinnen. Het spraakherkennen dmv commando's is al goed te gebruiken, maar spraakherkenning met complete zinnen is nog niet bruikbaar.
Het spraakherkennen dmv commando's is al goed te gebruiken, maar spraakherkenning met complete zinnen is nog niet bruikbaar.
Hoezo niet bruikbaar? Er zijn de afgelopen jaren diverse pakketten geweest waarmee je bijvoorbeeld binnen Word je documenten kon dicteren en wat ook best goed werkte.

Er is een keer een test op TV van geweest en het bleek dat een goed ingewerkt pakket + een man met een duidelijke stem een ervaren typiste kon verslaan kwa tempo. Dat is alweer een jaar geleden, dus met de huidige CPU's moet dat helemaal kunnen.

Het enige probleem is nog dat de software niet echt flexibel is, als je bijvoorbeeld verkouden bent begrijpt die woorden niet, hetzelfde geld in ruimtes waar diverse mensen door elkaar praten.

Maar dat de huidige software geen volzinnen kan verwerken klopt niet.
Prachtig, kun je eens opscheppen tegen je computer, die je dan vervolgens ook begrijpt:

I'm a cybernetic organism, living tissue over metal skeleton my mission is to protect you
viavoice bestaat al een tijdje hoor
De kit bevat herbruikbare stukken code en een op Opera 7 gebaseerde simulator voor Windows.
Wat wil dit zeggen? Is dit gewoon de Operabrowser met als een soort demonstratie de spraakherkenning erin?
is het uitermate geschikt voor vele doeleinden. Een voorbeeld hiervan is een mobiel apparaat dat te klein is om een volledig toetsenbord te bevatten.

Dus perfect voor op een Palm, werd tijd, want eer je vroeger "http://www.eenserver.com/leukepagina1/leukepagina2" had ingetikt op het ingebouwde toetsenbord, was je al 5 min verder :P
Duurt allemaal wel lang :) Heb me nooit zo beziggehouden met spraakherkenning, maar echt jaren geleden waren er al lovende reviews over bepaalde pakketten... en toch hoor je er niet veel over qua successen ofzo...
OS/2 kon het al in 1996 met minimaal een sb16 geluidskaart.

IBM zal het sindsdien wel verbeterd hebben.

Was wel lachen dat je je emails kon dicteren en zat te browsen met spraak.
IBM is ook al bezig met text omzetten in spraak. Je kan het op http://www.research.ibm.com/tts/coredemo.html uitproberen, en ik moet zeggen: het werkt bijzonder goed :)

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True