Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 26 reacties
Bron: InfoWorld

IBM presenteert vandaag een nieuwe softwarebibliotheek die de kwaliteit van spraakherkenning een flinke stap voorwaarts moet laten maken. De software, die onderdeel uitmaakt van het Web Tools Program van opensourcegemeenschap Eclipse, is gebaseerd op het gebruik van VoiceXML en moet het voor ontwikkelaars eenvoudiger maken om hun toepassingen van spraakherkenning te voorzien. 'De huidige programmatuur begrijpt te vaak niet wat een gebruiker zegt, en dat kan knap frustrerend zijn', aldus IBM-teamleider Brent Metz. De nu gepubliceerde API zal volgens hem het aantal toepassingen van spraakherkenning in mobieltjes, handhelds, navigatiesystemen en ook gewone webpagina's verveelvoudigen.

Hello World Het Eclipse-project heeft als doel om ontwikkelaars te helpen op een gestandaardiseerde manier te interacteren. IBM maakte ten behoeve van dit project in 2004 zijn voicesoftware opensource. Naast verbetering van de kwaliteit heeft de nieuwe software van IBM dan ook als doel om spraakherkenning op een universele manier bereikbaar te maken. Behalve de nieuwe bijdrage aan het Voice Tools Project presenteerde IBM bovendien het Multimodal Tools Project, dat spraakherkenning combineert met andere invoermethoden zoals toetsenbord, touchscreen en handschriftherkenning. Met behulp van deze software moet het mogelijk worden om websites ook op devices met beperkte invoermogelijkheden, zoals mobiele telefoons, goed toegankelijk te maken. Big Blue hoopt dat het punt waarop gebruikers hun telefoon om het adres van een goed sushi-restaurant kunnen vragen, niet ver meer weg is. Wij hopen dat de pizzeria's niet vergeten worden.

HAL 9000
'I'm sorry, I can't let you do that.'
Moderatie-faq Wijzig weergave

Reacties (26)

Misschien even de dubbele betekenis verduidelijken van de pic:
HAL, de op hol geslagen computer uit 2001 : A Space Odyssey
Als je iedere letter van HAL met 1 verhoogd, verkrijg je IBM :+
Is een bekend grapje in de ICT wereld. Dave Cutler, de ontwikkelaar van Digital VMS was bij Microsoft de lead designer van Windows NT. VMS + 1 letter = WNT.
Incrementing each letter of "HAL" gives you "IBM". Arthur C. Clarke (co-screenwriter) claimed this was unintentional, and if he had noticed it before it was too late, he would have changed it. HAL stands for Heuristic ALgorithmic Computer.
http://us.imdb.com/title/tt0062622/trivia

zoals iedereen die de film meer dan gezien heeft weet.

Wat dan wel weer typisch is, is dat:
HAL sings "Daisy Bell" ("A Bicycle Built for Two") as he is shut down; this was the first song ever "sung" by a computer, a IBM 7094 computer at Bell Labs in 1961. Furthermore, the lyrics include the phrase "I'm half crazy".
wat het vermoeden doet rijzen dat Clarke uit zijn nek blaat.
Ja, wel inzichtvol, jouw verhaaltje. Maar helaas ook drempelverlagend. Hoe kun je je als Nerd nou onderscheiden van de massa als je die massa Nerd-kennis gaat leren?

Als je niet weet wie of wat HAL9000 is, ben je gewoon geen Nerd. Dan moet je niet niet-Nerds de gelegenheid geven om net te doen alsof ze wel Nerd zijn.

:D
Dus mensen die hun klassiekers kennen op filmgebied zijn tegenwoordig ook al nerds? Sorry hoor, dat komt er bij mij niet in.
Sorry voor offtopic.
Iemand die tweakers.net bezoekt is over behoort over het algemeen niet tot de massa. Ik als beginnend nerd stel de informatie zeer op prijs :). Het is een prikkel om me nog verder te verdiepen in de onmetelijke kennis van de nerds.
offtopic:
Hmm niet om het een of ander, maar ik heb "geprobeerd" de film "2001 - A Space odyssey" te kijken, maar na ca. 20 minuten enkel geblaat in de ruimte binnen een wit ruimte station te hebben gezien heb ik het ding uitgezet en weggemikt.


Daarnaast denk ik niet dat het al dan niet gezien hebben van een film bepaald tot welke gradatie "nerd" je behoort.
Maargoed, dat zal misschien aan de generatie kloof liggen.
Coincidence? I say not !
Ha da's me nog niet opgevallen.. Grappig :P
zou je een word document in het nederlands kunnen dicteren en dat dat ding het dan redelijk foutloos opschrijft?
dat lijkt me dus heel erg tof en het gaat ook nog sneller dan tikken.
Nog beter: je kan EN typen EN spreken tegelijkertijd.
Zoiets als: "zet die laatste zin in het vet". Bij het dicteren is dit wellicht minder handig omdat je dan 2 gedachtensporen moet hebben.
Neem dan games, tegelijk je units sturen en ondertussen opdracht geven om x tanks bij te maken en naar de achterkant van de basis te sturen :)
Dat games idee is echt wel goed... je zou het naar EA moeten mailen...

Maar, voor de rest, ik heb wel eens spraakherkenning geprobeerd, en het gaat zoiezo niet echt lekker (softwarematig), maar ook, ik type gewoon sneller... of anders, het is moeilijker om alle dingen die je 'per ongeluk' hebt gezegd te corrigeren dan ze gewoon niet te typen...
Nee, niet EA mailen, patenteren!
Helaas kun je niet denken over wat je wilt zeggen en spreken tegelijk. Je spraakcentrum is bezet tijdens het praten, waardoor het lastig wordt om te denken over wat je wilt zeggen.
Vandaar alle pauzes die mensen (die nadenken over wat ze zeggen) inbakken tijdens het praten.

Typen en denken over wat je wil zeggen gaat wel samen, aangezien je hiervoor verschillende centra gebruikt. Typen is sowieso een geautomatiseerd proces, als je het blind kunt, waardoor je dit kunt combineren met nog veel meer andere dingen, zoals muziek luisteren. Vergelijk maar met fietsen, dat je ook automatisch doet.
Ja, geweldig. even snel schrijven als denken. Dat kan nu ook, maar het is een gigantische inspanning die veel meer energie kost dan simpelweg uitspreken wat je denkt.
Ik denk dat dat nog ver weg is; daarvoor heb je niet alleen pure spraakherkennings software voor nodig, maar ook intelligente software die op enig niveau kan begrijpen waar je het over hebt.

Tenzij je echt specifiek alles net gaat uitspreken; maar dan is het zelf uit typen nog altijd handiger.
Ik denk eigenlijk dat ik sneller typ dan dat ik praat! Praten is natuurlijk wel een stuk handiger :9~.
Ik vind spraakherkenning als nerd ook wel leuk, maar het "handige" waag ik te betwijfelen. Dit is typisch iets dat de bazen aanspreekt die dan even vergeten dat alleen zij een kantoor voor zich alleen hebben... (en studenten die meestal in hun eentje thuis op hun kamer werken beseffen dat ook niet echt ;)).

Op de gewone werkvloer word je er al gek van als iedereen om je heen zit te bellen terwijl je zelf een rapport moet schrijven of een ander soort tekst (code bijvoorbeeld) moet inkloppen op je pc. Stel je voor dat ook de rapportenschrijvers/e-mail verwerkers nog eens de hele tijd moeten gaan zitten praten. Helemaal NIET handig!!
Ik zou het, omdat ik last heb van RSI, zeer op prijs stellen als dergelijke programma's beter werkten en ook nog eens betaalbaar waren. Ik denk dat veel studenten met mij (omdat zij ook veel moeten typen) vinden dat spraakherkenningsprogramma's zeer welkom zijn voor bijvoorbeeld tekstverwerken.
Het leuke van open-source is dat het dus heel erg betaalbaar is (in veel gevallen zelfs gratis).

Het nadeel van spraakherkenning is echter dat het nog allemaal erg in de kinderschoenen staat. De afgelopen 30 jaar mogen er dan wel grote sprongen zijn gemaakt op dat gebied, maar voor de eindgebruiker zijn die verbeteringen nog altijd te marginaal.
In zekere zin heb je gelijk. Alleen ik vind de kwaliteit van de spraakherkenning zelf juist heel goed op het moment, zolang je het goed traint (ik gebruik Naturally Speaking 8 ). Het probleem zit hem in de integratie met andere applicaties, en daar is deze API op basis van VoiceXML nou juist een hulpmiddel voor. Ik zie overigens niet dat de spraakherkennings software aan zich als open source wordt vrijgegeven:
Although the tools are available for free, IBM hopes to leverage them to boost sales of its WebSphere Voice Server, which is used for deploying speech recognition applications.
'De huidige programmatuur begrijpt te vaak niet wat een gebruiker zegt, en dat kan knap frustrerend zijn'
Da's ook nieuw een programmatuur of pc of server die iets begrijpt. :*)
Ik vraag me af voor welke doelgroep ze het dan geprogrammeerd hebben. Een man begrijpt bijvoorbeeld een vrouw niet, en andersom.
Hopelijk houden ze hier rekening mee :+
Goed nieuws, een opensource spraakherkennings applicatie.

In hoeverre is het hier mogelijk om spraak te herkennen en te genereren?
Lijkt me wel leuk om in hobby programma's te implementeren. :)
Tja, de concurrentie komt weer wat los rond dit topic (doet me denken aan de Belgische L&H, waar nu eindelijk het onderzoek naar afgerond is en de rechtzaak kan beginnen).

Dit kwam ik laatst tegen over Voice Recognition in WV (of UV voor de nerds): http://channel9.msdn.com/ShowPost.aspx?PostID=166367
IBM is natuurlijk ook al jaren bezig met spraakherkenning. In OS/2 Warp 4.0 zat ook al een spraakherkenningscomponent, die het af en toe zelfs aardig deed (we praten dan wel over september 1996).

Spraakherkenning an sich is misschien niet zo heel erg moeilijk, maar taal- en begripsherkenning is dat wel. Als je gewoon spreekt maak je veel kleine vergissingen die een goede verstaander er wel uitfiltert, maar dat is voor software vaak wat lastiger. Het meestgebruikte woord in de meeste talen is ongetwijfeld iets als 'eh'.

Als de software dit letterlijk over zou nemen zou je nog altijd vrij veel aan een tekst moeten schaven om er een behoorlijk stukje proza van te maken.

Voor taken met een beperkt vocabulair zou het misschien wel erg handig kunnen zijn. Ik ben benieuwd of er nog eens een IDE echt iets gaat doen met spraakherkenning, het zou voor veel programmeurs een boel werk kunnen schelen.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True