Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 32 reacties
Bron: Automatisering Gids

SpraakherkenningNu de techniek betreffende spraakherkenning steeds verder vordert, begint IBM aan vergaande toepassingen te denken. Het bedrijf wil namelijk al in 2010 een computersysteem afleveren, dat maar liefst twintig talen zal kunnen verstaan. Op dit moment is de mens nog steeds drie tot tien keer beter in het verstaan van een taal, zodat er nog hevig doorgewerkt zal moeten worden door de twintig medewerkers die op het project gezet zijn.

De grootste problemen bevinden zich nog bij het filteren van achtergrondgeluiden en het goed verstaan van mensen die met een accent praten. Ook de context van een zin is nog steeds een lastig probleem, aangezien deze goed begrepen moet worden voor de juiste schrijfwijze van bepaalde woorden. Zo is het voor een computer nog erg moeilijk om bij een zin als "De leider lijdt aan een besmettelijke ziekte" in te zien dat lijdt met een lange ij geschreven dient te worden.

Men verwacht echter dat alle obstakels over ongeveer tien jaar opgelost zullen zijn, waarna het ontwikkelde systeem in eerste instantie zijn toepassing zal vinden in de medische en juridische wereld. Vooral voor het notuleren in dat laatste geval is het belangrijk om de uitgebreide training die spraakherkenningprogramma's nu nog nodig hebben overbodig te maken, aangezien het natuurlijk niet praktisch zou zijn als getuigen eerst uren tegen een computer aan zouden moeten praten voordat deze hun verklaringen kan notuleren.

Met dank aan de Automatisering Gids.

Moderatie-faq Wijzig weergave

Reacties (32)

Er zijn soms zinnen in het Nederlands (volgens mij in elke taal) die gewoon voor meerdere betekenissen opvatbaar zijn. Ook wij mensen kunnen soms dus niet exact begrijpen wat er wordt bedoeld.
Ik ben benieuwd hoe men dat wil gaan oplossen. (d.m.v. vragende software misschien?)

Verder denk ik dat het technisch mogelijk moet zijn dat een computer bijna niet aan je stem hoeft te wennen. Zo kan ik me voorstellen dat ie 3 zinnen hoort, de 1e zin begrijpt hij een woord niet, maar met alle kennis (m.b.t. tot de stem van de spreker) in de 2 volgende zinnen, kan hij dat woord alsnog herkennen.

Tegen de tijd dat dit soort systemen echt voor iedereen beschikbaar zijn, zitten we al diep in het GHz&GB tijdperk, dus zal dat al-met-al een minder groot probleem worden.
Dat gebeurt nu al.
Als ik zeg:

"ten behoeve #@#"; dan gaat de pc kijken welke woorden er in combinatie met de eerste 2 kunnen, en uit die woorden kiest hij diegene die er het meeste op lijkt.

Maar toch, imho zal een pc altijd aan een gebruiker moeten wennen want een Fries is nu eenmaal geen Hagenees :)

added: het woord is btw "van" ;)
offtopic:
Je bedoelt dus dat de techniek pas ver genoeg is als een computer iemand als Johan Cruyff kan volgen die zich niet stoort aan zulke standaard zinsconstructies... ;)


Het is natuurlijk niet minder dan logisch dat dit soort aannames toegepast moeten worden, omdat er nu eenmaal inherente problemen zijn met de ambigue elementen van een taal. Het voorbeeld dat je geeft is IRL een kleuterschoolopgave om kinderen te leren omgaan met standaardconstructies, en simpel gezegd moet je om een computer een taal te leren exact hetzelfde onderwijstraject volgen. Op het moment werken de computers nog bijna alleen imperatief, oftewel het herkennen van simpele commando's zoals 'Alarm Uit', wat eigenlijk de baby-fase van de sprekende/luisterende mens is.

Er is nog een weg te gaan...
Zo is het voor een computer nog erg moeilijk om bij een zin als "De leider lijdt aan een besmettelijke ziekte" in te zien dat lijdt met een lange ij geschreven dient te worden.
Dit soort problemen kunnen opgelost worden met huidige NLP technieken. De comp zal bij 'lijdt' ook een activatie van 'leidt' hebben bij het herkennen van de waveform. Uiteindelijk heeft de comp van een uiting (bv. een zin) opgehakt in allerlei mogelijke verdelingen. De kansen voor 'leidt' en 'lijdt' zullen heel erg dicht tegen elkaar liggen.

Als er nu een NLP systeempje over de woordgraaf zal gaan zal de waarschijnlijkheid van 'lijdt/leidt' met het volgende woord, hier 'aan', ervoor zorgen dat de kans op 'lijdt aan' een stuk groter is dan 'leidt aan'.

Als je geinteresseerd bent in dit soort zaken en je weet nog niet wat je na je VWO wil doen: kijk eens naar de studie Taal, Spraak & Informatica bij de Universiteit van Nijmegen. :)
Als er nu een NLP systeempje over de woordgraaf zal gaan zal de waarschijnlijkheid van 'lijdt/leidt' met het volgende woord, hier 'aan', ervoor zorgen dat de kans op 'leidt aan' een stuk groter is dan 'lijdt aan'.
Ik neem aan dat je bedoelt dat de kans op 'lijdt aan' een stuk groter is dan 'leidt aan'. ;)
erm.. ja.. stom, ik bedoel natuurlijk andersom :o
ff verbeteren :)

-done-
Hmm, komen de voorspellingen van Star Trek toch uit :)

Je zult hiervoor veel geheugen & CPU-power nodig hebben, momenteel heb je 'n behoorlijk zware machine nodig voor 'n beetje spraakherkenning & 100% betrouwbaar is 't helaas nog steeds niet.
Nou dat valt behoorlijk mee hoor. Ik hou me bezig met spraakherkenning, en daar heb je echt geen superpc voor nodig. Onze herkenningsservers draaien gewoon op 256; en ze konden zelfs draaien op 128 MB. Dus dat is niet echt heftig.

En tegenwoordig zit je, na een beetje oefening al gauw op een herkenning van 98, 99% Hoger lukt idd nog niet. Wat wel betekend dat er op de 100 woorden 2 fout gaan, en dat is nog best veel.
Ik had 'n jaar geleden Via-voice van Philips geprobeerd op 'n systeem met 'n PIII 500 & 128 MB RAM & dat liep niet echt snel & 't leertraject was behoorlijk lang van 't programma.
Ik moet je eerlijk bekennen dat ik niet recentelijk met spraakherkenning heb gewerkt, dus daar zou je wel gelijk in kunnen hebben.
Ik hoop alleen dat 't straks mogelijk is om zonder 't trainen van 't programma, goede spraakherkenning te krijgen.
Het ligt er maar net aan waar je het voor wilt gebruiken; en dus welke 'lexicon' je gebruikt. Het is 'onmogelijk' om een algemene lexicon te maken die je overal voor kan gebruiken. Maar in bijvoorbeeld de medische en in de advocatuur sector; hebben we goede lexicons, en is de spraakherkenning meteen erg hoog.
Maar het zal altijd zo blijven dat de computer aan je stem moet wennen.

added: hej grappig; ze zullen eerst toepassing vinden in de medische en de juridische sector, dat is precies onze doelgroep :)
Via Voice is van IBM.
Free Speech is van Philips
Misschien miereneukerij; maar werkt IBM niet aan software die 20 talen kan verstaan? Nu lijkt het net alsof ze een compleet nieuw systeeem aan het bouwen zijn.
Misschien werken ze aan chips die een aantal zaken in hardware uit kan voeren zodat het herkenningsprocess sneller gaat?

Maar ik denk het niet: 't zal wel om software gaan.
Ik denk dat ze een compleet nieuw systeem aan het bouwen zijn ja. (8> Als je ook hardware speciaal voor spraakherkenning gaat gebruiken, kan dat volgens mij aardig wat performancewinst opleveren die je weer kunt gebruiken om beter te herkennen. :9

edit:

Ik was weer 's te laat ... |:( ;)
hmz... mij lijkt het niks om te programmeren met mn sten :+
Gamen...?

forward forward left left other left ! jump shoot jump jump run run shoot forward jump crounch right aaargh

word je lekker hees na een potje UT }>
shoot..... (je mist) ... shit.... :+
En toen liet je een scheet! Wat over 10 jaar mogelijk in de 3Dgamerealitywereld!
Zou het niet makkelijker zijn om 1 spreekcomputertaal te maken? Ik heb weleens gehoord van een taal die je in een week kunt leren, volgens mij was dat esperanza ofzoiets. Als je in die nieuwe taal nou alle problemen met dubbele woordspeling etc ontwijkt dan is spraakherkenning ineens heel dichtbij.
Dan heb ik het natuurlijk niet over een programmeertaal zoals C maar echt 1 die je ook in het dagelijks leven kunt gebruiken. Lijkt mij een stuk makkelijker dan voor 1000 talen (geen idee hoeveel talen er zijn) software te maken.
En dan moet 'iedereen' die computerspreektaal leren?

Hallo? Hoeveel mensen in NL kunnen niet eens Engels of Duits (en dan heb ik het niet over dat camping-gebrabbel)

Dan kun je beter meteen de hele wereldbevolking Engels gaan leren en dat als voertaal ook te gaan gebruiken. Weg met NL, Duits, Frans, etc!
Of beter: spaans of chinees. :)

Verder hoort ambiguiteit in de taal. Wat is er leuke dan

Ik zie de man met de verrekijker :)
Ik ken dat voorbeeld ook:

" I saw him with a telescope ".

Zie je hem door een telescoop?
Zie je hem lopen met een telescoop?
Zaag je hem doormidden met een telescoop?

:)
Lijkt me sowieso wel geinig om een bedrijf binnen te stappen en te schreeuwen: "Format C: Yeeeeeeesssss!!!!!!!!!"
En die PC antwoord dan: "I'm sorry DaQuilla... I'm afraid I can't do that" :+
Over 8 jaar het definitieve einde van het (door computergebruik veroorzaakte) RSI !!!! :*)
dan krijg je vast Repetitive-Slaplullen-Injury, dus ik denk dat RSI nog wel ff zal blijven ;)
Ze kunnen ook een team samenstellen die vanuit de andere kant naar de PC toe werkt.
Dit team kan dan de spelling en grammatica vereenvoudigen.
Het zal, tegen de tijd dat IBM deze pc echt uit gaat brengen en deze "nieuwe" techniek geintroduceerd wordt in het bedrijfsleven / consumentenmarkt, volgens mij best wel een cultuurverandering moeten plaatsvinden. Het is nog maar de vraag of de tijd er rijp voor is, omdat deze techniek ongetwijveld op verschillende manieren gebruikt gaat worden

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True