IBM werkt aan computer die twintig talen kan verstaan

Nu de techniek betreffende spraakherkenning steeds verder vordert, begint IBM aan vergaande toepassingen te denken. Het bedrijf wil namelijk al in 2010 een computersysteem afleveren, dat maar liefst twintig talen zal kunnen verstaan. Op dit moment is de mens nog steeds drie tot tien keer beter in het verstaan van een taal, zodat er nog hevig doorgewerkt zal moeten worden door de twintig medewerkers die op het project gezet zijn.

De grootste problemen bevinden zich nog bij het filteren van achtergrondgeluiden en het goed verstaan van mensen die met een accent praten. Ook de context van een zin is nog steeds een lastig probleem, aangezien deze goed begrepen moet worden voor de juiste schrijfwijze van bepaalde woorden. Zo is het voor een computer nog erg moeilijk om bij een zin als "De leider lijdt aan een besmettelijke ziekte" in te zien dat lijdt met een lange ij geschreven dient te worden.

Men verwacht echter dat alle obstakels over ongeveer tien jaar opgelost zullen zijn, waarna het ontwikkelde systeem in eerste instantie zijn toepassing zal vinden in de medische en juridische wereld. Vooral voor het notuleren in dat laatste geval is het belangrijk om de uitgebreide training die spraakherkenningprogramma's nu nog nodig hebben overbodig te maken, aangezien het natuurlijk niet praktisch zou zijn als getuigen eerst uren tegen een computer aan zouden moeten praten voordat deze hun verklaringen kan notuleren.

Met dank aan de Automatisering Gids.

Vorig nieuwsartikel Volgend nieuwsartikel

Door Mark Timmer

Feedback • 26-01-2002 10:21 32

26-01-2002 • 10:21

Bron: Automatisering Gids

Lees meer

Natuurlijke spraakherkenning wordt steeds beter Nieuws van 9 juli 2003

Intel leert computers liplezen Nieuws van 30 april 2003

Tom's Hardware Guide praat tegen de pc Nieuws van 1 december 2002

ST brengt spraakherkenning naar embedded systemen Nieuws van 14 maart 2002

Meer producten en artikelen

Software

Reacties (32)

-Moderatie-faq

Wijzig sortering

CyberSnooP 26 januari 2002 11:39

Er zijn soms zinnen in het Nederlands (volgens mij in elke taal) die gewoon voor meerdere betekenissen opvatbaar zijn. Ook wij mensen kunnen soms dus niet exact begrijpen wat er wordt bedoeld.
Ik ben benieuwd hoe men dat wil gaan oplossen. (d.m.v. vragende software misschien?)

Verder denk ik dat het technisch mogelijk moet zijn dat een computer bijna niet aan je stem hoeft te wennen. Zo kan ik me voorstellen dat ie 3 zinnen hoort, de 1e zin begrijpt hij een woord niet, maar met alle kennis (m.b.t. tot de stem van de spreker) in de 2 volgende zinnen, kan hij dat woord alsnog herkennen.

Tegen de tijd dat dit soort systemen echt voor iedereen beschikbaar zijn, zitten we al diep in het GHz&GB tijdperk, dus zal dat al-met-al een minder groot probleem worden.

Nielsz @CyberSnooP • 26 januari 2002 11:43

Dat gebeurt nu al.
Als ik zeg:

"ten behoeve #@#"; dan gaat de pc kijken welke woorden er in combinatie met de eerste 2 kunnen, en uit die woorden kiest hij diegene die er het meeste op lijkt.

Maar toch, imho zal een pc altijd aan een gebruiker moeten wennen want een Fries is nu eenmaal geen Hagenees

added: het woord is btw "van"

curry684 @Nielsz • 26 januari 2002 15:53

offtopic:
Je bedoelt dus dat de techniek pas ver genoeg is als een computer iemand als Johan Cruyff kan volgen die zich niet stoort aan zulke standaard zinsconstructies...

Het is natuurlijk niet minder dan logisch dat dit soort aannames toegepast moeten worden, omdat er nu eenmaal inherente problemen zijn met de ambigue elementen van een taal. Het voorbeeld dat je geeft is IRL een kleuterschoolopgave om kinderen te leren omgaan met standaardconstructies, en simpel gezegd moet je om een computer een taal te leren exact hetzelfde onderwijstraject volgen. Op het moment werken de computers nog bijna alleen imperatief, oftewel het herkennen van simpele commando's zoals 'Alarm Uit', wat eigenlijk de baby-fase van de sprekende/luisterende mens is.

Er is nog een weg te gaan...

Tjark 26 januari 2002 12:58

Zo is het voor een computer nog erg moeilijk om bij een zin als "De leider lijdt aan een besmettelijke ziekte" in te zien dat lijdt met een lange ij geschreven dient te worden.

Dit soort problemen kunnen opgelost worden met huidige NLP technieken. De comp zal bij 'lijdt' ook een activatie van 'leidt' hebben bij het herkennen van de waveform. Uiteindelijk heeft de comp van een uiting (bv. een zin) opgehakt in allerlei mogelijke verdelingen. De kansen voor 'leidt' en 'lijdt' zullen heel erg dicht tegen elkaar liggen.

Als er nu een NLP systeempje over de woordgraaf zal gaan zal de waarschijnlijkheid van 'lijdt/leidt' met het volgende woord, hier 'aan', ervoor zorgen dat de kans op 'lijdt aan' een stuk groter is dan 'leidt aan'.

Als je geinteresseerd bent in dit soort zaken en je weet nog niet wat je na je VWO wil doen: kijk eens naar de studie Taal, Spraak & Informatica bij de Universiteit van Nijmegen.

AdLentis @Tjark • 26 januari 2002 13:16

Als er nu een NLP systeempje over de woordgraaf zal gaan zal de waarschijnlijkheid van 'lijdt/leidt' met het volgende woord, hier 'aan', ervoor zorgen dat de kans op 'leidt aan' een stuk groter is dan 'lijdt aan'.

Ik neem aan dat je bedoelt dat de kans op 'lijdt aan' een stuk groter is dan 'leidt aan'.

Tjark @AdLentis • 26 januari 2002 13:19

erm.. ja.. stom, ik bedoel natuurlijk andersom

ff verbeteren

-done-

Verwijderd 26 januari 2002 10:25

Hmm, komen de voorspellingen van Star Trek toch uit

Je zult hiervoor veel geheugen & CPU-power nodig hebben, momenteel heb je 'n behoorlijk zware machine nodig voor 'n beetje spraakherkenning & 100% betrouwbaar is 't helaas nog steeds niet.

Nielsz @Verwijderd • 26 januari 2002 10:29

Nou dat valt behoorlijk mee hoor. Ik hou me bezig met spraakherkenning, en daar heb je echt geen superpc voor nodig. Onze herkenningsservers draaien gewoon op 256; en ze konden zelfs draaien op 128 MB. Dus dat is niet echt heftig.

En tegenwoordig zit je, na een beetje oefening al gauw op een herkenning van 98, 99% Hoger lukt idd nog niet. Wat wel betekend dat er op de 100 woorden 2 fout gaan, en dat is nog best veel.

Verwijderd @Nielsz • 26 januari 2002 10:33

Ik had 'n jaar geleden Via-voice van Philips geprobeerd op 'n systeem met 'n PIII 500 & 128 MB RAM & dat liep niet echt snel & 't leertraject was behoorlijk lang van 't programma.
Ik moet je eerlijk bekennen dat ik niet recentelijk met spraakherkenning heb gewerkt, dus daar zou je wel gelijk in kunnen hebben.
Ik hoop alleen dat 't straks mogelijk is om zonder 't trainen van 't programma, goede spraakherkenning te krijgen.

Nielsz @Verwijderd • 26 januari 2002 10:44

Het ligt er maar net aan waar je het voor wilt gebruiken; en dus welke 'lexicon' je gebruikt. Het is 'onmogelijk' om een algemene lexicon te maken die je overal voor kan gebruiken. Maar in bijvoorbeeld de medische en in de advocatuur sector; hebben we goede lexicons, en is de spraakherkenning meteen erg hoog.
Maar het zal altijd zo blijven dat de computer aan je stem moet wennen.

added: hej grappig; ze zullen eerst toepassing vinden in de medische en de juridische sector, dat is precies onze doelgroep

Verwijderd @Verwijderd • 26 januari 2002 14:16

Via Voice is van IBM.
Free Speech is van Philips

sab 26 januari 2002 13:16

Misschien miereneukerij; maar werkt IBM niet aan software die 20 talen kan verstaan? Nu lijkt het net alsof ze een compleet nieuw systeeem aan het bouwen zijn.

Tjark @sab • 26 januari 2002 13:22

Misschien werken ze aan chips die een aantal zaken in hardware uit kan voeren zodat het herkenningsprocess sneller gaat?

Maar ik denk het niet: 't zal wel om software gaan.

AdLentis @sab • 26 januari 2002 13:23

Ik denk dat ze een compleet nieuw systeem aan het bouwen zijn ja.

Als je ook hardware speciaal voor spraakherkenning gaat gebruiken, kan dat volgens mij aardig wat performancewinst opleveren die je weer kunt gebruiken om beter te herkennen.

edit:

Ik was weer 's te laat ...

Tux 26 januari 2002 11:30

hmz... mij lijkt het niks om te programmeren met mn sten

The System @Tux • 26 januari 2002 20:06

Gamen...?

forward forward left left other left ! jump shoot jump jump run run shoot forward jump crounch right aaargh

word je lekker hees na een potje UT

TheGhostInc @The System • 27 januari 2002 02:17

shoot..... (je mist) ... shit....

Verwijderd @TheGhostInc • 27 januari 2002 18:44

En toen liet je een scheet! Wat over 10 jaar mogelijk in de 3Dgamerealitywereld!

Verwijderd 26 januari 2002 13:11

Zou het niet makkelijker zijn om 1 spreekcomputertaal te maken? Ik heb weleens gehoord van een taal die je in een week kunt leren, volgens mij was dat esperanza ofzoiets. Als je in die nieuwe taal nou alle problemen met dubbele woordspeling etc ontwijkt dan is spraakherkenning ineens heel dichtbij.
Dan heb ik het natuurlijk niet over een programmeertaal zoals C maar echt 1 die je ook in het dagelijks leven kunt gebruiken. Lijkt mij een stuk makkelijker dan voor 1000 talen (geen idee hoeveel talen er zijn) software te maken.

Tjark @Verwijderd • 26 januari 2002 16:54

En dan moet 'iedereen' die computerspreektaal leren?

Hallo? Hoeveel mensen in NL kunnen niet eens Engels of Duits (en dan heb ik het niet over dat camping-gebrabbel)

Dan kun je beter meteen de hele wereldbevolking Engels gaan leren en dat als voertaal ook te gaan gebruiken. Weg met NL, Duits, Frans, etc!
Of beter: spaans of chinees.

Verder hoort ambiguiteit in de taal. Wat is er leuke dan

Ik zie de man met de verrekijker

Verwijderd @Tjark • 27 januari 2002 11:19

Ik ken dat voorbeeld ook:

" I saw him with a telescope ".

Zie je hem door een telescoop?
Zie je hem lopen met een telescoop?
Zaag je hem doormidden met een telescoop?

Verwijderd 26 januari 2002 14:26

Lijkt me sowieso wel geinig om een bedrijf binnen te stappen en te schreeuwen: "Format C: Yeeeeeeesssss!!!!!!!!!"

StGermain @Verwijderd • 26 januari 2002 14:33

En die PC antwoord dan: "I'm sorry DaQuilla... I'm afraid I can't do that"

pmeter 27 januari 2002 17:39

Over 8 jaar het definitieve einde van het (door computergebruik veroorzaakte) RSI !!!!

0siris @pmeter • 27 januari 2002 18:39

dan krijg je vast Repetitive-Slaplullen-Injury, dus ik denk dat RSI nog wel ff zal blijven

Verwijderd 26 januari 2002 11:11

Ze kunnen ook een team samenstellen die vanuit de andere kant naar de PC toe werkt.
Dit team kan dan de spelling en grammatica vereenvoudigen.

Verwijderd 26 januari 2002 13:30

Het zal, tegen de tijd dat IBM deze pc echt uit gaat brengen en deze "nieuwe" techniek geintroduceerd wordt in het bedrijfsleven / consumentenmarkt, volgens mij best wel een cultuurverandering moeten plaatsvinden. Het is nog maar de vraag of de tijd er rijp voor is, omdat deze techniek ongetwijveld op verschillende manieren gebruikt gaat worden

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (32)

Sorteer op:

Weergave: