Hoofdcategorieën

Communiceren met computers via spraak onmogelijk

Door Ralph Smeets, donderdag 9 mei 2002 20:05
Bron: Washington Post, views: 1.026

In een interview van de Washington Post geeft Ben Shneiderman van de universiteit van Maryland zijn visie op de toekomstige communicatie met computers. Hij stelt dat we in de toekomst via visuele tools met computers zullen communiceren in tegenstelling tot wat sciencefictionfilms als "2001 A Space Odyssey" ons willen laten geloven. In deze film communiceren de astronauten met hun computer HAL via spraak. Volgens Ben Shneiderman heeft onderzoek uitgewezen dat een mens niet goed kan nadenken op het moment dat hij spreekt. Een simpel commando als "page down" neemt zoveel geheugen in de hersenen in beslag dat het moeilijker wordt om zich op de taak waar je mee bezig bent te concentreren.

HAL van 2001 A Space OdysseyUit hetzelfde onderzoek is gebleken dat klikken met een muis, oog-handcoördinatie, een ander gedeelte van de hersenen gebruikt wordt dan bij spraak en niet in conflict komt met het nadenken over de taak die je wil verrichten. Ben Shneiderman is van mening dat het gebruik van visuele tools in de toekomst de manier zal zijn waarop we computers zullen besturen. Een goed voorbeeld van een visuele tool is PhotoMesa dat onder leiding van een collega van Ben Shneiderman, Ben Bederson, is ontwikkeld. Met PhotoMesa kan men duizenden directories met thumbnails van foto's weergeven om daarna met behulp van het inzoomen op een gedeelte, de gezochte foto kan vinden. Leslie Walker, de auteur van het artikel, bleek met PhotoMesa een foto van haar dochter binnen tien minuten tussen duizenden foto's op haar PC te hebben gevonden. Een foto waar ze ongeveer vier maanden tevergeefs naar had gezocht.

Voor producten die zich richten op het dicteren van een brief - een onderdeel van de spraaktechnologie die in het artikel niet aan de orde komt - is vanzelfsprekend wel een markt, aangezien er in dit geval geen sprake is van het moeten nadenken over de gesproken taal.

Met dank aan masteraj voor de tip.

Volgende 23:24
Vorige 19:41

Reacties

«  1  2  3  4  »

Het zou te gek zijn als dat kon woei :P

jaja, het is dus niet de computer die het niet kan, maar de mens die het niet kan :?

jaja, het is dus niet de computer die het niet kan, maar de mens die het niet kan :?
Ik denk dat het wel kan, na verloop van tijd raak je er aan gewend denk ik. Eerst zul je wel veel na moeten denken maar dat went vast wel...

Ik denk dat het wel kan, na verloop van tijd raak je er aan gewend denk ik. Eerst zul je wel veel na moeten denken maar dat went vast wel...

Nee, volgens het artikel is het geen kwestie van gewenning, maar een kwestie van niet kunnen.

Ik denk dat het artikel een vorm van waarheid in zich heeft. Ik kan me voorstellen dat, als je over 10 jaar een verhaal in de computer wilt kijgen via spraak, dat je moeite hebt om de rooie draad in het verhaal te volgen en tegerlijkertijd "spatie, save, page down, inspringen etc" te roepen.

Het lijkt mij veel makkelijker om, net zoals nu, lekker door te typen en er tussendoor ff snel op <ctrl>-<s> te drukken.

Maar ik zie ook niet in hoe je straks een brief kan "typen" via visuele tools. Moet je dan icoontjes voor een seconde of twee aankijken?

Pasgeleden was het bericht dat de huidige jonge generatie GSM gebruikers de duim-wijsvinger coördinatie heeft omgedraaid, en dat binnen één generatie. Niets lijkt mij onmogelijk!

Vervolgens zou ik een computer waar ik "spatie, save, page down" tegen moet zeggen direct het raam uitkieperen, dat moet dat ding zelf maar snappen. Hopelijk zijn we over een aantal jaren zover dat computers zoveel taalkundig inzicht hebben (jaja, ik weet hoe moeilijk dat is) dat ze ons onbeholpen gestamel kunnen omknutselen tot goede begrijpelijke zinnen waar wellicht ook nog de oorspronkelijke bedoeling in uitkomt.

Waar ik zeker in geloof is de koppeling tussen mijn luttel aantal hersencellen en de computer, afgelopen week kon men ratten op afstand besturen, terwijl er nu ook al computers reageren op oogbewegingen van gehandicapten. De koppeling naar hersengolven is slechts een kwestie van tijd. Dus wellicht niet meer in een microfoon lopen balken, maar je brief "denken". Alleen dan niet de optie "autosend" aanzetten, voor je het weet staat erin wat je werkelijk had willen zeggen tegen je baas ....

Het neigt naar zo'n uitspraak als van: 640 KB is genoeg voor iedere toepassing, of, er is maar een wereldmarkt voor 5 computers.

Mensen zijn bij uitstek goed in het zichzelf aanpassen. Of noem het evolutie. Wij gaan echt wel met computers praten, en andersom dus ook. Maak het maar.

kijk het gaat er om, wij kunnen een pc bestuuren en tegelijkertijd communiceren oid. Wanneer je een pc met spraak moet besturen en tegelijkertijd ook communiceren met de medemens dan komt de persoon én pc in de knoei.

Computer kan alles :P

Onmogelijk bestaat niet, het kan misschien erg lang duren voordat mensen slim genoeg zijn om er iets voor te maken.

Zal denk ik meer een combinatie worden van zowel spraak als een andere interface. Scherp uit dit artikel is wel dat een geheel stembestuurd systeem alleen maar lastig zou zijn gezien de beperkingen van de mens. We zitten voorlopig dus nog wel even vast met onze toetsenborden en muisjes, als is het alleen maar voor onze 3d-shooters ;)

Ja, en een paarhonderd jaar geleden beweerde men nog dat de aarde plat was.
Niets is onmogelijk....

mmm was sneller gaan dan het licht niet iets onmogelijks? ;)

offtopic :
Neen, sneller reizen dan het licht is theoretisch niet onmogelijk.
Echter bij het versnellen tot aan de snelheid van het licht treden er problemen op.
We moeten gewoon nog een manier verzinnen om in 1 klap van 0 m/s naar C te gaan zonder te versnellen

kleine letter c hombre, kleine letter... ;-)

Ja en toen wisten we ook bijna niks over hoe mensen werkte dus ik bedoel hersenen en andere controle eenheden van het lichaam om het maar computeristisch uit te drukken!

Ik denk zeker niet dat het onmogelijk is om spraakgestuurde kompjoeters te bouwen. Hetgene wat wel zeer complex is de kompjoeter ons te laten begrijpen.. Dan heb ik het niet eens over dialecten oid, maar meer over de betekenis van van woorden en de combinatie daarvan. Ik denk dat het vrijwel onmogelijk is om de die betekenis allemaal in een computer op te slaan, omdat bij iedereen het net weer even iets anders is. Iedereen drukt zich via spraak anders uit. Ook is het zo dat je het gezicht moet kunnen zien voordat je werkelijk weet wat iemand zegt en hoe deze het bedoeld.

Zeer moeilijk en complex.. maar onmogelijk.. nee..

[reactie op Jim]
Niet? en waarom kan ik dan andere mensen wel instrueren iets te laten doen (ook de wat meer complexe taken). Moet ik toch ook denken en praten tegelijkertijd?
[/reactie op Jim]

Het bouwen van die computer is ook niet het probleem volgens het artikel. Het probleem is dat wij niet kunnen praten en denken tegelijk.

hmmz, is er geen gewone exe file voor dat photomesa?

PhotoMesa is een Java 2 1.3 applicatie. PhotoMesa werkt dus op zo ongeveer alles waar een CPU in zit en Java ondersteund zoals Wintel, MacOS, Linux en Solaris.

Met PhotoMesa kan men duizenden directories met thumbnails van foto's weergeven om daarna met behulp van het inzoomen op een gedeelte, de gezochte foto kan vinden. Leslie Walker, de auteur van het artikel, bleek met PhotoMesa een foto van haar dochter binnen tien minuten tussen duizenden foto's op haar PC te hebben gevonden. Een foto waar ze ongeveer vier maanden tevergeefs naar had gezocht.
:? Snap hier echt de ballen niet van :? Die thumbnails kun je met Windows toch ook gewoon laten zien, en met een beetje zoekmachine of grafische browser kom je ook al een heel eind. Waarom is dit systeem nou zo revolutionair :?

Naar aanleiding van het artikel heb ik PhotoMesa geïnstalleerd en het werkt echt anders dan door directories met thumbnails browsen. PhotoMesa geeft alle thumbnails tegelijkertijd weer en door relaties te leggen en in te zoomen kun je gewoon veel sneller vinden wat je zoekt. Met de combinatie van thumbnails en directories doe je alleen maar ordenen. Met PhotoMesa zoek je doormiddel van relaties.
Het is moeilijk uit te leggen, gewoon downen en gebruiken, dan zul je zien wat ik bedoel :)

Een simpel commando als "page down" neemt zoveel geheugen in de hersenen in beslag dat het moeilijker wordt om zich op de taak waar je mee bezig bent te concentreren.
Kan kloppen maar volgens mij hebben ze vrouwen niet in die test mee genomen.
Vrouwen gebruiken hun hersenen beter dan mannen vooral het spraakgedeelte. Bij de kaartlees hersenfunctie moeten ze het nog steeds afleggen :+
Anyway ik kan mij indenken dat dat glitchje zich dus niet bij vrouwen voortdoet.

Voice commands zullen wellicht handig zijn in domotica toepassingen ( computer ... lights please ).
Ik zie me toch nog niet zo tegen m'n pc lullen als 't wellicht sneller gaat met keyboard + muis.
Of games spelen : vooruit vooruit schiet schiet SCHIET ! :)

Ja en kun jij dan ook tegelijke tijd bezig houden met strategische dingen in het spel, nee dan ben je dus alleen maar bezig met het schieten en het lopen maar verder kun je niet nadenken over andere acties die je onderneemt...zoals missie ed..ed...

hmm, op LANs met me vrienden wil het verbale geweldsniveau nogal eens uit de hand lopen en hoe gaat je pc dan reageren als je "GODVERDEGOVDER WELKE GORE KL******** ZIT DAAR TE SNIPEREN IK BLAAS 20 RAKETTEN IN JE R33T!" oid roept?

:?

computer, scan for any deedee-like lifeforms
:+

Interessant. Spraakcommando's kosten relatief veel hersenactiviteit, dat klopt. Muisbewegingen of anderssoortige handelingen als bv een deurkruk beetpakken en openen zijn sneller te automatiseren door de hersenen en kosten relatief dus minder hersenkracht. In dat opzicht heeft Ben Shneiderman gelijk en hij mikt dus op de andere mogelijkheden die dus minder afleiden van het denken. Dit wil nog niet zeggen dat de toekomst daarom niet gericht kan worden op spraakbesturing van computers. Als men het er voor over heeft om het denken af en toe op een lager pitje te zetten om een commando te geven, dan is het wel toepasbaar. Ben Shneiderman kijkt naar de optimale situatie, maar als de spraaksturing commercieel het meest aantrekkelijk is omdat het de mensen handiger lijkt, kan dat ook een kans krijgen. Iedereen is gewend aan denken en commando's geven tegelijk, dat doen we de hele dag ook al is het misschien niet optimaal effectief.
Overigens wordt het besturen/richten via het oog al tijden toegepast op militair niveau bv bij gevechtshelicopters. Daar waar elke seconde telt zijn ze er dus wel achter dat de stem niet de beste manier is.
«  1  2  3  4  »

Op dit item kan niet meer gereageerd worden.

Volgende 23:24
Vorige 19:41
VNU Media logo Powered by True

© 1998 - 2008 Tweakers.net - Alle rechten voorbehouden

Uitgever van: