Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 27 reacties
Bron: News.com

Hoewel er steeds meer vooruitgang geboekt wordt op het gebied van text-to-text-vertalingen, blijken er nog heel wat moeilijkheden om de hoek te komen kijken wanneer spraak toegevoegd wordt aan de vertaling. IBM is een van de bedrijven die hard werkt aan de technologie van de toekomst door zich toe te leggen op allerlei verschillende manieren van software-matige vertaling. News.com meldt ons dat Big Blue momenteel werkt aan een apparaat dat mensen moet helpen om taalbarrières te overwinnen door het gesproken woord te vertalen.

WoordenboekDe technologie die dit mogelijk moet maken bevat een aantal stappen. Om te beginnen zet het apparaat een door een microfoon ingesproken zin om in tekst. Deze tekst, die bijvoorbeeld een Nederlandstalige zin omvat, wordt vertaald naar een andere taal. Het apparaatje, dat gebruik maakt van IBM's Multilingual Automatic Speech-to-Speech Technology (MASTOR) geeft de originele Nederlandse tekst weer, met daarnaast de vertaalde zin. Tot slot wordt de vertaalde zin weer omgezet naar een geluidsbestand, dat de vertaalde zin ten gehore geeft aan de omgeving.

Hoewel deze technologie een rooskleurige toekomst tegemoet kan gaan, moet er nog veel werk verzet worden. Zo moet de software verbeterd worden op het gebied van speech-to-text, text-to-text en text-to-speech voor er in de praktijk gebruik gemaakt van zou kunnen worden. MASTOR zal gebruik maken van de betekenis van zinnen om ze efficiënter te vertalen. Zo zouden verschillende zinnen die dezelfde betekenis hebben vertaald worden naar één en dezelfde zin, waardoor de software minder database-intensief is en minder schijfruimte nodig heeft. Hierdoor zal het in de toekomst wellicht mogelijk zijn de software te gebruiken op PDA's en andere draagbare apparatuur:

IBM logoResearchers also envision the speech technology being used to translate newscasts, enabling a media outlet to provide, for example, nearly real-time reports in multiple languages from an event such as the U.S. Open. Researchers also say companies could use the technology for conference calls or meetings, although it still needs a lot of refinement before it's ready for such uses.
Moderatie-faq Wijzig weergave

Reacties (27)

Je kan eigenlijk nooit 100% simultaan vertalen daar je eerst de betekenis van de zin moet begrijpen...

Is het niet gewoon makkelijker als iedereen engels gaat praten? :Y)
gemakkelijker gezegt dan gedaan.
En ja, in sommige landen zijn ze gewoon koppig.

Maar wat denk ik voornamelijk een probleem is. Is dat alles op TV wordt na gesynchoniseerd (of zoiets). Dus ze hebben geen nood om het te leren.
Toevallig...
Vandaag was er een stukje bij Netwerk over de spraakverwarring bij de EU.
De uitbreiding van de EU kost de belastingbetaler 1 miljard Euro voor het vertaalwerk wat erbij komt.
( Video volgt binnenkort. )
Hmmz, dan ga ik me toch afvragen waar je je meer aan gaat ergeren, de rot klinkende stem of de foute vertalingen.
Valt mee, kijk hier maar eens. IBM laat daar horen hoe de software diverse texten uitspreekt. Klinkt echt goed, hoewel je natuurlijk niet zeker weet of je deze kwaliteit in een portable gadget krijgt gepropt...
Over een paar jaar kan het.
Aan de ene kant worden de alogaritmes 'slimmer', en aan de andere kant wordt processorkracht makkelijker te krijgen (lager stroomverbruik / rekenkracht)
Hmm, misschien ligt het aan mij, maar sinds de eerste keer dat ik TTS hoorde met mijn SoundBlaster 16, zijn de "stemmen" niet echt veranderd. (Ik erger me alleen aan Microsoft's TTS stemmen)
Het text-to-text gedeelte lijkt me nog het belangrijkst.

De herkenningsgraad van speech-to-text is voor sommige programma's al best hoog, zeker als je er rekening mee houdt dat je tegen een computer praat. Dus niet té snel praten en duidelijk (=normaal) articuleren. Bovendien kun je meestal op het scherm zien wat de computer denkt dat je zegt, en zo nodig corrigeren.

Ook text-to-speech is niet zo'n probleem. Het klinkt vooralsnog wel volkomen a-natuurlijk, maar het is begrijpbaar. Dat neemt natuurlijk niet weg dat het nog een stuk beter moet kunnen. :)

Alleen als de daadwerkelijke text-text vertaling niet goed is... tja dan is er een probleem. Dan zijn de vertalingen waardeloos omdat je er niet van op aan kunt.

Maar goed, echte Star Trek translators zijn nog ver weg. :)
Het klinkt vooralsnog wel volkomen a-natuurlijk, maar het is begrijpbaar
Nou als je op de site van IBM gaat Luisteren zoals D!D! hierboven al zei, dan komen de eerste 2 stemen wel heel dicht bij menselijk (vind ik)

[edit]
wat ook heel grappig is, HIER staat nog een andere versie van die text2speach.
Als je hier de standaard text laat staan, en kiest voor de Japanse taal, dan klinkt het echt alsof een Jappanner engels probeerdt te praten! :P
Dat is wel ERG goede kwaliteit. Probeer eens een stukje text van een Engelstalige website in te plakken en dat te laten voorlezen. Is heel goed verstaanbaar en prettiger om naar te luisteren dan huidige pogingen van text -to-speech.
probeer http://www.lhsl.com/realspeak/demo/ eens! echt geweldige demo, je kunt ook typen ed, MAARRRR hier kun je ook talen kiezen, waaronder Nederlands! ik heb een een zelf-gemaakt filmpje compleet laaten voice-overen door de nederlandse en belgische vrouwenstemmen van de site :D
Erg interessante site en zeer geslaagd idee van dat voice-overen. :Y)

Een dingetje: De site lijkt niet helemaal privacy-safe... nadat ik de pagina een tijdje had laten staan, en weer opnieuw op de playknop van WMP drukte, hoorde ik opeens (in Nederlands) een andere tekst: "Martijn Damming laat zich graag \[zelf-censuur]"

Zojuist weer wat anders: een tekst in het Duits.
babelfishje in je oor :)
IBM werkt aan universeel vertaalapparaat
Haha waarom moet ik bij het lezen van deze titel toch aan die oude IBM commercial denken die nu weer op TV is? :)
Ik had gehoord dat er vroeger al een software bedrijf bezig was met de universele vertaler en in een heel ver stadium zat.
Er bestaat namelijk een indiaanse taal die als een soort algemene taal in de software wordt gebruikt omdat deze taal daar uitermate geschikt (gezien de gramatica enzo) voor is.
Nederlands wordt dan vertaald naar deze taal en wordt daarna naar een andere taal vertaald zoals Frans.

Was lang geleden dat ik dit te horen heb gekregen en weet ook niet meer waarom het gestopt was.
Text-to-Speech is altijd lastig.
In principe heb je één taal als referentie, wat tot gevolg heeft dat je vaak fonetisch moet typen.
IBM had onder OS/2-Warp een Speech-to Text (Engels, natuurlijk) en die werkte vrij aardig. Met name als je wat REXX-scriptjes wilde maken was dat best bruikbaar.

Niettemin was (en is het voorlopig) niet meer dan spielerei.
Er is nog heel wat werk te verzetten:
Eerst moet de gesproken tekst beter herkend gaan worden, het probleem met deze dingen is dat je eerst een uur (of langer) een verhaaltje moet inspreken om het ding je stem te laten "leren", dat lijkt me voor een vertaalgadget niet echt handig, ik vraag me alleen af of daar iets aan gedaan kan worden.
Daarna moet de zinsopbouw + grammatica worden geanaliseerd en vervolgens moet daarvan weer een zin in een andere taal van gefabriceerd worden.
Er zijn dus heel wat punten waar fouten op kunnen (gaan) treden.
Bovendien zal het Nederlands wel weer als laatste aan bod komen :'(
Probeer maar eens gesproken Chinees te vertalen, er bestaan meer dan genoeg dialecten. Elke streek heeft een totaal verschillend eigen spreektaaltje, zodat mijn vader totaal andere (minder dan 10% gelijkenissen) soort Chinees spreekt dan mijn moeder en ze komen allebei van Hong Kong.

Text-to-text is al moeilijk genoeg, daarmee is het nog te doen om Chinees te vertalen, want er zijn maar 2 soorten (traditioneel/vereenvoudigd) geschreven Chinees.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True