Hoofdcategorieën
Device Settings

Google werkt aan vertalingssoftware voor smartphones

Door Arnoud Wokke, maandag 8 februari 2010 15:43, views: 12.246

Google werkt aan software die gesproken tekst direct kan vertalen en vervolgens kan uitspreken. Deze speech-to-speech-software moet de stemherkenning van de smartphone Nexus One en de webdienst Google Translate combineren.

Binnen een paar jaar moet er een toestel op de markt zijn dat zelfs in de meest uiteenlopende dialecten en accenten de woorden kan herkennen, zegt Franz Och, bij Google verantwoordelijk voor vertaalsoftware. Net zoals menselijke vertalers zal de software naar hele zinnen luisteren, en dus niet, zoals de huidige vertaalsoftware gewoonlijk doet, proberen een tekst woord voor woord te vertalen.

Omdat er zoveel verschillende talen, dialecten en accenten bestaan, is het lastig om software te ontwikkelen die alles verstaat en kan vertalen. De software zou daarom van de eigenaar moeten leren hoe hij of zij woorden en zinnen uitspreekt; dat zou de spraakanalyse nauwkeuriger maken, zegt Och. Google heeft al spraakherkenning gebouwd in diverse mobiele applicaties, waaronder de zoekapplicaties voor iPhone en Android. De Nexus One kan zelfs helemaal met de stem bestuurd worden.

Google is niet de eerste die speech-to-speech-vertaling op smartphones probeert te krijgen: hardwaremaker Toshiba is bezig met exact hetzelfde.

Babel Fish uit Hitchhiker's Guide to the Galaxy

Volgende 16:16 Club3D heeft overgeklokte HD 5850 en HD 5870 op stapel staan
Vorige 15:19 FBI voert druk opslaan browse-gegevens bij isp's op
Advertentie

Reacties

«  1  2  3  »

Haha grappig.
Zo worden al die rare vertaalapparaten en james bond gadgets toch nog een keer werkelijkheid.

Als 25 jaar lang is men hier aan bezig maar ik merk bar weinig vooruitgang.
Het zal wel nog 25 jaar duren eer er eens echt goede vertaalsoftware komt,

Ze hebben ondertussen wel de nodige ervaring met Gaudio

Daarnaast moet het niet eens is zo moeilijk zijn. Als Speech Recognition bij Windows 7 al werkt is het een kwestie dat na de verwerking van de input het door een vertaler heen gaat.

Je kan nu ook met Speech Recognition je zin in laten tikken bij Google Translate. Zelfde effect eigenlijk.

Wat je waarschijnlijk wel blijft houden dat je eerst door een trainingsprogramma heen moet om het programma jouw stem te laten leren kennen. Als je dan ook nog iemand anders moet gaan vertalen kan dat inderdaad moeilijker worden.

Woorden herkennen (speech recognition) is echter heel andere koek dan (speech-to-speech) vertalen.
Voor een goede vertaling is naast een goede woordherkenning (dat is de 1e stap), namelijk ook begrip van o.a. context, syntax, semantiek en morfologie van de taal nodig, en moet de software dus niet alleen de input herkennen (dat is het eenvoudigste gedeelte; er is al aardig wat software die hier herkenning van >95% haalt, al dan niet met enige training), maar dus ook min of meer begrijpen om een welgevormde zin als vertaling te geven.
Dat is zeer complex, onder andere ook doordat 1 op 1 vertalen vaak niet mogelijk is vanwege bijvoorbeeld het niet in de output-taal voorkomen van een woord dat in de input-taal wel voorkomt, of door nuanceverschillen.
Als je bijvoorbeeld kijkt naar de zinnen die Google Translate geeft: die zijn vaak krom als een hoepel, en vaak klopt de vertaling überhaupt niet.

Binnen het vakgebied Kunstmatige Intelligentie (ik studeer zelf KI) is men al jaren bezig automatische vertaling werkelijkheid te maken, en tot op heden is de prestatie van alle programma's hiervoor vrij matig.
Het lijkt me dus hoog gegrepen van Google om dit binnen een jaar te willen realiseren. Ik denk dat je eerder moet denken aan voor mensen wel begrijpelijke vertalingen, zoals Google Translate die ook geeft, maar niet aan echt goed kloppende zinnen zoals mensen die zouden maken.

[Reactie gewijzigd door Ghost Dog op maandag 8 februari 2010 23:23]


Ik vraag me daarom ook af of een smartphone snel genoeg is/genoeg opslagcapaciteit heeft om zulk een taak uit te voeren, binnen een paar jaar.

Daarom zal google dat soort dingen in de "cloud" laten doen. Oftewel sampletje uploaden naar google servers, vertaling weer downloaden.

Hiermee kunnen ze hun systemen weer verder trainen zodat het systeem steeds nauwkeuriger wordt.

Technisch gezien vind ik het heel mooi wat google doet, het enige probleem dat ik er mee heb is dat google primair een reclame bedrijf is. Wat gaan ze nog meer aan statistische gegevens uit de ingestuurde samples halen.

Daarbij komt dat Google het grootste woordenboek ter wereld gebruikt, namelijk het world wide web :)

Het probleem ligt (al lang) niet (meer) in opslag of rekencapaciteit.
Een heel woordenboek (aan tekst, of zelfs met tags) is misschien een paar MB, dus je zou op een willekeurige telefoon makkelijk tientallen talen aan woordenboeken kwijtkunnen.
Ook het vertalen zelf hoeft helemaal niet zo zwaar te zijn, als je een goede heuristiek gebruikt. Deze kan de zoekruimte namelijk van NP-compleet reduceren tot beslisbaar.

Een algemene misvatting is dat, nu de computers zo snel zijn, en met de groei van hun capaciteiten (wet van Moore), dat computers binnenkort zo slim zullen zijn als mensen omdat ze qua rekenkracht mensen nu al ver overtreffen.
Er zijn namelijk veel problemen (hierboven genoemde NP-complete problemen) die zelfs met een oneindig snelle computer op een brute force manier niet op te lossen zijn.
Enorme rekenkracht != KI !

De uitdaging ligt juist in het uitvinden van algoritmes die op een efficiënte (en wellicht natuurgetrouwe) manier werken, en dat is veel ingewikkelder dan het bouwen van snellere computers.

[Reactie gewijzigd door Ghost Dog op maandag 8 februari 2010 23:21]


Ik denk dat dit een zeer interesante ontwikkeling is. Mits het natuurlijk goed gaat werken. Zal zeker goed te gebruiken zijn als je op vakantie bent, bij zakelijk gesprekken met iemand uit een land waarvan je de taal niet spreekt. Of op luchthavens/politiebureau's voor verhoor van mensen die geen Nederlands/Engels spreken. Scheelt in sommige gevallen toch dat er uren op een tolk gewacht moet worden.

Voor een politie verhoor zal het nog vele jaren en misschien zelfs nooit toe gepast worden om maar een voorbeeld te geven, in veel talen is het heden en verleden niet altijd even makkelijk te horen als in het Nederlands en zul je het aan de context moeten af lezen, iets dat zeker met dialecten etc erg lastig kan worden. Om daar een politie verhoro en dus een mogelijke schuld verklaring aan vast te hangen... lijkt me hele erg gevaarlijk.

Voor zakelijke gesprekken is het eigenlijk grote deels het zelfde, als je in een internationale omgeving werkt dan zul je snel merken wat ik bedoel. Zelfs als iedereen engels spreekt het is lang niet altijd de zelfde taal. Zet voor de grap maar eens een Oost-Europeaan een Engelsman en een Indiër in een kamer en laat ze overleggen over het een of ander. Je zult je verbazen over de enorme hoeveelheid verwarring en problemen die zo iets op kan leveren. Met een vertaal computer wil het lang niet altijd zeggen dat het ook maar een klein beetje beter wordt.
Alleen als het je lukt om de vertaling exact het zelfde te maken in beide richtingen. (I hate dogs - Ik haat honden) dan gaat het nog wel lukken maar bijvoorbeeld (I did not have sex with that woman - I had niet gehad sex met die vrouw) wordt al best wel lastig.

En dat zijn nog hele simpele talen die heel erg dicht bij elkaar liggen. Neem een Slavische taal en je moet dingen als de, het en een eigenlijk altijd weg laten en zelfs hij, zij en het zijn veel al niet nodig omdat je dat kan afleiden aan de manier waarop het werkwoord uitgesproken wordt. Vertalen van zo'n taal naar bijvoorbeeld het Nederlands waar mannelijk, vrouwelijk en onzijdig eigenlijk niet uit maken. Succes er mee dat is echt niet iets dat je (zeker voor officiële taken aan een computer wilt overlaten, in ieder geval de komende 10 jaar nog maar even niet)

Google translate wist anders jouw (niet al te toepasselijke) voorbeeld perfect te vertalen (Ik had geen seks met die vrouw), maar naar het slowaaks gaat het flink mis ja (naar het nederlands vertaald komt het neer op "Ik (vrouwelijk) had geen sex met vrouw")

Woher ist coffe shop? -> Immer gerade aus.

Wel veel potentieel in deze software, iemand al een idee of ie ook naar de Droid komt? Of andere toestellen? Of gaat Google dit weer voor hun eigen phones gebruiken?

'Binnen een paar jaar moet er een toestel op de markt zijn...'

Ga daar dus maar niet van uit (droid)

Mocht iemand het willen weten, de vis is uit de boek / film a Hitchhiker's guide to the galaxy.

O ja! Moest je dat beest niet in je oor stoppen?

Klopt! :D haha briljant en onwaarschijnlijk verhaal.. Overigens is het hoe onwaarschijnlijk het ook lijkt niet de bedoeling dat je je Nexus One in je oor propt.. Tevens wordt Vogons vanwege het saaie karakter nog niet ondersteund..

Stomme Vogons ook, maar ze kunnen wel mooie gedichten schrijven.

42!

42? Nou.., dat is niet echt het antwoord waarop ik had gehoopt eerlijk gezegd.. Maarja als dat het antwoord is op de vraag: What is the answer to life the universe and everything?

"Six by nine. Forty two."
"That's it. That's all there is."
"I always thought something was fundamentally wrong with the universe"
_/-\o_

Super gave ontwikkeling! Zou heel gaaf en nuttig zijn als er zulke software vrijkomt. Ook ideaal voor bijvoorbeeld in carkits enzo.
Ik wacht af :)


Je zult je verbazen hoe hard de intelligentie van kinderen stijgt als je dat latijn en grieks op middelbaar onderwijs eens zou vervangen door tweetalig kleuter onderwijs...

Daarop in te springen.

Meer taal, ook hoger onderwijs, lijd tot meer kennis.
Je gebruikt je hersens des te meer, wat tot meer schakkelingen lijdt.

Zo zou je ook kunnen zeggen dat lager onderwijs 'dom' wordt gehouden, door minder les stof te geven.

There is an App for that! Op de iPhone bestaat Jibbigo, speech-to-speech voor Eng naar Spaans en andersom. Werkt wel cool. Vertalen duurt heel even maar het werkt wel!

Hoop niet dat het zo slecht gaat worden als de Duits naar Nederlands vertaler van Google translate, dat is namelijk verschrikkelijk.

Klinkt leuk, als je belt met buitenlanders of anderstaligen, spreek gewoon nederlands, en aan de andere kant van de lijn horen ze het in hun taal, antwoorden terug in hun taal, en jij hoort gwoon de nederlandse versie.

Als google slaagt om bijna alle talen én dialecten te vertalen, dan is dit de toekomst.

eindelijk een voldoende scoren voor mijn spaans mondeling!
«  1  2  3  »

Op dit item kan niet meer gereageerd worden.

Volgende 16:16 Club3D heeft overgeklokte HD 5850 en HD 5870 op stapel staan
Vorige 15:19 FBI voert druk opslaan browse-gegevens bij isp's op
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011