Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 27 reacties

Google blijkt een bemiddelingsbureau voor het vertalen van documenten te hebben opgezet. Het heeft er alle schijn van dat het bedrijf dit doet om de algoritmes van zijn automatische vertaaldienst van meer en betere voorbeelden te voorzien.

Google Translation Center Via zijn kersverse Translation Center-site wil Google vragers en aanbieders op het gebied van vertaling bijelkaar brengen, schrijft Google Blogoscoped. Op de site kan overigens nog niet worden ingelogd. Zowel professionele als vrijwillige vertalers zullen, als het vertaalbureau eenmaal live gaat, documenten kunnen vertalen, en reeds overgezette teksten kunnen bovendien ter beoordeling worden aangeboden. Het bedrijf biedt hiertoe een aantal tools aan, waarmee onder meer kan worden gezocht naar reeds vertaalde zinnen of zinsdelen. Google zegt zich niet te bemoeien met financiële afspraken tussen vragers en bieders, wat impliceert dat het Google niet te doen is om het binnenhalen van commissiegelden.

Volgens Cnet is het Google dan ook om iets anders te doen, en wel om taallessen voor de op zijn automatische vertaaldienst rondwarende bot. Googles statistische vertaalsoftware werkt namelijk beter naarmate het over meer voorbeelden beschikt van stukken tekst in de bron- en de doeltaal. De enigszins ironische conclusie van Cnet is dan ook dat vertalers Google met hun deelname helpen om zichzelf werkloos te maken.

Google-vertalinkje Nederlands-Engels
Moderatie-faq Wijzig weergave

Reacties (27)

Een minder ironische conclusie is dat vertalers sneller hun werk kunnen doen als ze zich alleen nog maar met localization en jargon hoeven bezig te houden.
Denk het niet hoor. Als een vertaling kwalitatief al onvoldoende is, is het corrigeren van zo'n tekst even veel werk als van scratch zelf vertalen. Geloof me, we hebben zelf een vertaalbureau. Soms kost het zelfs nog meer tijd, aangezien je moet ontcijferen wat de vertaling is, de hele hoop op de kop moet gooien en dan nog steeds moet checken of het overeenkomt met de brontekst.

Als je de brontekst eerst leest en snapt wat er staat, formuleer je de volgorde en de gebruikte woorden al vanzelf. Daarnaast kan je tekst op vele manieren vertalen en heeft elke vertaler/ schrijver z'n eigen stijl. Vandaar dat als iemand een boekvertaling wilt laten doen je als vertaler eerst een proefvertaling moet doen om te zien of de sfeer hetzelfde is. Grappen een vergelijkbare indruk geven, etc..

Ik denk dat de dienst van Google zeer waardevol is, aangezien het zeker een behoefte zal vervullen die toch al niet commercieel te exploiteren is. En zal bij alle partijen die een goede/ zakelijke vertaling nodig hebben juist het bewustzijn versterken dat je professionele hulp nodig hebt.

En dat door meer concurrentie dan eindelijk ook eens het kaf van het koren gescheiden wordt, SUPER. Nu denkt iedere jandoedel dat hij/zij kan vertalen.
Ondanks de enigszins cynische opmerking van Cnet, verwacht ik niet dat op korte termijn een computer een foutloze vertaling zal kunnen maken.

De vertaling zal misschien wel beter worden door deze invoer, maar menselijke correctie blijft (denk ik) noodzakelijk. Ik denk niet dat dit ooit zal veranderen, tenzij dat de computer de invoertekst ook daadwerkelijk zal gaan begrijpen...
100% vertalingen zijn op het internet dan ook bijna niet nodig, een beetje zinnige vertaling is al genoeg.

Als Google hiermee zijn vertaalbot zinnige teksten kan laten produceren dan zijn ze opeens mijlenver verwijderd van de concurrentie.

Wil je echt de ins en outs van een tekst weten dan moet je toch met een menselijke specialist gaan praten omdat er dan toch waarschijnlijk vakjargon etc in gaat voorkomen die een computer nooit gaat begrijpen.

Maar tussen de letterlijke vertalingen van het oude babelfish ( tijd niet gebruikt. weet niet wat de status nu is ) en zinnige vertalingen zit imho een wereld van verschil...
Wil je echt de ins en outs van een tekst weten dan moet je toch met een menselijke specialist gaan praten omdat er dan toch waarschijnlijk vakjargon etc in gaat voorkomen die een computer nooit gaat begrijpen.
Wat niet is kan nog komen, een taal bestaat ook alleen maar uit syntax en grammatica, het is alleen de semantiek die lastig te programmeren is, maar met genoeg data is dat dus wel te trainen.

Het blijft natuurlijk wel nodig om iemand te hebben die kan verifiëren of de tekst inderdaad goed vertaald is en aansprekend genoeg is, maar als je een menselijke vertaler inhuurt is het natuurlijk ook maar de vraag wat de kwaliteit is ;)
CyBeRSPiN je hebt duidelijk geen kaas gegeten van talen.. Talen bestaat uit nog een enorm belangrijk component..

Geschreven talen bestaat uit syntax en semlatiek. (Je kunt discusieren over de exacte betekenis maar ik gebruik de standaard in de theoretische informatica gehanteerde begrippen)

Syntax -> Vorm van de taal
Sematiek -> Betekenis van de taal.

Gramatica is onderdeel van de syntax de taal (beetje afhankelijk van welke definitef je hanteert)... Het probleem van vertalen ligt niet in de syntax, een computer is beter in syntax dan jij en ik..

Het probleem is de Sematiek, de betekenis van woorden... En op dat gebied valt nog heel veel te bereiken en daar is google om te doen..


Check anders ook nog even http://en.wikipedia.org/wiki/Linguistics

[Reactie gewijzigd door martijnvanegdom op 5 augustus 2008 00:39]

syntax, grammatica en context.
Zonder context kun je nog steeds niet fatsoenlijk vertalen.
Een taal alleen maar uit syntax en grammatica ?

Ik dacht het niet. Met syntax en grammatica kom je er niet. (om het toch in computertermen uit te drukken: een lap code met goede syntax en grammaticaregels maakt nog geen zinnig algoritme, laat staan dat het een zinnig programma wordt).

Er bestaat ook een hoop dubbelzinnigheid, en meer nog: heel wat context.

En dan spreken we nog niet van het culturele aspect, die een taal omgeeft.

Probeer maar bv eens een film of een televisieserie te vertalen. Proberen het eerst woord voor woord, (met je grammatica en syntaxregels). Probeer het dan rekening houdend met de context. En eenmaal je het culture aspect er in betrekt... Zeker als er wat diepgaande gevoelsexpressies in komen, gefilosofeer, en ook erg moeilijk: humor, dan zal je -- als mens -- al uren, zoniet dagen, zitten zwoegen. Daar kom je er niet met een vertaalrobot...
Je leest niet goed..

Ik spreek over 2 dingen Syntax en Sematiek..

Wat jij noemt.. context etc, valt onder de Sematiek, de betekenis..

Dat is inderdaad enorm moeilijk.. Maar wat jij noemt.. emotie en dergelijk gaat heel langzaam ook vooruit.. Ik denk dat we een heel eind kunnen komen

Lees de link over http://en.wikipedia.org/wiki/Linguistics voordat je begint te spreken..
Ja maar je nalezen gaat de kosten van vertalen verlagen en denkje nu echt dat als je een vertaling leest van BV een instructie boekej dat uit china komt dat daar een dure nedelrnadse kop voor gebruikt is.. Nee nemen een gele chinees die hak tak nederlands kan

( laat de comments maar komen)
De enigszins ironische conclusie van Cnet is dan ook dat vertalers Google met hun deelname helpen om zichzelf werkloos te maken.
dat moet ik echter tegenspreken, want anders krijgen ze te veel vertaalwerk voorgeschoteld, iets wat ze het werk nooit op tijd vertaald zijn...
een geautomatiseerd vertaalcomputer kan bij hun vertaalwerk veel tijd besparen, ze hoeven het werk alleen maar controleren, want een vertaalcomputer is tot nu toe niet een perfecte vertaler.

Een universeel vertaalsoftware is in de toekomst erg belangrijk, want dan kun je met je vriend uit finland via internet "schrijven". Dan hoef je moeiljike fins niet leren.
Dat is een mooie Star Trek droom.

[Reactie gewijzigd door Dark Angel 58 op 5 augustus 2008 12:06]

Controleren kost even veel tijd als direct vertalen.
Ik krijg invalid request als ik inlog, tevens vind ik de vertaling in het plaatje er niet bepaald beter uit zien dan overige vertaaldiensten. Het word tijd voor een goede dienst dus ik hoop dat het algoritme zich snel uitbreid tot een goed product zoals vele anderen van google.
http://translate.google.com/ schijnt wel te werken
Het is een vooruitgang op babelfish naar mijn mening, maar zoals Little Penguin hierboven al zegt blijft het een computer. Ik denk dat grammatica omzetten nog te complex blijft de komende 5 - 10 jaar.

[Reactie gewijzigd door Dondorp op 4 augustus 2008 20:31]

Ik krijg dezelfde error als ik probeer in te loggen of ingelogd naar de pagina surf.

Hoewel er niets vermeld wordt is het misschien een geografisch beperkte beta?
Ik snap niet dat de Cnet hier ietwat ironisch over moet zijn. Andersom gezegd; Cnet is een dusdanig logge organisatie, dat enige verandering in hun organisatie is waarschijnlijk al uit de cache van Google verdwenen.

Feit blijft dat als Google het algoritme voor vertalingen goed onder de knie krijgt, dat ze ten eerste aan marktuitbreiding kunnen werken (want hoeveel talen zijn er wel niet), ten tweede zal elke taal elk jaar weer onderhevig zijn aan het toevoegen/wijzigen/verwijderen van woorden en ten derde kan Google rekenen op een flinke portie extra werk voor de fysieke vertalers als de beta-test faalt.
Het is niet echt een probleem met het algoritme, aangezien dat volgens mij statistieken gebruikt om te assisteren bij het vertalen. Het is vooral een hoop extra data voor analyse dat de statistische analyse beter en completer zal maken :)
Ik vind het nog erg beperkt, http://nl.babelfish.yahoo.com/ kent meer talen, en ook die talen die ik het meest gebruik voor mijn werk. Google is (nog) beperkt naar Engels - Nederlands en Nederlands Engels en that's it.

Wil Google afstand nemen dan zullen ze toch vlug wat meer talen erbij moeten doen. Zeker een taal als Frans zal zeer welkom zijn, temeer omdat dat ook veel gebruikt wordt in de diplomatieke wereld en het op zich qua grammatica al niet één van de makkelijkste talen is.
Mijn http://translate.google.com/translate_t?hl=nl heeft wel meerdere talen...

Daar zit ook nog "taal herkennen" bij.

Een nadeel vind ik wel dat google niet gewoon zegt dat ze geen vertaling hebben, maar dat ze hetzelfde woord herhalen, maar dit heeft babelfish ook volgens mij.

Ik tel trouwens 22 talen in "google vertaling".
Als Google (of Babelfish) het woord niet kent dan gaat het er vanuit dat het woord niet vertaald hoeft te worden, bijv. omdat het een eigennaam is. Dan ligt het meer voor de hand om het woord over te nemen in de vertaalde tekst dan het maar leeg te laten.
in teksten ligt dit meer voor de hand, maar als je één woord vertaald vind ik het niet nuttig.
heb er een maand geleden toch eens frans mee vertaald, nuja poging tot. een artikel uit "Le Soir"
Maar de tekst door een Franstalig opgevoede Vlaming eens laten lezen en na 5 keer herlezen wist hij eindelijk wat er in de krant stond.
Voor zulke teksten waar er al eens een loopje met de regels genomen wordt (wat ik persoonlijk vind dat dit niet zou mogen in een zichzelf respecterende krant), en gedichten en poëzie , zal er altijd een menselijke vertaling nodig zijn.

Maar pak weg om een deftige manual (waar vind je die nog ?) te vertalen, zal dit wel een oplossing zijn.

wij moeten de vragen van klanten ook altijd vertalen omdat we nu met chinzez moeten samen werken. die gaan gewoon in de translater hoor, die levert toch al beter engels af dan de chinezen zelf :P
Een franstalig opgevoede Vlaming echt Frans laten lezen is al lastig.... ;-)

fout grapje.. Ook manuals zijn context gevoelig en echt niet automatisch te vertalen.
Ik dacht dat zoiets al veel langer in ontwikkeling was, het idee is zo simpel. Natuurlijk is het algoritme enorm complex en het algoritme zal waarschijnlijk ook een algoritme moeten kennen om zichzelf aan te passen naar verschillende taalsituaties.

Als eerste zou er een flinke database aangelegd moeten worden van gezegdes en spreekwoorden, als die letterlijk vertaald worden dan krijg je de raarste zinnen. (look something through the fingers...) Vaak kent de andere taal ook wel een spreekwoord van dezelfde strekking, en als dat niet zo is dan moet de vertaalbot er rekening mee houden dat de betekenis en niet de tekst vertaald wordt.

Dit project slaagt natuurlijk alleen als er genoeg mensen zijn die willen vertalen via de site. En dat zullen vast niet alleen professionals zijn. Hopen dat die vrijwilligers niet van het niveau "ze jatte me kar!" zijn.

Sommige grammatica zal toch niet zo heel lastig zijn. Als het algoritme het type woord leert herkennen dan kan de zin zo opgebouwd worden naar nederlandse standaard, waarbij bijvoorbeeld een vraagteken de volgorde wat veranderd.

"How do you do?" is nu "Hoe doe je?" Die vertaling had toch een jaar geleden al normaal vertaald kunnen worden? Hoe moeilijk is het om een bot te leren dat die specifieke engelse zin die andere specifieke nederlandse zin is...
Ik gebruik google translate al een tijdje in mijn IRC script. Het is een van de betere vertalers maar het is zeker niet perfect. Het concept dat je zelf een betere suggestie kan geven op google translate is natuurlijk wel erg mooi.

Voor de geinteresseerde zie 2e screenshot op deze website:

http://home.planet.nl/~ingen218/BCManager.html
Ik gebruik eigenlijk altijd babelfish, maar zal deze toch eens uitproberen. Tot nu toe nog niet echt een geweldige vertaler tegen gekomen. Wel om een indruk van een webpage te krijgen, maar niet voor 1op1 vertalen.
Google start vertaalbemiddeling om algoritmes te voeren
De titel wordt als feit gepresenteerd terwijl het van zowel Cnet alswel T.net een aanname is. Bij Cnet wordt er nog verstandig een vraagteken neergezet:
Google's translation center: Language lessons for the Googlebot?
Er zit geen betaling voor geleverde diensten in dit systeem, vraag me dus af hoeveel mensen vrijwillig documenten zullen vertalen. Voor OSS of Creative Commons gelicenseerd materiaal is het misschien een uitkomst maar voor commeriele organisities denk ik niet. In hoeverre OSS bruikbare tekst aan de corpus zal toevoegen is twijfelachtig maar we zullen zien.

[Reactie gewijzigd door Coju op 5 augustus 2008 16:27]

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True