Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Je kunt ook een cookievrije versie van de website bezoeken met minder functionaliteit. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , reacties: 47, views: 23.381 •
Submitter: CoolGamer

Microsoft heeft een technologie getoond, die een gesproken tekst kan vertalen en die vertaling met de eigen stem van de spreker in een andere taal kan voorlezen. De technologie zou de afgelopen jaren met grote stappen vooruit zijn gegaan.

De technologie vereist dat de spreker minstens een uur gesproken tekst inspreekt om de vertaalsoftware tekst in een andere taal met zijn stem te laten voorlezen. Bovendien is de vertaling verre van perfect: volgens onderzoeker Rick Rashid van Microsoft heeft de software rond een op zeven woorden fout. Rashid toonde de software tijdens een demonstratie in China.

Volgens Rashid is de technologie afgelopen twee jaar met grote stappen vooruit gegaan door een technologie die Deep Neural Networks is genoemd en de vertaling mede laat afhangen van de context waarin de spreker iets zegt, in plaats van simpelweg alleen woorden of woordgroepen te vertalen. Om de vertaling goed te laten overkomen, wordt bovendien de woordvolgorde aangepast aan de taal waarin het uitgesproken wordt. Dat moet maken dat zinnen klinken zoals een native speaker die zou uitspreken.

Microsoft zal de technologie vermoedelijk in de toekomst gaan gebruiken in diverse producten. Het bedrijf gebruikt spraakherkenning onder meer in Kinect en in Windows Phone. Nederlands wordt daarbij vooralsnog niet ondersteund, maar daar is het Redmondse bedrijf wel mee bezig. Apple heeft ook nog geen ondersteuning voor Nederlands bij zijn dienst Siri. Google ondersteunt al wel Nederlandstalige spraakherkenning, onder meer in Android. Daarvoor hebben duizenden Nederlanders voor de release teksten ingesproken, terwijl sindsdien alle spraakopdrachten volgens Google worden gebruikt om de engine te verbeteren.

Reacties (47)

Handig, en vooral ook prettiger als een computer stem
Ik heb hier wel privacy concerns bij.

Nu krijgen bedrijven als Microsoft en Google naast je facial features informatie ook je stem "vingerafdruk". Met facial features kunnen ze je herkennen en volgen, met jouw stem-afdruk kunnen ze ook teleffoongesprekken of andere communicatie produceren.
Mooi toch, dan kunnen ze je daar in ieder geval niet op pakken.
Ik ga ook mijn vingerafdruk, iris, foto en DNA publiceren.

(Mijn pincode en passwords hou ik zelf)
Wat je aanhaalt is ook al jaren in de filmindustrie een interessant onderwerp. Met slechts een paar woorden (gewoon gesproken tijdens een gesprek) kan iemands stem nagebootst worden en men zich (in ieder geval telefonisch) voordoen als een ander.

Hoewel we lang nog niet zover zijn (veel, gedegen training nodig, grote foutmarge), verbetert de techniek door de jaren heen wel sterk. Wanneer op de verkeerde manier gebruikt moet je op zich niet gek staan te kijken als over een paar jaar een redelijk vloeiend gesprek op deze manier te voeren is met andermans stem. Tegelijkertijd zijn er heel weinig beveiligingsmaatregelen die hier iets tegen kunnen doen.

Ik wil ook weer niet te paranoïde overkomen maar het schept zeker vragen voor de toekomst.
Jij bent zeker niet toevallig Meester Frank Visser die elke vrijdag om 16:00 zich een partij zit te ergeren in de auto terwijl 3fm aan staat? :P
Dit ligt helemaal niet ver van de werkelijkheid, als jij telefoon verwacht van iemand en belt vanaf die persoon zijn nummer dan heb je best veel ruimte om fouten te maken lijkt mij aangezien je niet verwacht dat het een nepperd zou kunnen zijn ;)
Dit vind ik een mooi overdreven reactie eigenlijk. Want dat kunnen ze ook al volgen door de telefoon gesprekken die je met je liefje houdt en andere bekenden.
Je hebt natuurlijk helemaal gelijk voor wat betreft je ongerustheid, maar zijn we niet al een beetje te laat hiervoor? Als je zelf geen maatregelen neemt wordt je middels Google Analytics
wat zo ongeveer in elke website zit gevolgd. Je emails worden gescand om relevante reclames te tonen. Mensen gebruiken vol op telefoons met gratis apps welke
allerlei gegevens van je doorsturen naar een servertje en doorverkocht worden. Miljoenen mensen gebruiken social media waar alles wordt bijgehouden en een groots profiel van je je is opgebouwd. De meest gebruikte zoekmachine van de wereld, voor de meesten de startpagina, houdt alles waar je naar zoekt bij.
Nu komt dit en is het ineens een probleem? Een beetje mosterd na de maaltijd naar mijnening.
quote: madhapee
Ik heb hier wel privacy concerns bij.

Nu krijgen bedrijven als Microsoft en Google naast je facial features informatie ook je stem "vingerafdruk". Met facial features kunnen ze je herkennen en volgen, met jouw stem-afdruk kunnen ze ook teleffoongesprekken of andere communicatie produceren.
Als de privacy wettelijk gewaarborgd wordt is deze techniek een prima middel om criminelen en terroristen mee op te sporen ;)

Daarbij zijn de meesten van ons niet interessant (crimineel) genoeg :P


Edit: net zoals een afgeschoten kogel door diens gang door de loop van het pistool over unieke uiterlijke kenmerken beschikt, kan zoiets kunstmatig worden ingebouwd in deze nieuwe technologie van MS. Zodoende kan altijd(?) worden nagegaan of het hier de daadwerkelijke stem van de spreker betreft of een kunstmatige versie ervan.

@ fromthehill hieronder: en dat komt doordat jouw stem door je schedel resoneert (vervormd) en daardoor klinkt je stem voor jou anders dan voor een ander.

[Reactie gewijzigd door dutch666 op 10 november 2012 17:27]

Helaas klinkt je stem voor jezelf anders dan dat het voor anderen klinkt.

Je eigen stem terughoren lijkt me juist nogal ergelijk
klinkt goed!
ben benieuwd naar het resultaat!
Wacht, ik snap het hele systeem niet goed. Microsoft heeft dus een systeem uitgewerkt waardoor je bijna in realtime een gesprek kunt voeren met iemand in een andere taal. Je hebt dan dus twee softwarematige tolken.

Wat ik dan niet goed begrijp is waarom je je eigen stem opnieuw te horen krijgt? Het gaat telkens om het antwoord van de tegenpartij, wordt dat niet verwarrend :D ?
Het terughoren van je stem is denk ik alleen voor de presentatie in het filmpje, om het hoofdzakelijk Chineese publiek te laten horen horen hoe dezelfde zin in het Engels en Chinees klinkt.
ze hadden ook het geluid van zijn microfoon naar de speakers kunnen muten, maar dan was het niet duidelijk dat hij zelf sprak
Zelfde dus als Google Translate app op Android in converstation mode dus.

Niks nieuws achter de zon. Microsoft probeert alleen niet achter te raken op de concurrentie die wel uit zichzelf innoveert.

Ik heb nergens een nieuwsbericht gezien over dat Google hiermee kwam.. Alleen dat hun app bijvoorbeeld foto's kon herkennen en vertalen.

Maarja, iets wat met groot getoeter wordt neergezet komt natuurlijk weer in het nieuws. En hetzelfde wat allang deels bestaat zit NU gewoon al in je Android mobiel.....

En appart dat iedereen hier zit te roepen van: Wauw, gaaf, mooi, wat innovatief van Microsoft!!!

Onzin, dit is puur een "volg" actie van Microsoft wat ze altijd doen. Als je MS een beetje kent dan hé. Anders snap ik wel dat je wauw roept en niet weet wat er verder nog in de wereld speelt.

[Reactie gewijzigd door Texamicz op 10 november 2012 11:16]

Ik heb nergens een nieuwsbericht gezien over dat Google hiermee kwam.. Alleen dat hun app bijvoorbeeld foto's kon herkennen en vertalen.
Het staat note bene in het nieuwsitem zelf nog genoemd.
Sommige mensen kun je nu eenmaal nooit plezieren.
Zojuist het filmpje gezien en nog wat meer informatie erover opgezocht. Dit is echt ongelofelijk; Dat een computer je stem kan herkennen en het kan vertalen naar het chinees is nog voor te stellen. maar dat een computer met jou stem chinees kan praten zonder dat jij al deze klanken (in de video wordt gesproken over een sessie van maar 1 uur) hoeft in te spreken is echt ongelofelijk.

We krijgen komende jaren prachtige innovaties te zien.
ik zelf vond de stem compleet anders maar het blijft een knap staattje werk natuurlijk.

ook klonk het nog duidelijk als een computer en is het jammer dat het in chinees gedaan is dat snapt namelijk niemand hier dus kunnen we niet zien hoe goed dit is.
wel logisch dat ze chinees neen omdat het 1 van de moeilijkste talen is.

verder vind ik het wel prima dat er alttijd een computer acitige factor in blijft zitten.

als dat systeem namelijk in mijn stem in een andere taal kan spreken betekend dat dat iemand anders ook met mijn stem kan spreken wat ernstige gevolgen kan hebben.

denk aan een flawless systeem die je de stem van obama voed en dat naar iraans vertaald en je aankondigd iran binnen te vallen.
dat is een actueel issue en het zou levensgevaarlijk zijn.
of dat iemand met jou stem de koningin bedreigd dan zijn ook de poppen aan het dansen.
een soort van inperfectie waaraan je zou merken dat het een computer is lijkt mij toch wel wenselijk anders zijn de gevolgen niet te overzien en zal dit systeem dus niet tot wereldvrede lijden zoals deze beste man doet geloven maar het tegenovergestelde.

complete chaos met fraudeurs en criminelen die zich als iemand anders voordoen.
en is het jammer dat het in chinees gedaan is dat snapt namelijk niemand hier dus kunnen we niet zien hoe goed dit is.
Ik maak hier maar even de assumptie dat jij het liever in het Duits of Frans vertaald zag worden, aangezien die ook nog wel redelijk worden gesproken door de gemiddelde Nederlander, maar dat gaat natuurlijk nergens over. Zo heel veel worden die talen niet gesproken in de wereld. Spaans zou wellicht een aardig alternatief zijn, maar ik gok dat jij daar ook niet blij van zou worden.

En kom op zeg, het is een presentatie die in China plaatsvond. Natuurlijk licht Mandarijn voor de hand 8)7. En dan vergeten we voor het gemak maar even dat dit de meestgesproken taal ter wereld is.

[Reactie gewijzigd door .oisyn op 9 november 2012 20:37]

het gaat mij niet zozeer om wat voor een taal het in gedaan word maar het feit dat ik in het chinees niet kan chcken wat er staat omdat ik alleen een reeks vage tekens in beeld zie die ik zelf niet na kan typen om te checken.
dit met name voor de sinsopbouw wat met vertaal programmas op dit moment nog het probleem is en ze dat ook als feature gebruikte.
Ik had laatst al met een maatje van mij erover gehad. Ik ben zelf van Chinese afkomst en typ dan ook veel Chinees. Ik ben echter nooit een kei geweest in het schrijven van Chinees of het lezen ervan. Ze zouden in huidige software op smartphones, tablets of computers iets moeten maken waardoor je in de ene taal kan typen en het in de andere taal meteen grammaticaal en vertalingsgewijs correct eruit komt. Ik kan dan bijvoorbeeld in het Nederlands praten en meteen wordt de taal omgezet naar Chinees voor de lezer aan de andere kant. Ik zelf kan dan onder elk Chinese karakter zien wat de Nederlandse vertaling is, of andersom en leer daardoor ook nog eens een andere taal. Dit zou veel buitenlandse conversaties ten goede komen, niet alleen in persoonlijk gebruik maar ook in wellicht zakelijk gebruik.

[Reactie gewijzigd door JzAero op 9 november 2012 18:20]

Slecht nieuws voor de dubbing (film-vertalingen) industrie in Frankrijk / Duitsland / Spanje en hele hoop andere landen.

Maar globaal wel een mooie vooruitgang!
Slecht nieuws voor de dubbing (film-vertalingen) industrie in Frankrijk / Duitsland / Spanje en hele hoop andere landen.
Of niet krijg je tenminste de (computer) stem van de acteur iig te horen, voice overs doen ze toch wel dus daar heb je niet meer last van door deze techniek ;)
Je hebt gelijk dat het voor de industrie in het algemeen niet zo'n probleem is. Voor de voice actors wel, die zitten zonder baan omdat een computer de boel kan dubben in de stem van de originele acteur. Uiteindelijk dan, vooralsnog hoeven ze zich nog niet zoveel zorgen te maken.
Voice acting moet ook nog wel een beetje overeenkomen met de timing en zoveel mogelijk met de lipsync van de acteurs. Trouwens heel jammer dat ze dat doen in een aantal landen, je ziet juist in die landen waar men het niet doet en ondertitelt dat de jeugd spelenderwijs Engels leert, ik vind het gruwelijk als ik een film of reeks zie en niet de stem van de originele acteur hoor.
Ben ik de enige die:
1. Die vertaling die je in het Engels ziet nog heel veel fouten vind hebben.
2. Die stem nog steeds even hard computerachtig vind als wat mijn SoundBlaster32 10 jaar geleden kon produceren?

:?
Hij heeft een aantal keren genoemd dat er nog veel te verbeteren is. Ik moet zeggen dat ik de stem (in het chinees) enorm veel vind lijken op zijn stem. Om nou de vergelijking met SoundBlaster te trekken..

edit: daarbij is de snelheid waarbij het gebeurd ook indrukwekkend. er zal dan wel een goeie computer staan maar wanneer de snelheid op een PC (of waar het dan ook gebruikt gaat worden, bijvoorbeeld op een ambassade) in de buurt komt van deze snelheid is het al interessant.

[Reactie gewijzigd door Sneek op 9 november 2012 19:14]

Vind het nog meevallen, de Chinese leeswijze komt daar nog aardig bij in de buurt hoor. Ook reporters praten soms in die toon. Het komt vooral doordat Chinees uit losse klanken bestaat die per karakter anders zijn waardoor je heel veel variatie hebt binnen een zin. In Nederlands heb je vaak nog lange woorden die aan elkaar geplakt kunnen worden waardoor je voor je gevoel een vloeiendere overgang hebt. In Chinees is elke karakter een andere klank waardoor soms bepaalde klanken scherper overgaan dan andere.
Lijkt wel enigzins op de voorloper van de "Universal translator" die ze in Star Trek hebben. Daar wordt weliswaar de taal van een buitenaards wezen vertaald, maar hoeveel anders zou dat zijn tegenover Aardse talen? Ook daar wordt de stem van het buitenaards wezen gebruikt, wat toch, imho, een vertrouwelijker effect geeft dan een vreemde stem zoals een computerstem.
Het begin van de universal translator. Weer iets uit Star Trek dat al veel minder fiction lijkt dan voorheen.
Niet alleen star trek hoor:
2.1 Doctor Who
2.2 Farscape
2.3 Fish Finders
2.4 Futurama
2.5 FreeSpace
2.6 Galactic Civilizations
2.7 The Hitchhiker's Guide to the Galaxy
2.8 The Last Starfighter
2.9 Neuromancer
2.10 Star Control
2.11 Stargate
2.12 Star Trek
2.13 Tales of Eternia
2.14 Unreal

Zie ook:
http://en.wikipedia.org/wiki/Universal_translator
En ik zie die van Dune (de film, het boek) er niet tussen - dat is 1-op-1 spraak vertalen in realtime met een soort microfoon die aan de andere kant een luidspreker heeft... daar gaat deze technologie wel naar toe als dit in een smartphone terechtkomt.

Op dit item kan niet meer gereageerd worden.



Populair: Samsung Gamecontrollers Smartphones Processors Sony Microsoft Apple Games Consoles Politiek en recht

© 1998 - 2014 Tweakers.net B.V. Tweakers is onderdeel van De Persgroep en partner van Computable, Autotrack en Carsom.nl Hosting door True

Beste nieuwssite en prijsvergelijker van het jaar 2013