Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 89 reacties

Een groep wetenschappers heeft een applicatie ontwikkeld voor Google Glass die gesproken tekst opvangt en deze vervolgens omzet naar tekst. Deze tekst wordt op het beeld van de slimme bril getoond, waardoor in feite gesprekken worden ondertiteld.

De software is ontwikkeld door wetenschappers op Georgia Institute of Technology en is met name bedoeld ter ondersteuning van slechthorenden en doven. Met de app, die de naam Captioning on Glass heeft gekregen wordt spraak opgevangen met een aan de slimme Google-bril gekoppelde Android-smartphone, die het vervolgens met Googles eigen spraakherkenningsdienst omzet naar tekst.

Communicate

Door de gegenereerde tekst door te sturen naar Google Glass krijgt de drager in real time ondertitelingen te zien van de uitspraken van zijn of haar gespreksgenoot. In een door Georgia Institute of Technology vrijgegeven video wordt de software gedemonstreerd. Tevens zegt het onderzoeksteam nog bezig te zijn met het uitvoeren van studies om de gebruikerservaring te verbeteren.

Google zette onlangs Glass in de Play Store. Amerikanen kunnen de slimme bril, waarbij het nog steeds gaat om de Explorer Edition en niet de uiteindelijke consumentenversie, kopen in de onlinewinkel. Een Nederlandse of Belgische release lijkt nog niet in aantocht te zijn.

Moderatie-faq Wijzig weergave

Reacties (89)

Handig voor doven. Mensen hoeven dan geen gebarentaal te spreken of het op te schrijven. Mensen kunnen gewoon blijven praten en jij, als dove, krijgt dan in realtime te lezen wat ze zeggen (ondertiteling) in een gesprek. Dit is een hele mooie uitvinding dus !

[Reactie gewijzigd door ZeroSect0r op 5 oktober 2014 10:46]

Alleen vermoed ik dat een dove heel goed kan liplezen en zo mogelijk beter verstaat wat er gezegd word dan dat de speech-to-text functie werkt, die dingen zijn nog altijd niet foutloos.
Ik ben heel erg slechthorend, en kan behoorlijk goed liplezen (spraakafzien ;) ) Maar een technologie dat ik een persoon ook kan verstaan als hij/zij niet direct mij aankijkt (en ik hem of haar) zou natuurlijk wel een uitkomst zijn.
Als we nu bezoek hebben moet het bezoek mij aankijken, ook als het iets is dat 'eigenlijk' aan mijn vrouw gericht is, anders versta ik er niks van. Terwijl de spreker mij niet bewust wil uitsluiten.

Ook het argument van hieronder dat ik op mijn telefoon zou kunnen kijken wat er gezegd wordt.... bedenk eens hoe asociaal dat overkomt als ik continue naar een telefoon zou kijken?

/edit: De foutloosheid is inderdaad nog lang niet bereikt. Maar dit onderwerp volg ik al sinds de jaren van L&H en de stappen die elk jaar gemaakt worden zijn zeker significant. Het zal uiteraard nog wel een aantal jaar duren, maar we komen al een heel eind in de goede richting.
Sowieso is het net als met spraakafzien+horen dat je op een gegeven moment snapt welk woord wel bedoeld wordt als er een fout woord staat. Ik kijk redelijk wat youtubefilmpjes met engelse automatische ondertiteling. Vaak is het vrij beroerd. maar snap ik alsnog beter via de foutieve ondertiteling wat erg gezegd wordt dan alleen van het geluid.

[Reactie gewijzigd door Trevor op 5 oktober 2014 11:17]

Hetzelfde hier. Ook lijkt het me nuttig als het in werkoverleg bv verschillende personen in verschillende kleuren laat zien oid. Verder ben ik zeker niet slecht in spraak afzien maar zonder enig geluid erbij wordt het voor mij al lastiger, en zonder mond erbij is het onbegrijpelijk.

Overigens krijg ik zelf best vaak gedoe te horen over waarom ik Engels zo moeilijk kan verstaan terwijl ik het naar het schijnt prima spreek.

Mijn antwoord daarop is als volgt:
1. Mensen die Engels spreken bewegen hun mond gewoon erg vreemd.
2. Engelse worden zijn zo onfonetisch dat er gewoon geen koppeling ontstaat tussen de beweging van de mond en de woordendatabase in je hoofd.. Voor horenden zal het wel als BS klinken, maar dat is hoe ik het ervaar.
Voor horenden zal het wel als BS klinken, maar dat is hoe ik het ervaar.
Nee, is zeker geen BS!

Engels heeft een erg vreemde combinatie tussen uitspraak en het fonetische. Je kunt woorden die je niet kent ook amper raden qua uitspraak. Woorden die zouden moeten rijmen b.v. doen dat in de uitspraak totaal niet en woorden waarvan je qua letters niet vermoed dat ze rijmen doen dat juist wel.

Overigens hebben native Engelsen hier ook moeite mee omdat het nogal veranderd. De ene generatie zegt b.v. nog wel ChrisTmas zegt, terwijl de huidige generatie er Crismas van gemaakt heeft, dus de T gewoon weglaat.
Maak je een grap? Ik heb net weer match of the day gekeken. Als er iets lastig te verstaan kan zijn is het Engels en dat fonetische gedeelte is een belangrijk onderdeel ervan (gelukkig houden ze daar meer rekening mee de laatste tijd, de taal is veel beter geworden). De rest van de wereld lacht om onze "harde klanken" maar dat is nou net wat het verstaanbaar maakt.

Je hoeft trouwens alleen maar de radio aan te zetten om dat te ondervinden. Lyrics websites zijn niet voor niets populair - vaak valt Engels volledig weg tegen de achtergrond - daar heb ik met andere talen toch duidelijk minder last van.

Dus je prima horende medemens heeft daar ook veel last mee. En ik kijk toch echt elke dag Engelse TV (zonder ondertiteling), lees Engelse text etc. En goed horende mensen maken ook gebruik van visuele hints, dus daar is ook weinig verschil in (behalve dat je daar veel meer van afhankelijk bent als slechthorende natuurlijk, en er dus ook beter geoefend in bent).

[Reactie gewijzigd door owlstead op 5 oktober 2014 14:01]

Toch zijn er veel mensen die erom lachen dat ik slecht Engels kan verstaan, en zeggen dat ze niet snappen dat ik het niet goed kan.

Engels is gewoon bagger, de koppeling tussen het geschreven woord en het gesproken woord lijkt compleet te ontbreken qua uitspraak. Zoals ik al zei is Engels gewoon totaal niet fonetisch.

Geef mij dan het Fins maar, volledig fonetisch geschreven, hoe je het schrijft, zo zeg je het ook.

[Reactie gewijzigd door GAIAjohan op 5 oktober 2014 20:42]

Maak je een grap? Ik heb net weer match of the day gekeken. Als er iets lastig te verstaan kan zijn is het Engels en dat fonetische gedeelte is een belangrijk onderdeel ervan (gelukkig houden ze daar meer rekening mee de laatste tijd, de taal is veel beter geworden). De rest van de wereld lacht om onze "harde klanken" maar dat is nou net wat het verstaanbaar maakt.
Da's wel waar... ik ben Vlaming en versta vele Nederlandse dialecten beter dan Vlaamse dialecten. :'(
Hier heb je natuurlijk een goed punt en heel gaaf dat ze hiermee bezig zijn, maar:

Hoe gaat dit werken in bijvoorbeeld een druk café of verjaardag waar er veel mensen zitten te spreken. Ik weet van sommige ouderen met een gehoorapparaat dat dat niet fijnis. Ik kan me voorstellen dat deze techniek alles oppakt en je een brei van tekst te lezen krijgt... Natuurlijk zullen ze dat wel weten te tackelen maar ik vraag het me toch af.
Hou er rekening mee dat niet elke dove doof is geboren. Als ik nu een ongeluk zou krijgen en ik zou doof worden, dan zou deze app mijn redding zijn
Als dove kan ik stellen dat de telefoon vaak meer maakt van het boerengemompel van mensen dan dat ik kan liplezen, en ik ben daar toch behoorlijk goed in
En indien je in een andere taal een gesprek probeert te volgen, dat zou liplezen verder bemoeilijken.
Sorry, maar ik zie niet in wat hier vernieuwend aan is. Er bestaan allang programma's om gesproken taal in tekst om te zetten. Het enige wat hier gebeurt is dat het doorgestuurd wordt naar google glass. De spreker met de telefoon zou net zo goed zijn scherm kunnen tonen aan zijn gesprekspartner.
dit is de eerste stap op weg naar de universele vertaler.

In de toekomst kunnen op deze manier ook andere talen naast engels omgezet worden naar tekst, en dan via google translate omgezet worden naar de taal die je spreekt. Dat lijkt me op zich best meerwaarde hebben voor een consument: geen onduidelijkheid meer in een gesprek.

Google heeft hiermee alweer een extra tool welke informatie verzamelt over het dagelijkse leven van de gebruiker. Tezamen met alle andere tools (calendar, mail, voice chat, google+, search, navigation, nest) kunnen ze een aardig gedetailleerd plaatje van hun gebruikers maken. Uiteraard alleen maar om op maat gemaakte advertenties naar deze gebruikers te kunnen sturen. Toch?
Sorry, maar ik zie niet in wat hier vernieuwend aan is.
Ik heb het artikel nu drie keer gelezen. Waar wordt eigenlijk beweerd dat het vernieuwend is?

Het voordeel hier is dat je redelijk oogcontact kan houden met degene met wie je het gesprek voert, meer niet.

Ik vind het in elk geval een van de meer nuttige toepassingen van het ding.
Handige technologie. Volgende stap is natuurlijk vertaling, zodat twee mensen (beiden met Google Glass) beiden in hun eigen taal met elkaar kunnen spreken. Universal translator is niet ver weg nu.
Universal translator is niet ver weg nu.
Microsoft brengt dit jaar realtimevertaler uit voor videobellen via Skype

Niet ver weg? Dit was een mooie demo Engels->Mandarin in 2012:
Microsoft Brings Star Trek’s Voice Translator to Life

Lijkt me voor bedrijven/staatsinstellingen/politiek wel weer een extra complicatie. Moet je overal de luxaflex neerlaten om liplezen te voorkomen als het zo gemakkelijk gaat.

edit:Zo jammer dat Lernout & Hauspie en Systran zich niet tot Europese moguls hebben kunnen vestigen op dit gebied.

[Reactie gewijzigd door EektheMan op 5 oktober 2014 11:21]

Directe link: https://www.youtube.com/watch?v=vGYKxrRWDKo
Erg interessant in ieder geval! Knap hoe zoiets dan toch werkelijkheid is geworden nu. Straks zit iedereen in een vergaderzaal met een headset op, en dan wordt alles wat je zegt in je native language meteen vertaalt naar de native language van de andere mensen. _/-\o_
Ik geloof dat robots het gesprek van de week waren ivm met banenverlies (alsof dit soort revoluties niet continue plaatsvinden). Dan denk ik ook meteen aan de vertalers die in dienst zijn over de gehele wereld of tijdelijk ingehuurd worden. Een persoon in vaste dienst in West-Europa zijn denk ik een maandelijkse kostenpost van +/- 10.000 Euro. Een goede incentive om dit soort software door te ontwikkelen.

En dat zal dan weer zijn effect hebben op de talenstudies. Misschien maar alvast beginnen met quota's?
Op expats zal het ook wel effect hebben. Ik zie om mij heen dat expat kinderen al 4 tot 6 talen spreken voordat ze naar het middelbaar gaan. Die voorsprong zal ook niet meer helpen. De internationaal goed betaalde banen zijn vanaf dan ook bereikbaar voor degenen die minder goed onderwijs genoten hebben. Goed voor West-Europa dus waar talenonderwijs minder goed is dan in Oost-Europa of Azie.

Ben ook benieuwd wat het effect zal zijn op straattaal. Misschien ga je dan zoeken naar woorden of geluiden waar dit soort software moeite mee heeft. Spannend.
Yup, zeker spannend. Mijn nicht heeft de Master Scandinavische talen afgerond, en heeft nu een jaar later nog steeds geen (vaste) baan op niveau. De komende ontwikkelingen zullen daar ook niet bij helpen.

Toch lijkt het mij nog steeds handig als je zelf ook meerdere talen beheerst. Ik zit nu zelf bijvoorbeeld in Australië en mijn Engels is ondertussen zo goed als vloeiend.

Met alleen praten ben je er nog niet, je hebt ook nog het schrijven.. Maar misschien kan je in de toekomst je document gewoon volledig omzetten van taal naar taal met één druk op de knop.

In de film "The Machine" hebben de robots hun eigen taal ontwikkeld waarmee sneller onderling te communiceren is. Wie weet verdwijnen alle talen op den duur en communiceren we via een andere manier.. Transhumanism
Cool, wist niet dat Microsoft daar ook mee bezig was. Mooi dat het is geïntegreerd in Skype.
Nee, waarom zou je daarvoor ondertitels nodig hebben (de kern van deze app). Ook glass heb je daarvoor helemaal niet nodig.

[Reactie gewijzigd door ZeroSect0r op 5 oktober 2014 10:49]

Omdat voice to voice vertaling nog een hele stap verder is dan text to text.
Daarnaast zijn velen ook wel gewend aan ondertiteling aangezien we dat dagelijks op tv zien. Goed, voor een aantal talen worden series en films gedubt, maar toch.
Nederlanders zijn daar gewend aan, maar duitsers, fransen en amerikanen en britten in ieder geval niet. Ik weet nog dat in polen vroeger ook nagesynchroniseerd werd (en misschien nog steeds wel) dus ik vraag me af of men daar wel zo bedreven in is als je denkt...
Google Translate heeft al wel support voor Voice to Text vertaling.
Dan spreek je in je eigen taal het bericht in, en vertaalt hij dat daarna automatisch.

Helaas gebeurt dit nog lang niet foutloos, ten eerste is de Voice to Text functie zelf nog niet perfect waardoor hij vaak de verkeerde woorden herkent. Ten tweede is de vertaling nog niet perfect (maar meestal wel goed te begrijpen). Het belangrijkste probleem is alleen dat het lang duurt voordat de spraak herkent en vertaald is, waardoor het in principe onmogelijk is fijn gesprek te voeren.

Toch is het een mooi begin en ik denk dat er op deze manier ooit wel realtime vertaling/ondertiteling van meertalige gesprekken kan komen.
Omdat het persoonlijker is om elkaar aan te kunnen kijken, ipv als je beiden naar een schermpje voor je zit te turen? En doven / slechthorenden zoals Webgnome aangeeft.
Ondertiteling lijkt me daar juist handig. Anders staat er iemand tegen je te praten in een vreemde taal en hoor je via de speakers nog iemand tegen je praten in het Nederlands? Lijkt me verwarrend.
Omdat, zoals in het artikel staat, het ook handig zou kunnen zijn voor doven / slechthorenden? die hebben ondertiteling nodig..
Ik geloof niet dat google geeft om slechthorenden.
Gelukkig bestaan er ook nog wetenschappers van de Georgia Institute of Technology. 8)7
De software is ontwikkeld door wetenschappers op Georgia Institute of Technology
Dat volstrekt stupide gebash altijd...
Of bijzienden, aan de dioptrie van Google Glass te zien. :(
Er zijn de laatste jaren al veel mooie projecten ontstaan om mensen beter met elkaar te laten communiceren. Helaas is er nog steeds geen oplossing die volledig werkt. En veel van die spraak- / (ver)taal- / gehoor- ... projecten moeten dan ook nog eens verschillende talen ondersteunen indien we een globale oplossing wensen. Volgens mij zal de technologie dit nooit kunnen, en moet de oplossing vanuit de mens komen (voor het vertaalprobleem).

Ik smijt hier even een bommetje:

Hervorm nu het onderwijs zodat we op het gebied van talen enkel nog onze moedertaal en het Engels moeten leren. Misschien kan de volgende generatie dan volledig op Engels overschakelen. Als iedereen dezelfde taal sprak (zelfs met een dialectje hier en daar), dat zou zeer veel problemen oplossen. Aangezien de technologie slechts één taal moet ondersteunen, dan pas zullen de ontwikkelingen hard gaan.

Hoe vreemd het ook klinkt, fragmentatie en verschillen zijn eerder beperkend dan stimulerend. Ik denk daarbij aan taal, wetgeving, auteursrecht, geloof ...
En waarom Engels, en niet Chinees, Russisch of Nederlands?

Als je echt alleen maar Engels wil dan moet dit wereldwijd. En dat gaat je sowieso in landen als Rusland, China, Japan. Frankrijk en Duitsland nooit lukken.

En zelfs alleen al in Nederland hebben we meerdere talen. Kijk maar eens naar het Fries, of het Limburgs. Dat ga je niet met één generatie wegkrijgen. Dat gaat je niet met 100 generaties lukken.

En als je zegt dat dat in de VS wel gelukt is, zit je er ook naast. Ook daar worden meerdere talen gesproken. Al wordt iederen er wel opgeleid in het Engels (Amerikaans).
http://en.wikipedia.org/wiki/Languages_of_the_United_States

[Reactie gewijzigd door sanderev66 op 5 oktober 2014 20:06]

Wat is nu net het probleem? Nu moeten we in Vlaanderen bijvoorbeeld Nederlands, Frans, Engels en Duits leren. Laat iedereen gewoon zijn moedertaal en daarnaast Engels leren. Dan kunnen we lekker babbelen met iedereen over heel de wereld. We leven in een tijd dat je moet bijscholen en 'mee' zijn. Wij (IT'ers) moeten toch ook de nieuwste trends volgen? Engels is trouwens een zeer toegankelijke taal voor de jeugd vanwege de films, muziek, games ...

Helaas heeft Europa liever dat iedereen dezelfde oplader heeft voor zijn gsm, want handleidingen in 12 talen afdrukken is natuurlijk niet zo slecht voor het milieu 8)7
Hulde voor deze visie!. Ook ik zie dat Engels zo snel mogelijk de voertaal in het openbare leven moet worden. Dit zal dan de Europese norm moeten worden. We hebben zoveel verschillende talen in Europa dat dit integratie en arbeidsmigratie in de weg zit. De VS en India hebben dat al veel beter begrepen. Daar beheerst nagenoeg iedereen het Engels als tweede taal.

Wel is het nodig dat dit z.s.m. in de hele EU een verplichtend karakter krijgt. De overheid kan bijvoorbeeld snel beginnen met alle documentatie, formulieren en klantloketten in het Engels te gaan afhandelen. De publieke omroep zou alle producties in het Engels kunnen doen en alleen nog maar Engelse ondertiteling aanbieden. Hiermee stimuleer je mensen het Engels snel op te pakken.
De oudere populatie is opgegroeit met Nederlands. Langzaam maar zeker kan Engels best de tweede voertaal worden, maar dat heeft tijd nodig (Civ 5 cultural victory inc).
En dan neem ik dat zo'n mondeling gesprek dus ook gelogd word?
Uiteraard, want het omzetten van gesproken woorden naar tekst wordt op de servers van Google gedaan (en vertaald wanneer nodig).
Waarom je -1 krijgt vraag ik me af want dit was ook het eerste waar ik aan dacht.. Las net nog het bericht van Microsoft terug dat ze in windows 10 werkelijk alle aanslagen vastleggen. Dit is voor mij een reden om het niet te installeren.
Hetzelfde geldvoor google die toch afgankelijk zijn van advertenties waarbij de vraag of ze dit vast leggen en wat ze er uiteindelijk mee doen zeer relevant is.
Veel mensen vergeten wel eens dat de informatie op jou computer het leven beter in kaart kan brengen dan bijvoorbeeld je ouders of je beste vriend.
De keylogger in Win 10 zit nu (alleen) in de Tech Preview. Het is dus niet zeker of het dus ook in de winkelversie nog zit.
Alhoewel er in de privacy policy wordt gewezen op de mogelijkheid om dergelijke informatie te vergaren, is niet duidelijk in hoeverre Microsoft dit ook daadwerkelijk doet. Het bedrijf heeft hierover nog geen uitspraken gedaan. De dataverzamelingssoftware zal waarschijnlijk alleen in de Technical Preview zitten en bij volgende versies uit het besturingssysteem worden gehaald.
Mogelijk doen ze het straks inderdaad alleen bij bugs, maar het feit dat ze de mogelijkheid in de privacypolicy opnemen stemt mij niet vrolijk.

Noem het dan ook geen 'privacy'-policy meer.
Gelukkig melden ze het wel netjes dat het er in zit, maar ik geef je gelijk dat het in tegenspraak is met het woord privacy. Ik hoop ook maar dat het dus alleen bij de Tech Preview blijft.

/edit: typo

[Reactie gewijzigd door MixT2311 op 5 oktober 2014 16:12]

Of microsoft het er wel of niet instopt is één ding, of de code sowieso in de retail versie blijft hangen ter exploiteerbaarheid en vermaak van hackers is een interessantere vraag. Een stuk code dat al in een OS zit exploiteren is wellicht makkelijker te doen dan een eigen keylogger op iemands systeem krijgen.
Inderaad, je hoeft immers alleen die informatie naar een andere server te sturen. Zo kan je met een dns-spoof op een router bijvoorbeeld netjes alle keylogs van alle machines binnen het netwerk ontvangen ;) zal dan heus nog wel encrypt oid zijn, maar toch.
Las net nog het bericht van Microsoft terug dat ze in windows 10 werkelijk alle aanslagen vastleggen. Dit is voor mij een reden om het niet te installeren.
Da's een feature voor de BETAVERSIE om BUGS TE FIXEN. Stop nu eens met de FUD.
Daar is nog niks over bekend, vooralsnog zit het dus ook in de officiële release.
We worden overal wel in de gaten gehouden. Via smart tv's tot aan de telefoonlijn toe.
Als je echt voor privacy wilt gaan moet je in een bunker gaan wonen zonder elektronica,
en dan is het nog hopen dat ze je niet in de gaten kunnen houden met wat je doet.
Er ligt een wereld van verschil tussen alle privacy opgeven en volledig afgeschermd van privacy inbreuk. Ik weet dat de belasting mijn inkomensgegevens heeft. En ik verwacht dat google daar via allerlei trucjes ook wel achter kan komen (personeelsadvertentie, loonschalen en jaren in dienst). Maar dat wil nog niet zeggen dat het ze ook maar iets aan gaat. En zeker niet dat ze het maar in een email toegestuurd moeten krijgen.

Een beetje nadenken levert vanzelf wel een hoop vragen op waarvan jij zelf vindt dat het niet bekend zou moeten worden, maar (ongetwijfeld) toch wel ergens vastgelegd wordt.

Dus nadenken over wie, wat, wanneer en waarom iets vast kan of mag leggen is best wel raadzaam op zijn tijd. En dan stel je vanzelf de vraag: Waarom zou microsoft moeten weten wat voor toetsen ik ingedrukt heb. En als ze het niet zouden moeten weten dan zou het een automatische weigering moeten zijn.
Of onze overheid moet haar taak eens normaal uitvoeren en wetten invoeren die dit soort dingen verbieden. Of is dat echt ondenkbaar volgens jou?
valt wel mee hor, meer te denken aan privacy gegevens, pincodes, wachtwoorden, surfgedrag etc. En het gaat er niet eens om dat Microsoft dit soort of google deze gegevens gebruikt om een product te verbeten het gaat er om dat google een advertentie bedrijf zijn en baat hebben bij zoveel mogelijk gegevens. En zelfs als dit niet gebruikt word voor advertentiedoeleinden dan kan het systeem nog steeds gehackt worden. Resultaat: 1 miljard van de meest persoonlijke gegevens op straat.
Dat is maar net de vraag. Dit project is niet eens van Google en zelfs als Google het zou doen is het maar net de vraag of ze zouden loggen, want dit ligt natuurlijk gevoelig.
Niet van Google, maar gebruikt wel Google Translate. ;)

@donkade:
Speech-to-text zit ook in Translate en ze zouden juist het feit dat dit ook als vertalings-tool gebruikt kan worden moeten aanstippen.

[Reactie gewijzigd door HMC op 5 oktober 2014 12:22]

Niet Google Translate, maar Google Speech to Text, en die werkt ook zonder internetverbinding. Zolang de taalpakketten geïnstalleerd zijn (dus als je gesprekken in het Nederlands en Engels voert installeer je die pakketten) kun je gewoon offline zijn.

Ik kan natuurlijk niet weten of ze achteraf iets gaan opsturen naar de servers, maar noodzakelijk om de boel te laten werken is het in ieder geval niet.

Edit: uiteraard kan dezelfde techniek als vertaaltool gebruikt worden. Het is een kleine stap om van speech to text te gaan naar Google Translate. Echter is dat (vooralsnog in ieder geval) niet de intentie van deze app. In deze opzet hoeft er dus niet gelogd te worden. Daarom hoop ik zelf ook dat het bij deze opzet blijft, en de live vertaling eventueel een andere app wordt als daar vraag naar is, zodat doven en slechthorenden deze app kunnen gebruiken zonder dat er een server aan te pas hoeft te komen en zonder dat er enige vorm van privacy in het geding is.

[Reactie gewijzigd door Donkade op 5 oktober 2014 12:46]

In het verleden werden er in ieder geval wel voice profielen gegenereerd van een stem door Google. Dus niet persé wat je zegt maar je stem profiel werd vast gelegd.
Zo'n profiel is handig voor text2voice voor diensten als translatie; in de oorspronkelijke stem de vertaling in een andere taal uitspreken.
Maar ook voor het herkennen van bepaalde sprekers in een groep.

Ik weet niet of dat nu nog gebeurd, je kon dit profiel ook weer makkelijk uit je Google account verwijderen in ieder geval.

Het realtime speach2text2translate heb ik een jaar of vier geleden al mogen proberen bij google, ik was toen onder de indruk van het Nederlands naar Engels en terug (chat cliënt).
Google vertaalt het voor je en stuurt de vertaling terug. Voor de geheime dienst (NSA) heeft dit diverse voordelen:

1) Ten eerste kunnen ze nu naast hetgeen je schrijft en leest op het internet nu ook kunnen horen wat mensen zeggen, wellicht inclusief wat jij zelf zegt. Dat maakt iedereen tot een "undercover" afluisteraar.
2) Ten tweede spreken ze in de VS voornamelijk Engels. Google vertaalt het real-time voor ons. Hoeft de NSA dat niet meer te doen alhowel ze vast professionele systemen (en wellicht ook mensen) daarvoor hebben.

Natuurlijk kan Google iets als SSL gebruiken voor de communicatie tussen client en server, maar de NSA kan ook Google hacken of een mol hebben of een trojan plaatsen.

Dit is de volgende stap in total information awareness en mass surveilance. De Stasi zou hier nog een puntje aan kunnen zuigen. Dit moeten we niet willen...

Het idee achter deze techniek en de implementatie is goed, nobel en nuttig. De oplossing? Of helemaal niet gebruiken, of je doet de vertaling local en niet remote.
De stap om hier google translate aan te knopen is natuurlijk heel klein. Dan wordt het pas echt leuk!
De stap om hier google translate aan te knopen is natuurlijk heel klein.
Even Google Translate vragen wat-'ie ervan denkt:

Hier wordt de stap om het knooppunt te vertalen, is natuurlijk zeer klein. (Chinees)
De stap hier nodes vertalen is natuurlijk erg klein. (Yiddish)
De stappen hier nodes vertalen is natuurlijk erg klein. (IJslands)
Stap is de knooppunten vertalen uiteraard zeer weinig. (Wit-Russisch)
Stap hier om het contract te vertalen is natuurlijk erg klein. (Arabisch)
Stappen om het knooppunt te vertalen is natuurlijk erg klein. (Thai)
Stap hier om nodes te vertalen is zeker zeer klein. (Grieks)

...denk het nog niet. ;)
Ik denk dat de keuze is tussen, helemaal niets begrijpen van elkaar, of in elk geval een educated guess kunnen maken. Als ik een Aziatische pagina laat vertalen ontstaat er ook een steenkolen Engelse pagina, maar dat is altijd nog beter dan de volstrekt onleesbare tekens die er eerst stonden.

Er zal nog wel wat water naar de zee stromen voor de universal translator een feit is, ook babelvisjes zijn nog niet gevonden. Dus we zullen het er nog even mee moeten doen.
Nauwelijks leuk want de google vertalingen zijn beschamend slecht.
Het is beter dat je ongeveer een idee hebt wat een persoon in een andere taal probeert te zeggen dan dat je er helemaal geen hol van verstaat.
Mijn kennis van ... Koreaans, om eens een dwarsstraat te noemen, is nog veel beschamend slechter. Maar goed daar gaat het nieuws helemaal niet over.
"Een groep wetenschappers", het klinkt wel alsof het iets baanbrekends is. Maar gewoon via Google's eigen dienst spraak naar tekst omzetten en dat aan een ander gekoppeld apparaat tonen, niet eens in real-time... Dat is krak hetzelfde als eender welke notificatie op meerdere toestellen tonen, zoals op bv Android Wear, of Pushbullet naar een een browser-extensie, of...

Ik begrijp dat het behulpzaam kan zijn voor hardhorenden, maar het zou pas echt fatsoenlijk zijn mocht de bril het geluid in real-time opnemen en zelf tonen. Dan kan de drager tegen eender wie praten, met zijn gsm gewoon weggestopt.
Ja, en misschien kan je daarvoor de software gebruiken die voor de Happy Vertical People Transporter gebruikt wordt.

Bij veel talen moet je eerst een volzin horen voordat je de zin goed kan vertalen. Dus dat gaat tegen veel problemen oplopen. Om dat enigszins te kunnen voorspellen heb je een brein nodig die erg goed is in het inschatten van de context.

Nou is het achteraf vertalen misschien iets te makkelijk, maar dit wordt lastig. Misschien online vertalers die je per uur kan inhuren?
zat ik dat ook al te denken, de app kan erg handig zijn, dat zeker.

Het is niets meer dan "simpelweg" google's software gebruiken om voice to text om te zetten ( exacte naam ontgaat me even), en wat hier uit komt in google glas weer te geven ipv op de telefoon. (beetje het zelfde idee dat wetenschappers chocoladepindakaas hebben ontwikkeld door chocolade en pindakaas te combineren)

Op de webstie van de bron zie ik ook niet terug dat wetenschappers hier aan hebben gewerkt, het zou me goed doen dat dit door een programmeur is gemaakt als (side project bijvoorbeeld) en dat de wetenschappers met wel zich wel met wetenschappelijke vraagstukken bezig houden.
Nice! Dit zijn toch weer kleine stapjes in de richting van een ECHTE Babel fish! (of Universal Translator a la Star Trek, als je minder fan bent van Hitchhiker's Guide to the Galaxy)
realtime zou ik het niet noemen, want je hebt nog steeds manuele acties nodig en de ondertiteling komt pas na de opname. Daarnaast komt nog dat je gesprekspartner duidelijk in jouw telefoon moet spreken, wat het nog wat omslachtiger maakt
Het is natuurlijk wel handig als je als Hollander met een Japanner aan het praten bent.
Ik denk dat het ook daar vooral om gaat.
Wat mooi dit! Haha. Als het goed werkt zijn er tal van mogelijkheden, op vakantie ofzo zou het zo handig zijn!

Nu nog iets verzinnen om jezelf verstaanbaar te maken :p

[Reactie gewijzigd door Domih op 5 oktober 2014 11:53]

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True