Hoofdcategorieën
Device Settings

YouTube maakt automatische ondertiteling algemeen beschikbaar

Door Joost Schellevis, vrijdag 5 maart 2010 12:55, views: 18.136

Google maakt de automatische ondertiteling op YouTube voor iedereen beschikbaar. De functie werd eerder al op beperkte schaal geïntroduceerd. De ondertiteling werkt momenteel alleen met duidelijk gesproken Engelstalige teksten.

Aan de ontwikkeling van de automatische ondertiteling is sinds augustus 2008 gewerkt. In november 2009 kon een kleine groep YouTube-partners al aan de slag met de automatische ondertiteling; inmiddels kan elke video automatisch worden ondertiteld, zo maakte Google donderdag bekend. De gesproken tekst moet wel in het Engels zijn, en bovenden moet het geluidsspoor redelijk 'schoon' zijn: video's met veel achtergrondgeluid of onduidelijk articulerende sprekers kunnen niet worden ondertiteld. Google raadt video-uploaders verder aan om te controleren of de ondertiteling klopt: is dat niet zo, dan kunnen ze de tekst downloaden, deze bewerken en weer uploaden. Kijkers kunnen de ondertiteling aanzetten door op de 'cc'-knop te klikken.

De ondertiteling is bedoeld voor doven en slechthorenden, hoewel kijkers er ook voor kunnen kiezen om de tekst door een vertaalmachine te halen. De ondertiteling kan naar circa vijftig talen worden vertaald. Het is nog niet bekend wanneer ook niet-Engelstalige video's kunnen worden ondertiteld; Google zegt ondersteuning voor andere talen in de 'komende maanden' toe te willen voegen.

YouTube-captions

Volgende 13:00 Video: Warhammer 40.000: Dawn of War II - Chaos Rising
Vorige 12:36 Video: Splinter Cell Conviction - Multiplayer
Advertentie

Reacties

«  1  2  3  4  »

_/-\o_ lijkt me wel een lastige techniek om te ontwikkelen; immers ga je geluid omzetten in txt. Dat kan opzich erg netjes (L&H voice express heeft dat in NLD al eens bewezen - belgisch bedrijf) maar maakt het nog niet gemakkelijk. Ben benieuwd wat voor hilarische vertaal-vouten dit gaat opleveren

voorbeeld filmpje reeds gelinkt in bericht zelf

//edit - onder opties (Die CC onderin) kun je de subtitles direct laten vertalen naar bijv. nld

[Reactie gewijzigd door himlims_ op vrijdag 5 maart 2010 13:54]


Ik raad mensen vooral eens aan om bij het voorbeeldfilmpje de vertaling van ENG>NLD te laten uitvoeren. Ik moet zeggen: petje af. Natuurlijk is het nog niet foutloos maar die realtime vertalingen zijn buitengewoon indrukwekkend en ik heb nog niet eerder gezien dat e.e.a. zo goed te volgen was. :P

Wie zegt er dat het real-time vertalingen zijn?

Dat neemt niet weg dat het een mooi staaltje techniek is, maar dit word natuurlijk niet real-time vertaald, maar gewoon op het moment van uploaden, en alle vertalingen worden gewoon opgeslagen.

Zou het ook niet kunnen real-time vertaald worden (mits mss 5 seconden op voorhand) met Google Translate? (aangezien YouTube ook van Google is)

Google Translate vertaalt ook terwijl je typt, dus als het gewoon het tekstje bezig is te vertalen dat na het tekstje wat je op het respectievelijke moment ziet in de ondertiteling (zie je ondertitel X, vertaalt hij al X+1; zie je X+1, vertaalt hij al X+2, enz...). Zou dat mss kunnen? ;)

Naja je hoeft het maar één keer te doen en op te slaan dus ik denk dat ze het inderdaad initieel met google translate doen, en het dan erbij opslaan. Zou zonde zijn van de processortijd en bandbreedte als je m elke keer opnieuw zou vertalen.

Het zal ongetwijfeld gecached worden, maar ik kan me prima voorstellen dat de vertaling (en de ondertiteling zelf, wat dat betreft) af en toe opnieuw gemaakt wordt; dit is techniek die nog volop in ontwikkeling is, dus als je de ondertiteling (en in mindere mate, de vertaling) over twee weken opnieuw maakt (met de nieuwste versie van de software) dan zou het resultaat er best wel eens op vooruit kunnen gaan.
Hoewel vertalen al flink wat volwassener is, zal dat ook opnieuw moeten, zodra je de "originele" tekst opnieuw bepaald hebt. Beide hoeven natuurlijk niet opnieuw zodra een gebruiker de handmatige correctie heeft toegepast (al heb je daar natuurlijk mooi vergelijkingsmateriaal om te kijken of de laatste tweaks aan je algorithme inderdaad echt een verbetering zijn, of toch per ongeluk een verslechtering).

Ik zie overigens niet wat je bedoelt met "zonde van de bandbreedte"?

L&H zijn volgens mij gewoon Belgische ondernemers (geweest?)

http://nl.wikipedia.org/wiki/Lernout_&_Hauspie

dat werkte echt perfect die software van hun; helaas niet meer verkrijgbaar. heb bijna al mijn huiswerk/boekverslagen etc. gedicteerd zonder ook maar iets te typen.

Zelfs Bill Gates is daarvoor naar België gekomen en heeft toen een flinke taart in z'n gezicht gekregen.

Tja L&H fraude debacle. Ik vind het heel spijtig want ze hadden idd een sterk staaltje technologie. Veel "goede huisvaders" zijn toen geld verloren op de beurs (die waren deze keer weer de dupe met Fortis)

PS: De technologie zit nu in Dragon NaturallySpeaking.

[Reactie gewijzigd door AndrewF op vrijdag 5 maart 2010 17:36]


staat er op de plek waar de ondertiteling moet komen niet reclame tegenwoordig? ;)

lijkt me lastig lezen :+

Hier de fouten uit een Google fimplje.
  • were goging to do it bowen said
  • %uh more likely you probably use your blood to estabilish yourself that you're on-line
  • holland said just building that up is a resource of googled articles
  • FARC ipv van Firefox
  • set up your pockets pension or chrome extension
  • can I say euros be bookmark
Dit ging over SEO 8)7 ja dat kwam er heel duidelijk uit :')

[Reactie gewijzigd door s.stok op zaterdag 6 maart 2010 12:33]


Schitterende functie om als je je headphones vergeten bent in de trein/aula naar filmpjes te kijken zonder je buren te hoeven storen. Youtube ftw!

Edit: Het lijkt wel nog niet optimaal te werken.

[Reactie gewijzigd door JFontane op vrijdag 5 maart 2010 13:19]


Er zijn al videootjes met subtitels in meerdere talen: http://www.youtube.com/watch?v=H_mU7lkE-sA . Zelfs realtime vertalingen zitten erin (bijv. Engels naar Nederlands, zelfs Chinees naar Nederlands werkt :)).
Ben benieuwd hoe ze dit in de HTML5 variant van Youtube gaan bouwen.
@vehpol: bij mij werkt het gewoon goed. Misschien een oude versie van Flash? Check hier.

[Reactie gewijzigd door Rick2910 op vrijdag 5 maart 2010 15:06]


Als ik die link volg en de ondertiteling aan zet, dan verschijnt er 2x dezelfde tekst in beeld. Elke taalwissel (ook naar dezelfde taal) leverde mij een extra regel op. 6x dezelfde ondertiteling boven elkaar lijkt mij niet heel veel toe te voegen. Dus zo bezien werkt het nog niet vlekkeloos. Maar wel een mooie ontwikkeling natuurlijk. Ook als je geen boxen hebt, of geen geluid aan wilt hebben.

Had ik ook, na 3 regels maar even nergens meer op geklikt :)
Naast deze kleine bugs moet ik zeggen dat ik erg onder de indruk bent van wat ze hier doen.
De vertaling van Engels naar Nederlands was verbazingwekkend goed.
Weet iemand of dit open source of closed sourced is gedaan?

Best wel grappige functie en eigenlijk niet alleen maar grappig maar ook nog eens nuttig. Ben benieuwd wanneer dit ook met muziek videoclips kan. Heb je in één keer de songtekst erbij.

Ik denk dat dit nog wel ff gaat duren.
bovenden moet het geluidsspoor redelijk 'schoon' zijn: video's met veel achtergrondgeluid of onduidelijk articulerende sprekers kunnen niet worden ondertiteld
Volgens mij is het super lastig, zo niet onmogelijk om softwarematig stemmen van achtergrondgeluid (muziek) te scheiden.

De frequentie van stemgeluid ligt vele malen lager dan dat van muziek, an sich zou het dus wel moeten kunnen.

Onzin. Drums liggen lager, bekkens hoger, gitaren en (gedeeltelijk keys) zitten in hetzelfde bereik. Tekst uit muziek halen is echt nog wel een flinke stap verder

We zitten er dichterbij dan je denkt.

Ik gebruik MPlayer OSX Extended als mediaspeler, en er zit een gimmicy (voor mij althans) feature ingebakken: Karaoke mode (laatste optie).

In Karaoke mode, speciaal gemaakt voor o.a. muziekclips, filtert hij de stemmen uit de muziek. Meestal lukt het wel, met soms heel zachte stemmen, soms lukt het volledig en soms ook niet. Soms blijft er wel wat ruis hangen (het geluid dat je ook krijgt als je een CD laat doorspoelen)...

Maar toch petje af voor de makers die de stemmen er min of meer uit kunnen halen!

Dus als dat kan, waarom dan niet enkel de tekst houden en vertalen?

Dat doet ie niet door een bepaalde frequentie te filteren maar door alle mono-kanalen stil te gooien. Zang is vaak mono, terwijl de instrumenten over de 2 kanalen verdeelt worden en net iets verschillen.

Dit is toch wel een top ontwikkeling, zeker als ze google translate nog verder door ontwikkelen, het linken en meer gaan doen met live shows direct uitgezonden via youtube kan het een mooie combinatie worden van live beelden, met ondertiteling en zelfs nog in je eigen taal beschikbaar indien gewenst.

Goede potentie iig dat ondertitelen op deze manier. Sowiezo een goede zaak hoe YouTube de laatste tijd onder handen genomen wordt :).

Ik kan me voorstellen dat er technologische beperkingen zijn wat betreft duidelijkheid en correctheid (algemeen beschaafd engels - voorzover dat bestaat: Amerikaans? Brits?).

Echter, het doet wel af aan de functionaliteit er van. Juist voor toepassingen waar je dit nodig hebt: locaal dialect, slang, slecht verstaanbaar... werkt de ondertiteling niet.

De ondertiteling is bedoeld voor doven en slechthorenden
Ik denk niet dat doven en slechthorende last hebben van lokale dialecten, slang of slecht verstaanbare uitspraken, aangezien ze deze niet of weinig kunnen horen.

Hij bedoelt, als de gesproken tekst in de video onverstaanbaar wordt (ander voorbeeld: iemand die mompelt), wordt het voor de automatische vertaling een stuk moeilijker om de spraak eruit te halen.

Over die doven, idem als je bedoelt de doven die kijken. Ondertitels werken voor iedereen hetzelfde.

Als je bedoelt doven in een video zelf, dan moet ik je teleurstellen.

Zelfs in gebarentaal zijn er verschillende talen, dialecten, streekgebonden en niet overeenstemmend met elkaar. (Ben Vlaming, dus ken enkel Vlaamse gebarentaal. Nederlanse gebarentaal is anders. En dan heb je nog gebaren die verschillen per provincie/streek...)

Ja, er bestaat een International Sign Language (andere link), maar wij hebben ook het Esperanto, he...

Ik was bijzonder onder de indruk van het herkennen van en ook het vertalen naar het Nederlands uit het Engels. petje af

De ondertiteling werkt niet als je naar de HTML5 versie (met Chrome) kijkt.
Ik ben benieuwd hoe snel ze dat gaan fixen aangezien Google zelf fan is van HTML5 video.

Het gevolg van datamining van Google.
Dit is natuurlijk zeer positief en dit zal ook zorgen voor realtime vertalingen tijdens chatsessies (en in de toekomst zal het tot telefoongesprekken komen)
Dit is het topje van de ijsberg, de implimentaties zijn globaal ongelimiteerd.

Je kan het zien als de nieuwe versie van de toren van Babel

Wat heeft dit met datamining te maken?

Google Radioads is waarschijnlijk het commerciële project hier achter geweest. Terwijl bijvoorbeeld IBM echt in de ondertiteling business zelf zat.

is het automatisch toepasbaar voor alle video's?
«  1  2  3  4  »

Op dit item kan niet meer gereageerd worden.

Volgende 13:00 Video: Warhammer 40.000: Dawn of War II - Chaos Rising
Vorige 12:36 Video: Splinter Cell Conviction - Multiplayer
VNU Media logo Hosted by True

© 1998 - 2012 Tweakers.net B.V. - Alle rechten voorbehouden - Contact - Jouw privacy - Algemene Voorwaarden

Uitgever van:

Website van het jaar 2011