Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 34 reacties
Submitter: 230385

Google heeft in zijn experimentele Labs-omgeving Google Audio Indexing gelanceerd. De nieuwe dienst maakt het mogelijk om op trefwoord te zoeken binnen gesproken content.

Gaudi logoMet de tot Gaudi gedoopte dienst zijn op Youtube geposte video's die gerelateerd zijn aan de Amerikaanse verkiezingen te doorzoeken. Het indexeringsalgoritme plaatst op de momenten dat de term voorkomt een markering in de video, terwijl de speech ook uitgeschreven is te lezen.

Hoewel Google al langer sleutelt aan zijn spraakherkenningstechnologie, kan Gaudi in de toekomst mogelijk een belangrijke bijdrage leveren aan het genereren van nieuwe inkomsten. De zoekgigant is immers beter in staat om gerelateerde advertenties naast Youtube-video's te plaatsen als zij automatisch kunnen achterhalen wat er precies wordt gezegd. Hierdoor zou de drukbezochte videoportal winstgevend gemaakt kunnen worden. Bovendien kunnen geïndexeerde filmpjes worden meegenomen in de zoekresultaten die Google biedt.

Moderatie-faq Wijzig weergave

Reacties (34)

Niemand bekend met Vista in combinatie met OneNote 2007? Die combinatie heeft de zoekmogelijkheid in audio bestanden ook. Nu alleen via Google ook online. Maar als je dus met OneNote 2007 en Vista bij een vergadering de tekst opneemt, dan kan je die tekst ook doorzoeken middels de default search van Vista.
dit kan nooit haalbaar zijn lijkt me ivm dialecten. verschillende talen, straat talen etc
het gaat niet om een 100% herkenning,
keywords is genoeg voor advertentie inkomsten (en voor de meeste zoekresultaten)
maar als je nou een Nederlands woord voor een engels woord aanziet wat heel wat anders betekent. Ik kan zo even geen voorbeeld bedenken maar die zal er vast wel zijn.
Ik gok dan ook dat Google zoveel mogelijk metadata en context zal verzamelen. Een geluidsfragment op een Nederlandstalige website heeft een grotere waarschijnlijkheid om ook Nederlandstalig te zijn bijvoorbeeld.

Bij de Human Media Interaction vakgroep op de UT zijn ze er iig ook al een tijd druk mee bezig. Bij het Nationaal Beeld en Geluidsarchief bijvoorbeeld zijn ze namelijk zeer geïnteresseerd om al hun content te indexeren, het door mensen laten annoteren is ondoenlijk.
Dat probleem heeft Google op zich ook bij het scannen van "gewone" tekst. Ze zullen op een of andere manier moeten vaststellen in welke taal het geschreven, anders werkt de optie "Alleen zoeken in Nederlandse pagina's" niet.

Maar ik denk dat je aan de hand van een paar herkenbare woorden al heel ver kan komen.
Ik weet niet precies hoe jouw uitspraak is, maar zo erg lijken ze niet op elkaar?
Ik weet niet hoe goed google is , maar inderdaad.
Door naar context te kijken is er redelijk te bepalen over welke taal het gaat. Als er om het woord heen alleen maar woorden staan die blijkbaar Nederlands zijn, dan zal dat ene woord dat met zeer grote waarschijnlijkheid ook zijn.
Ik denk dat in de eerste plaats deze dienst alleen beschikbaar is voor content die gemarkeerd is als Engelstalig.
Als de meeste woorden Nederlands zijn dan zal die dat uiteraard als een Nederlands woord aanzien. Je gaat ook geen voetbaltermen gebruiken bij een operatie in het ziekenhuis enzovoort.

Misschien dat dit tweede nog niet gebruikt wordt, maar het zou mogelijk zijn voor betere resultaten.

[Reactie gewijzigd door TomWij op 18 september 2008 13:52]

of als je voor duits een werkstuk moet maken over het nummer 6
Het woord drop bijvoorbeeld. (snoep vs loslaten)

Kan leuke advertentiehits geven ;)
Drop your weapon and give up.

Snoep je wapen en geef over
Waarom zou in hemelsnaam drop naar snoep veranderen... drop is gewoon drop :) of laten vallen en niet uit het niks snoep :P
Als ze spraakherkenning en vertalen zo geadvanceerd krijgen en dat het ook nog aan de video hangt op het moment dat ze spreken dan hebben ze binnenkort ook wel een manier om efficient films te gaan ondertitelen. :*)
Dat zou zelfs met "Lip Reading Software" kunnen ook trouwens.

Gedaan met de nieuwste "Lipreading Software" ver doorontwikkeld door de Duitsers onlangs.
Hun uitdaging was juist om met de nieuwe software de oude Kleuren Hitler films van tekst en geluid te voorzien zodat het nog meer tot leven komt.

De Software werkt zelfs onder een flinke hoek naar het gezicht toe maar word daardoor wel onnauwkeuriger natuurlijk.

Rarest Document on YouTube?! 1939-Hitler and Friends-Col/Snd
http://nl.youtube.com/watch?v=dZBAcU3jxg0

[Reactie gewijzigd door Youri Carma op 18 september 2008 15:38]

Als ze de grappen/woordspelingen dan maar goed doen.
En ach, slechter dan menselijke vertalingen kan het op dat vlak bijna niet. ;)
Als ik zie hoe ver spraakherkenning 10 jaar geleden al stond, dan vind ik dit nog niet zo een overdreven grote stap. Kan nog eens interessant worden om programma's op die manier te ondertitelen (in de eigen taal dan, want met een automatische vertaling zou het al te gek worden)
Als een mens onderscheid kan maken tussen een dubbele betekenis dan moet de computer dat ooit ook kunnen, misschien moet er maar eens iemand beginnen met het maken van een database waar relaties tussen woorden in worden opgenomen.
Ja, dat meen je toch niet. De enige manier hoe ik dit zie gebeuren is wanneer artificiele intelligentie een bepaalde maturiteit heeft om ervoor te zorgen dat de computer woorden kan interpreteren en zelf aan context, dubbelzinnigheid enz. kan definieren. Het moet op een dynamische manier gebeuren of anders is het onhaalbaar. En daar zit het net, het aanpak daarvoor moest heel complex zijn.
Aan een 2e woord in de tekst kun je al vaak kunt bepalen welke taal het is. Dus dan filter je de dubbele betekenis automatisch.
Wow, ik wist niet dat ze al zo ver waren met spraakherkenning dat ze complete films kunnen begrijpen. Ben benieuwd hoe goed dit werkt en hoeveel false positives er zijn.
Woorden herkennen != Zinnen begrijpen
Ik denk dat meta tags handiger zijn. Zoals Red Soniq al aangeeft: het begrijpen zit d'r nog niet in. Het lijkt me dan ook dat bij bijv. cabaret of stand-up comedy die meest rare ads gaan komen.
Leuk dus nu luister Google niet alleen mee via de mic van je computer maar nu kan iedereen daar ook nog eens in zoeken!?

Zie: Google wil microfoon inzetten voor gerichte reclames
nieuws: Google wil microfoon inzetten voor gerichte reclames

Met de nieuwe "Big Brother" camera's en mics overal kunnen we dus nu via Google ook zoeken in gesproken tekst ergens in een Cafe of straat.

Dat Google gaat steeds gezelliger worden ;)
Dat is dus niet waar ...
Google indexeerd (vooralsnog) alleen YoutTube video's.
En nu is het zelfs nog zo dat ze alleen de political channels van YouTube indexeren.
Dit ivm de verkiezingscampagne in de USA.

Al sluiten we natuurlijk niet uit dat het in de toekomst uitgebreid gaat worden.

[Reactie gewijzigd door joostvanh op 18 september 2008 14:28]

Voor degene die de link ook niet legden en het zich dus ook afvroegen, Gaudi staat voor Google AUDio Indexing
bron: http://labs.google.com/gaudi/static/faq.html

[Reactie gewijzigd door QkE op 18 september 2008 14:35]

joh ...

Al moet ik zeggen dat wanneer je enkel Gaudi intikt in Google, je geen resultaten krijgt over dit nieuwe project.
Normaal gesproken (?) staan de projecten van google altijd direct bovenaan.
maps, earth, desktop, check out, documents, agenda etc...

[Reactie gewijzigd door joostvanh op 18 september 2008 14:54]

Ben ik nou eigenlijk de enige die zich een beetje afvraagt waar Google mee bezig is? Ze zijn tig services aan het lanceren, ze zijn allemaal niet uitgewerkt en experimenteel. Elke week komt weer iets nieuws onder het motto kwantiteit is kwaliteit. Google moet zich eens op 1 ding tegelijk concentreren en eerst iets afmaken.
Noem eens een paar services die volgens jouw kwalitatief niet goed zijn ...
De producten die Google op de markt brengt worden helemaal niet onder het motto van: kwantiteit is kwaliteit op de markt gebracht.

Google heeft misschien een monopolie positie waarin ze (waarschijnlijk, en beweert door velen) informatie over haar gebruikers kan verkrijgen.
Met deze info kan Google haar nieuwe producten heel goed afstemmen op de gebruikers. En ik vind dat ze dat uitstekend doen ...

Ik vind helemaal niet dat Google kwantiteit levert:
Veel programma's functioneren uitstekend en worden zo verstrekt.
Maar nee, omdat Google te groot wordt en op te veel gebieden services exploiteerd worden mensen weer argwanend.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True