Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 29 reacties

De ontwikkelaar van muziekherkenningsapplicatie Soundhound werkt al negen jaar aan een app om te zoeken via stembesturing. Hound komt als app beschikbaar, maar ook als platform dat ontwikkelaars kunnen integreren in hun eigen apps.

De app Hound is nog niet te downloaden, maar is momenteel alleen beschikbaar voor de gesloten testgroep, blijkt uit een artikel van Recode over de app. De app moet eerst uitkomen voor Android en zal in later stadium ook voor iOS verschijnen.

In de demonstratie gebruikt de ontwikkelaar de app om een hotelkamer te vinden. Daarbij spreekt hij telkens nieuwe criteria in, waarna de app die verwerkt en de resultaten toont. Het zoeken van hotelkamers gaat via reissite Expedia en er zouden in totaal zo'n vijftig van die diensten zijn die werken in Hound. Het is onduidelijk of de app ook werkt buiten de Verenigde Staten.

De ontwikkelaar is bekend van zijn app Soundhound, waarmee gebruikers muziek kunnen laten herkennen. Die app zou inmiddels zo'n 260 miljoen keer zijn gedownload.

Wanneer Hound precies uit de testfase komt, is nog onbekend. De app heeft veel concurrentie. Onder meer Google heeft zijn eigen spraakbesturingssoftware, net als Apple en Microsoft.

Moderatie-faq Wijzig weergave

Reacties (29)

Indrukwekkende demo: https://www.youtube.com/watch?v=M1ONXea0mXg

Maar zoals /u/Magnus al opmerkt:

"For all we know, this application was trained specifically on this mans voice, with those exact phrases, and the same way of saying them. Hell, we don't even see his mouth, so they could just be playing back the exact voice clips that the system already knows."

Deze demo is waarschijnlijk dus niet heel veel zeggend.. video zal ook wel bewust gelekt zijn.

[Reactie gewijzigd door Maxiootje op 3 juni 2015 20:14]

Wow, gewoon wow. Hoe kan één ontwikkelaar zoiets neerzetten?
Er zijn al diverse open source varianten waarbij ontwikkelaars dit binnen enkele uren voor elkaar kunnen krijgen, bijvoorbeeld met API.AI: http://api.ai/

Toevallig gister een avondje bezig geweest met API.AI, zie hier wat eenvoudige voorbeelden
https://github.com/basvandorst/BYOS

Ik denk dat je vrij snel soortelijke resultaten kunt bereiken als je bijvoorbeeld de WolframAlpha API hieraan koppelt. (.. De snelheid van de demo is wel indrukwekkend, maar de rest lijkt mij met de tools van nu eigenlijk geen 9 jaar werk)

[Reactie gewijzigd door basvd op 3 juni 2015 23:47]

Ik denk dat iedereen dan ook zo onder de indruk is van de snelheid. Dat is gewoon bizar snel.
(.. De snelheid van de demo is wel indrukwekkend, maar de rest lijkt mij met de tools van nu eigenlijk geen 9 jaar werk)
Hij is dus één van de mensen die deze tools ontwikkeld en er gaat best wel veel tijd in zitten om spraakherkenning op dit tempo te kunnen doen.

Ik ben benieuwd naar een api hiervoor. Verder vraag ik me af of er ook veel training op eigen stem nodig is om op dit tempo te komen.
Veel tijd investeren?
Deze demo is waarschijnlijk dus niet heel veel zeggend.. video zal ook wel bewust gelekt zijn.
Ik durf dit geen lek te noemen. Staat gewoon op hun YouTube account. Het was achteraf ook niet heel lastig voor ze geweest om die video offline te halen dus 't feit dat 'ie er nog staat lijkt heel bewust te zijn.
"For all we know, this application was trained specifically on this mans voice, with those exact phrases, and the same way of saying them. Hell, we don't even see his mouth, so they could just be playing back the exact voice clips that the system already knows."
Is zo. Maar voordat we direct overal geheimzinnige complotten gaan zien, realiseer je even hoe gaaf dit is als 't echt is. En er is geen reden dat het niet echt zou kunnen zijn.

Er is verder ook: https://www.houndify.com
Als dit echt waar is (niet getraind op de proefpersoon en niet getraind op de vragen), dan vind ik dit echt heel indrukwekkend en vraag ik mij af hoelang het duurt voordat dit stukje software heel veel taken binnen call-centers gaat overnemen.

Met name het niveau van de taalherkenning verbaast me.
Dat is inderdaad erg indrukwekkend!!!
Geschift. Echt geschift. Siri en Google Now komen nog niet eens dicht in de buurt van zoiets. Zat hier eventjes met m'n mond vol tanden.
Wat ik me afvraag, wanneer zou je dit ooit gebruiken, behalve wanneer je in de auto zit. Bijvoorbeeld bij siri dat iedereen geweldig vond, hoeveel mensen heb je het zien gebruiken, ik zelf nooit.

[Reactie gewijzigd door SBTweaker op 3 juni 2015 20:39]

Gebruik het zelf dagelijks om muziek af te spelen, telefoontjes te starten, een timer of wekker inschakelen. Allemaal kleine dingetjes die veel meer handelingen verrichten via normale besturing.

Gebruik het voornamelijk wanneer ik mijn koptelefoon op heb, mic indrukken, opdracht geven en beginnen met bellen/luisteren, zonder m'n telefoon aan te raken.
Bij mij werkt het altijd sneller als ik het met de hand doe, anders is het siri starten -> inspreken -> checken of hij het goed heeft herkend.
1 dag al geïnstalleerd en vandaag heb ik de uitnodiging gekregen waardoor die functioneel is :) en ik moet zeggen Google herkent stemmen nog wel iets beter. Maar de respons snelheid en uitgebreidheid is wel beter.
En hoe heb jij dat voor elkaar gekregen ?
Via apkmirror gedownload en geïnstalleerd een invite gevraagd. Mailtje rolde vandaag binnen.
Werkt in de demo inderdaad super, maar zoals hierboven ook als is opgemerkt kan deze demo gewoon voorbereid zijn precies op de gebruikte termen en stem van de man. Ik zie hier zeker wel toekomst in, met Homey gaat het volgens mij ook goed. Nadat ik afgestudeerd ben wil ik de master Human Media Interaction gaan doen, hier kan je ook aan de slag met Machine Learning en Voice Recognition algorithms. Erg lastig, maar als je het een keer goed hebt werken, ook al is het voor iets simpels, lijkt het me echt super :Y)
Ik denk dat ik altijd deze app boven alle andere vergelijkbare functies van android en apple zou verkiezen
ben een soundhound fan en dat heeft ie erg knap in elkaar gezet
dat ie er 9 jaar aan gewerkt heeft is ook al een pluspunt omdat de meeste ontwikkelaars het zo snel mogelijk willen lanceren en dan met het volgende project verder en dan via updates de vorige (proberen) fatsoenlijk werkend te krijgen
Stemherkenning gebeurt hier on-board? Off-board, zoals bij google, is voor mij een no-go.
Voor degenen die benieuwd zijn naar wat de app kan: https://youtu.be/M1ONXea0mXg
Woohooooo erg indrukwekkend idd
Oke dus dit is feitelijk een Siri (sorry, ligt nou eenmaal voor de hand, Cortana mag ook) die wel weer met Wolfram Alpha werkt? ;)
Ik snap ook nog niet helemaal de toegevoegde waarde (op de koppeling met wolfram alpha na). Als Siri/Cortana/Google eenmaal wordt gekoppeld aan dezelfde API is het verschil tussen de apps nihil. Als de snelheid een grote USP is hebben ze mij daar niet mee. Ik wil gerust een seconde wachten op een antwoord. Een mens geeft tenslotte ook niet in een halve seconde antwoord.

Als ik mijn toestel nou met spraak kan bedienen met zo'n snelheid wordt het een ander verhaal, maar dan heb je toch echt de native app van je platform nodig...
Het lollige is dat Siri oorspronkelijk alleen met Wolfram Alpha en Google search werkte, en toen Apple het kocht hebben ze WA eruit gehaald :+
Na wat zoekwerk blijkt WA (nog steeds) onderdeel te zijn van Siri. Wat Siri echter doet is obv je zoekopdracht deze serveren aan API's van OA WA, Google of Bing.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True