Ontwikkelaar Soundhound maakt app voor zoeken via stembediening

De ontwikkelaar van muziekherkenningsapplicatie Soundhound werkt al negen jaar aan een app om te zoeken via stembesturing. Hound komt als app beschikbaar, maar ook als platform dat ontwikkelaars kunnen integreren in hun eigen apps.

De app Hound is nog niet te downloaden, maar is momenteel alleen beschikbaar voor de gesloten testgroep, blijkt uit een artikel van Recode over de app. De app moet eerst uitkomen voor Android en zal in later stadium ook voor iOS verschijnen.

In de demonstratie gebruikt de ontwikkelaar de app om een hotelkamer te vinden. Daarbij spreekt hij telkens nieuwe criteria in, waarna de app die verwerkt en de resultaten toont. Het zoeken van hotelkamers gaat via reissite Expedia en er zouden in totaal zo'n vijftig van die diensten zijn die werken in Hound. Het is onduidelijk of de app ook werkt buiten de Verenigde Staten.

De ontwikkelaar is bekend van zijn app Soundhound, waarmee gebruikers muziek kunnen laten herkennen. Die app zou inmiddels zo'n 260 miljoen keer zijn gedownload.

Wanneer Hound precies uit de testfase komt, is nog onbekend. De app heeft veel concurrentie. Onder meer Google heeft zijn eigen spraakbesturingssoftware, net als Apple en Microsoft.

Vorig nieuwsartikel Volgend nieuwsartikel

Door Arnoud Wokke

Redacteur Tweakers

Feedback • 03-06-2015 19:50 29

03-06-2015 • 19:50

Lees meer

Spotify maakt embedden muziek mogelijk Nieuws van 11 april 2012

Android Market bereikt 10 miljard downloads Nieuws van 6 december 2011

Spotify integreert diensten met muziekherkennings-app Nieuws van 25 augustus 2011

Smartphones

Reacties (29)

-Moderatie-faq

Wijzig sortering

Maxiootje 3 juni 2015 20:06

Indrukwekkende demo: https://www.youtube.com/watch?v=M1ONXea0mXg

Maar zoals /u/Magnus al opmerkt:

"For all we know, this application was trained specifically on this mans voice, with those exact phrases, and the same way of saying them. Hell, we don't even see his mouth, so they could just be playing back the exact voice clips that the system already knows."

Deze demo is waarschijnlijk dus niet heel veel zeggend.. video zal ook wel bewust gelekt zijn.

[Reactie gewijzigd door Maxiootje op 1 augustus 2024 08:09]

24shure @Maxiootje • 3 juni 2015 20:13

Wow, gewoon wow. Hoe kan één ontwikkelaar zoiets neerzetten?

basvd @24shure • 3 juni 2015 23:26

Er zijn al diverse open source varianten waarbij ontwikkelaars dit binnen enkele uren voor elkaar kunnen krijgen, bijvoorbeeld met API.AI: http://api.ai/

Toevallig gister een avondje bezig geweest met API.AI, zie hier wat eenvoudige voorbeelden
https://github.com/basvandorst/BYOS

Ik denk dat je vrij snel soortelijke resultaten kunt bereiken als je bijvoorbeeld de WolframAlpha API hieraan koppelt. (.. De snelheid van de demo is wel indrukwekkend, maar de rest lijkt mij met de tools van nu eigenlijk geen 9 jaar werk)

[Reactie gewijzigd door basvd op 1 augustus 2024 08:09]

Luca @basvd • 4 juni 2015 00:00

Ik denk dat iedereen dan ook zo onder de indruk is van de snelheid. Dat is gewoon bizar snel.

PuzzleSolver @basvd • 4 juni 2015 10:11

(.. De snelheid van de demo is wel indrukwekkend, maar de rest lijkt mij met de tools van nu eigenlijk geen 9 jaar werk)

Hij is dus één van de mensen die deze tools ontwikkeld en er gaat best wel veel tijd in zitten om spraakherkenning op dit tempo te kunnen doen.

Ik ben benieuwd naar een api hiervoor. Verder vraag ik me af of er ook veel training op eigen stem nodig is om op dit tempo te komen.

thomasv @24shure • 3 juni 2015 22:07

Veel tijd investeren?

Verwijderd @Maxiootje • 3 juni 2015 22:16

Deze demo is waarschijnlijk dus niet heel veel zeggend.. video zal ook wel bewust gelekt zijn.

Ik durf dit geen lek te noemen. Staat gewoon op hun YouTube account. Het was achteraf ook niet heel lastig voor ze geweest om die video offline te halen dus 't feit dat 'ie er nog staat lijkt heel bewust te zijn.

"For all we know, this application was trained specifically on this mans voice, with those exact phrases, and the same way of saying them. Hell, we don't even see his mouth, so they could just be playing back the exact voice clips that the system already knows."

Is zo. Maar voordat we direct overal geheimzinnige complotten gaan zien, realiseer je even hoe gaaf dit is als 't echt is. En er is geen reden dat het niet echt zou kunnen zijn.

Er is verder ook: https://www.houndify.com

Golodh @Verwijderd • 4 juni 2015 22:45

Als dit echt waar is (niet getraind op de proefpersoon en niet getraind op de vragen), dan vind ik dit echt heel indrukwekkend en vraag ik mij af hoelang het duurt voordat dit stukje software heel veel taken binnen call-centers gaat overnemen.

Met name het niveau van de taalherkenning verbaast me.

StarZ @Maxiootje • 3 juni 2015 21:44

Dat is inderdaad erg indrukwekkend!!!

BuzzeW @Maxiootje • 3 juni 2015 23:36

Geschift. Echt geschift. Siri en Google Now komen nog niet eens dicht in de buurt van zoiets. Zat hier eventjes met m'n mond vol tanden.

SBTweaker 3 juni 2015 20:39

Wat ik me afvraag, wanneer zou je dit ooit gebruiken, behalve wanneer je in de auto zit. Bijvoorbeeld bij siri dat iedereen geweldig vond, hoeveel mensen heb je het zien gebruiken, ik zelf nooit.

[Reactie gewijzigd door SBTweaker op 1 augustus 2024 08:09]

n8n @SBTweaker • 3 juni 2015 23:59

Gebruik het zelf dagelijks om muziek af te spelen, telefoontjes te starten, een timer of wekker inschakelen. Allemaal kleine dingetjes die veel meer handelingen verrichten via normale besturing.

Gebruik het voornamelijk wanneer ik mijn koptelefoon op heb, mic indrukken, opdracht geven en beginnen met bellen/luisteren, zonder m'n telefoon aan te raken.

SBTweaker @n8n • 4 juni 2015 11:12

Bij mij werkt het altijd sneller als ik het met de hand doe, anders is het siri starten -> inspreken -> checken of hij het goed heeft herkend.

ThijsX 3 juni 2015 20:25

1 dag al geïnstalleerd en vandaag heb ik de uitnodiging gekregen waardoor die functioneel is

en ik moet zeggen Google herkent stemmen nog wel iets beter. Maar de respons snelheid en uitgebreidheid is wel beter.

dave1972 @ThijsX • 3 juni 2015 20:29

En hoe heb jij dat voor elkaar gekregen ?

ThijsX @dave1972 • 3 juni 2015 20:32

Via apkmirror gedownload en geïnstalleerd een invite gevraagd. Mailtje rolde vandaag binnen.

dave1972 @ThijsX • 3 juni 2015 20:33

Top thanks

JJ93 3 juni 2015 21:01

Werkt in de demo inderdaad super, maar zoals hierboven ook als is opgemerkt kan deze demo gewoon voorbereid zijn precies op de gebruikte termen en stem van de man. Ik zie hier zeker wel toekomst in, met Homey gaat het volgens mij ook goed. Nadat ik afgestudeerd ben wil ik de master Human Media Interaction gaan doen, hier kan je ook aan de slag met Machine Learning en Voice Recognition algorithms. Erg lastig, maar als je het een keer goed hebt werken, ook al is het voor iets simpels, lijkt het me echt super

Verwijderd 3 juni 2015 21:15

Ik denk dat ik altijd deze app boven alle andere vergelijkbare functies van android en apple zou verkiezen
ben een soundhound fan en dat heeft ie erg knap in elkaar gezet
dat ie er 9 jaar aan gewerkt heeft is ook al een pluspunt omdat de meeste ontwikkelaars het zo snel mogelijk willen lanceren en dan met het volgende project verder en dan via updates de vorige (proberen) fatsoenlijk werkend te krijgen

Fuzzillogic 3 juni 2015 22:43

Stemherkenning gebeurt hier on-board? Off-board, zoals bij google, is voor mij een no-go.

Verwijderd 4 juni 2015 02:15

Voor degenen die benieuwd zijn naar wat de app kan: https://youtu.be/M1ONXea0mXg

dave1972 3 juni 2015 20:12

Woohooooo erg indrukwekkend idd

Verwijderd 4 juni 2015 09:56

Doet me hier aan denken:

https://www.youtube.com/watch?v=WTn-KbFGLUU

Verwijderd 4 juni 2015 11:28

Oke dus dit is feitelijk een Siri (sorry, ligt nou eenmaal voor de hand, Cortana mag ook) die wel weer met Wolfram Alpha werkt?

question @Verwijderd • 4 juni 2015 16:29

Ik snap ook nog niet helemaal de toegevoegde waarde (op de koppeling met wolfram alpha na). Als Siri/Cortana/Google eenmaal wordt gekoppeld aan dezelfde API is het verschil tussen de apps nihil. Als de snelheid een grote USP is hebben ze mij daar niet mee. Ik wil gerust een seconde wachten op een antwoord. Een mens geeft tenslotte ook niet in een halve seconde antwoord.

Als ik mijn toestel nou met spraak kan bedienen met zo'n snelheid wordt het een ander verhaal, maar dan heb je toch echt de native app van je platform nodig...

Verwijderd @question • 5 juni 2015 00:35

Het lollige is dat Siri oorspronkelijk alleen met Wolfram Alpha en Google search werkte, en toen Apple het kocht hebben ze WA eruit gehaald

question @Verwijderd • 8 juni 2015 08:19

Na wat zoekwerk blijkt WA (nog steeds) onderdeel te zijn van Siri. Wat Siri echter doet is obv je zoekopdracht deze serveren aan API's van OA WA, Google of Bing.

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (29)

Sorteer op:

Weergave: