De Franse app-ontwikkelaar Applidium heeft het protocol achter de Siri-spraakherkenning van de iPhone 4S ontrafeld. Het bedrijf heeft code vrijgegeven waarmee de Siri-servers vanaf een willekeurig apparaat benaderd kunnen worden.
Het bedrijf zegt dat met de vrijgegeven tools en programmacode een willekeurige audiostream naar de servers van Apple gestuurd kan worden en dat deze vervolgens omgezet kan worden naar tekst. Hierdoor zouden in theorie naast Siri op de iPhone 4S ook andere applicaties gebruik kunnen maken van de text-to-speech-algoritmes die op Apples servers draaien.
Hoewel de tools van Applidium het mogelijk maken om vanaf elk willekeurig apparaat audiostreams naar de Siri-servers te sturen, is een iPhone 4S of in ieder geval de unieke code van dat apparaat, vereist. Elke audiostream die naar Apple verstuurd wordt, moet namelijk voorzien zijn van een specifieke header. Onderdeel van deze header is de variabele 'X-Ace-Host'; een waarde die voor elke iPhone uniek is.
Het Franse bedrijf doet in een blogpost uit de doeken hoe het protocol in elkaar steekt. Door tcp-verkeer van een iPhone 4S af te luisteren werd achterhaald naar welke server Siri de audiostreams verstuurt voor analyse. Daarna zette het bedrijf lokaal een server op en spoofde de dns-gegevens zodat Siri hiermee communiceerde in plaats van met de officiële Apple-servers. Hiervoor moest het bedrijf wel zelf een ssl-certificaat aanmaken voor de lokale server, en de iPhone 4S laten denken dat deze legitiem was.
Toen de server eenmaal operationeel was, kon begonnen worden met ontcijferen van de datapakketjes die Siri verstuurde. De software comprimeert ingesproken commando's met de Speex-audiocodec alvorens deze te verzenden. De Apple servers sturen daarop een extreem uitgebreid antwoord met niet alleen de tekstuele versie van de audiostream, maar ook een score die aangeeft hoe secuur de conversie is en de timestamp waarop de individuele woorden werden uitgesproken.
[Reactie gewijzigd door MikeyMan op dinsdag 15 november 2011 09:50]
Echt wel (lang niet alles maar iris kan een hoop wat siri ook kan)voorlopig doet iris niks wat siri wel doet.
[Reactie gewijzigd door watercoolertje op dinsdag 15 november 2011 09:40]
Dat is toch de hele mantra van Apple? Iets nemen wat al bestaat maar zo verschrikkelijk om te gebruiken dat niemand het gebruikt.Apple heeft een concept leuk herverpakt, en goed neergezet, maar het bestaat al langer.
Vergeet de muis en de GUI nietDat is toch de hele mantra van Apple? Iets nemen wat al bestaat maar zo verschrikkelijk om te gebruiken dat niemand het gebruikt.
Een eigen versie maken welke WEL zo goed werkt dat het WEL gebruikt wordt?
Zij zijn bekend met hu mp3-speler, dan een telefoon, een tablet, nu spraakbesturing.
Daar is geen ruimte voor, omdat apple technologie van een ander bedrijf gebruikt. Siri is in weze alleen een hele slimme frontend voor dat systeem. De voice2text en text2voice algoritmen zijn niet van apple, echter. (maar van Nuance)als iris hetzelfde zou kunnen of doen, dan kan je over een rechtzaak gaan nadenken (als daar überhaupt ruimte voor is).
[Reactie gewijzigd door kmf op dinsdag 15 november 2011 09:17]
[Reactie gewijzigd door weeraanmelden op dinsdag 15 november 2011 09:53]
hooguit dat je het kunt vragen zoals je het aan aan mens kunt vragen.Er is dus niets nieuws onder de zon, hooguit dat de herkenning wat beter is geworden.
[Reactie gewijzigd door bakman op dinsdag 15 november 2011 10:04]
[Reactie gewijzigd door The Van op dinsdag 15 november 2011 15:52]
Wat ReTechNL misschien meer bedoeld,Klopt, maar dat was alleen zorgen dat de App die Apple levert voor de iPhone 4S ook draait op de 4 en 3GS na een aantal minimale aanpassingen, daarvoor heb je geen kennis van het Siri protocol nodig.
[Reactie gewijzigd door dacken op dinsdag 15 november 2011 09:03]
Die ontwikkelaars uit het bericht hebben niks met grote bedrijven te maken en dus ook niet met de oorlog tussen bedrijven. Dus dit heeft niks te maken met de 'juridische honden' die Apple los laat op HTC, Samsung of nokiaEn men zich dan afvragen waarom Apple de juridische honden loslaat? Deze manier van werken riekt enorm naar kopieergedrag.
[Reactie gewijzigd door NicoJuicy op dinsdag 15 november 2011 09:57]
Ergens vind ik dat wel een beetje creepy, al jouw persoonlijke afspraken, gedicteerde mails, communicatie met de buitenwereld wordt geanalyseerd door AppleDe conversie van spraak naar tekst gebeurt op de servers van apple... die data wordt gedetailleerd teruggestuurd.
Die gedetailleerde data wordt wel lokaal verder verwerkt zo lijkt het. En ik kan me ook voorstellen dat daar een aanzienlijk stukje rekenkracht voor nodig is; Een zin analyseren, ontleden en vervolgens een vraag of opdracht daaruit filteren....
Op dit item kan niet meer gereageerd worden.
Populair: Tablets Samsung Websites en communities Mobiele telefoons Google Apple Microsoft Sony Games Politiek en recht
© 1998 - 2013 Tweakers.net B.V. Contact Over Tweakers Jouw privacy Algemene voorwaarden Cookies
Tweakers wordt uitgegeven door De Persgroep en wordt gehost door True