Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 108 reacties, 31.195 views •
Submitter: kramerty88

De Franse app-ontwikkelaar Applidium heeft het protocol achter de Siri-spraakherkenning van de iPhone 4S ontrafeld. Het bedrijf heeft code vrijgegeven waarmee de Siri-servers vanaf een willekeurig apparaat benaderd kunnen worden.

Het bedrijf zegt dat met de vrijgegeven tools en programmacode een willekeurige audiostream naar de servers van Apple gestuurd kan worden en dat deze vervolgens omgezet kan worden naar tekst. Hierdoor zouden in theorie naast Siri op de iPhone 4S ook andere applicaties gebruik kunnen maken van de text-to-speech-algoritmes die op Apples servers draaien.

Hoewel de tools van Applidium het mogelijk maken om vanaf elk willekeurig apparaat audiostreams naar de Siri-servers te sturen, is een iPhone 4S of in ieder geval de unieke code van dat apparaat, vereist. Elke audiostream die naar Apple verstuurd wordt, moet namelijk voorzien zijn van een specifieke header. Onderdeel van deze header is de variabele 'X-Ace-Host'; een waarde die voor elke iPhone uniek is.

Het Franse bedrijf doet in een blogpost uit de doeken hoe het protocol in elkaar steekt. Door tcp-verkeer van een iPhone 4S af te luisteren werd achterhaald naar welke server Siri de audiostreams verstuurt voor analyse. Daarna zette het bedrijf lokaal een server op en spoofde de dns-gegevens zodat Siri hiermee communiceerde in plaats van met de officiële Apple-servers. Hiervoor moest het bedrijf wel zelf een ssl-certificaat aanmaken voor de lokale server, en de iPhone 4S laten denken dat deze legitiem was.

Toen de server eenmaal operationeel was, kon begonnen worden met ontcijferen van de datapakketjes die Siri verstuurde. De software comprimeert ingesproken commando's met de Speex-audiocodec alvorens deze te verzenden. De Apple servers sturen daarop een extreem uitgebreid antwoord met niet alleen de tekstuele versie van de audiostream, maar ook een score die aangeeft hoe secuur de conversie is en de timestamp waarop de individuele woorden werden uitgesproken.

Reacties (108)

Reactiefilter:-11080100+160+26+30
Moderatie-faq Wijzig weergave
Schaamteloze cross-post voor iedereen die zegt "Spraakherkenning zit ook op Android!" en "Spraakbesturing bestaat toch al 15 jaar?":

Spraakbesturing op Android snapt commando's als:
"Bel naam"
"SMS naam bericht"
"Speel artiest"
http://www.google.com/mobile/voice-actions/

Net als de huidige spraakbesturing op de iPod Touch en iPhone 4.

Gedicteerde zinnen omzetten in tekst lukt ook nog wel, maar daadwerkelijk begrijpen wat er gezegd wordt niet. Siri interpreteert zinnen als "Heb ik een paraplu nodig vandaag?" als vragen naar het weer, en specifiek, of het gaat regenen. Siri koppelt hierbij een item (de Paraplu) aan een weertype (Regen) aan een tijd (vandaag, nu) en zoekt daarmee het antwoord op de vraag 'heb ik dit item nodig?', voor een mens makkelijk, voor een computer zeer complex.

Bij Android (en alle andere conventionele spraakbesturingen) moet JIJ de commando's (syntax) leren en onthouden, Siri interpreteert wat je zegt en bedoelt, twee totaal verschillende werelden en totaal verschillende technieken.

Interpreteren van taal != commando's met de juiste syntax opvolgen.

Een goed voorbeeld van taalinterpretatie is Wolfram|Alpha, Voorbeeld, je ziet hoe de hoeveelheid data en downloadsnelheid worden gekoppeld aan tijd.

Ik denk dat het niet lang duurt voordat Apple dit 'gat' dicht, bijvoorbeeld door naar de iPhone UUID's te kijken. Het is leuk om te zien hoe het achterliggende protocol in elkaar steekt, ik zou ook wel is willen weten wat Apple nou opslaat van je commando's, en of Siri 'leert' van wat je zegt (zoals Cleverbot).

Toen ik Siri voor het eerst in de Apple keynote zag dacht ik "dat ga je nooit gebruiken, praten tegen je telefoon is stom", nu ik de 4S heb gebruik ik het bijna dagelijks om het weer op te vragen, de wekker te zetten en mijn eerste agendaitem voor morgen te laten zien (rooster). Ik gebruik Siri in die gevallen dan ook alleen thuis, op straat ziet het er alsnog stom uit (maar ook dat zal veranderen als het eenmaal ingeburgerd is) ;)

[Reactie gewijzigd door donny007 op 15 november 2011 10:22]

Blijkbaar vind jij het handig om een hele zin in een vreemde taal uit te spreken. Ik ben meer gemak gewend, gewoon 1 woord in mn eigen taal. Daarbij komt dat Siri werkt bij dit soort bekende voorbeelden, maar in mijn korte test snapte hij het ook vaak niet, wat de eigenaar ook toegaf.
Siri ondersteund ook de 'directe' commando's zoals "Weather" en "call Henk". Siri kent ook familierelaties, die geef je zelf op, als je bijvoorbeeld vraagt "Call my sister" vraagt siri "Who is your sister?", Siri onthoud dit voor de volgende keer.
Siri begrijpt eigenlijk niks, hij parsed je gesproken tekst door het door patroonherkenning te halen.

Dit staat bekend als het Chinese room argument. Linkje: http://plato.stanford.edu/entries/chinese-room/

Ik ben het niet volledig eens met de chinese room argument, maar het haalt een belangerijk punt aan het licht over de manier hoe Siri met data omgaat, Siri heeft geen besef van het "weer" anders dan dat het data is die het op kan halen, en omschreven kan worden met meerdere definities die vooraf "aangeleerd" worden door herhaling.

Als ik tegen Siri zeg, Word het lekker weer vandaag? wordt mijn tekst uit elkaar getrokken, en leest Siri "weer" en "vandaag" dus zoekt Siri het weer van vandaag op en geeft een gefilterd response met "lekker".

Als ik dan zeg "Moet ik een poncho dragen?" weet Siri dat de definitie van poncho omschrijft dat het tegen regen beschermt, en dus komen we weer terug bij keyword "weer" en vult Siri zelf "vandaag" aan omdat er geen parameter opgegeven is voor de tijd.

Patroonherkenning dus, complexer dan we gewend zijn, maar nog steeds geen taal interpretatie.

[Reactie gewijzigd door Blue_Entharion op 15 november 2011 11:39]

Aangezien Siri nog niet in het Nederlands is, en er ook geen ondersteuning is voor Nederland qua plaatsen etc. Denk ik dat dagelijks gebruik momenteel vrij nutteloos is. Het weer opvragen gaat waarschijnlijk ook sneller via een app.
Voorzichtig omgaan dus met je X-Ace-Host header value. Ik denk dat Apple hier een stokje voor gaat steken?

Ik lees overigens niet dat dit zo maar mogelijk is wat in de titel beweerd word. Het certificaat dat bij Apple geÔnstalleerd staat moet dan aangepast worden? Of bedoelen ze hier dat ze een eigen Siri server gaan opzetten?

Edit: inmiddels zie ik dat de Topic titel is aangepast. :)

[Reactie gewijzigd door dacken op 15 november 2011 09:03]

Dit was enkel nodig voor het uitvogelen van het protocol. Omdat de verbinding via SSL wordt opgezet is het normaal niet mogelijk om de gegevens uit te lezen.

Wat ze dus hebben gedaan is een eigen certificaat aanmaken voor het domein wat siri gebruikt, dit importeren in de iPhone, zodat deze het vertrouwd. Vervolgens de DNS omgeleid zodat het naar hun eigen server gaat en de eigen server het verzoek weer laten forwarden naar Apple.

Eigenlijk dus gewoon een MITM attack.
Ik snap alle ophef over die siri niet, het is gewoon weak-ai met een spraakherkenningsfunctie, niks nieuws. als je spraakherkenningssoftware gebruikt kun je hetzelfde resultaat hebben met www.cleverbot.com

Leuke gimmick, zoals altijd bij Apple is het meer hype dan wat anders, over 2 maanden zijn we het weer vergeten.
Ik snap alle ophef over die siri niet, het is gewoon weak-ai met een spraakherkenningsfunctie, niks nieuws. als je spraakherkenningssoftware gebruikt kun je hetzelfde resultaat hebben met www.cleverbot.com
Dan heb je echt geen idee waarover het gaat. Sorry maar mensen die maar zitten te roepen dat het allemaal niets voorstelt of hetzelfde is als een chatterbot of een vergelijking maken met Android herkenning - moeten zich duidelijk eens gaan wat informeren en verdiepen in die zaken.

Zelf diegene achter IRIS hebben het duidelijk niet begrepen want je neemt een ASR engine zoals CMUSphinx en in een namiddag kun je via wat handig gebruik van regex patterns ook een (gebrekkige) demo in elkaar boksen. Maar dergelijke zaken kon zelf al op een prehistorische mac. Dat deden we al op Lernout en Hauspie. Disclaimer: oud L&H developer waarvan de technologie nu bij nuance en waarschijnlijk siri wordt gebruikt.

Het maakt gebruik van een combinatie van bayes, maximum entropy en latent semantic indexing. Allemaal geen nieuwe zaken maar toch vrij uniek (alhoewel ik verwacht dat dit nog zal veranderen in de toekomst want er zullen nu meer mensen op focussen) in die zin dat bijvoorbeeld zoiets als latent semantic indexing iets is wat enorm veel kracht kost (zeker als je een grote set hebt) en ergo denk ik dat daar ook het "cloud" gebeuren deels in zit. Ik geloof dat Google LSI gebruikt voor hun adwords nu.

Het voordeel van zaken zoals LSI is dat het o.a. context aware begint te worden en dat is op zich al een resoluut groot verschil met een chatterbot die bvb eigenlijk enkel maar met een enorme fixed set van zinnen en replies werkt. Er zit daar weinig intelligentie in. Die vergelijking met cleverbot raakt kant noch wal.

Het is jammer dat de "haat" zo vertroebelt dat er zelf geen objectieve kijk meer kan zijn op de technologie achter een product. Ik heb zo het gevoel dat "technologie enthousiasme" de dag van vandaag enkel nog maar een synoniem is voor "wie is vandaag de boeman".

Denk eens na Siri is een afgeleide van een DARPA project waar een honderdtal wetenschappers door de jaren aan is gewerkt. Miljoenen dollars aan is gespendeerd. Denken jullie nu echt werkelijk dat het hier gaat over een simple ASR engine die de tekst dan gaat wat matchen aan patronen van opgestelde zinnetjes zoals een gemiddelde chatterbot ? Eigenlijk moet het toch wel van een enorm veel domheid of arrogantie getuigen dat mensen oordelen van het "stelt allemaal niets voor".

[Reactie gewijzigd door simplicidad op 15 november 2011 11:43]

Je neemt de woorden domheid en arrogantie in de mond, maar volgens mij begrijp je mijn punt niet; De technologie die zo de hemel in geprezen wordt bestaat al jaren, en helaas wordt alleen de technologie met de beste marketingstrategie aan het licht gebracht. Dus prachtige projecten die hetzelfde al deden blijven op de achtergrond (semantic search engines, pattern reckognition, voice reckognition)

Dus mensen die WEL weten waar ze het over hebben, kunnen zeggen dat deze technologiŽn al jaren in handbereik waren, maar nog niet gemarket waren.

Voor het gewone volk dat zich niet verdiept op de materie is dit een openbaring, en als je dat probeert uit te leggen springt de helft van de fanclub in een stuip omdat hun icoon "aangevallen" wordt terwijl men simpelweg uitlegt "Dit is er al langer, kijk hier:".

Beetje jammer.
Dus prachtige projecten die hetzelfde al deden blijven op de achtergrond
En welke prachtige projecten zijn dat dan
En als ze zo prachtig zijn, waarom worden deze dan niet aangeboden als een produkt?
Waarom blijven ze op de achtergrond?

Wellicht is er al zoiets in een onderzoeksproject, maar Apple weet er een produkt van te maken en dit in de markt te zetten...
Doubt it, gebruik het iedere dag. Al was het alleen al voor afspraken in je agenda te zetten.
Het feit dat twee enkelingen het dagelijks gebruiken betekent niet dat de feature over het algemeen uit het zicht verloren gaat omdat de hype voorbij is, dat is met alles zo.

Zo zie ik het in ieder geval.

Offtopic: Siri doet me denken aan de furby, spraakherkenning met reactie, alleen wat geavanceerder :)

[Reactie gewijzigd door Blue_Entharion op 15 november 2011 14:36]

Er zijn heel wat meer mensen die Siri gebruiken, en het werkt fantastisch! Heel wat beter als de standaard bel naam acties
Nou, de revolutie is een feit.

Ik zie mezelf toch niet praten tegen mijn telefoon als er niet iemand aan de andere kant van de lijn hangt. Het is voor mij hetzelfde als die mensen die een ligfiets hebben.
het is toch enkel wachten tot er anderen met hetzelfde soort systeem komen? google is ook al aardig lang bezig met spraakherkenning onder android. en het werkt al vrij goed in google maps bijvoorbeeld.
Windows 7 spraakherkenning is anders ook behoorlijk goed.
Het gaat hier dan ook niet om spraakherkenning, maar om de interpretatie van wat er gezegd wordt. Als jij b.v. zegt, Maak me over een uur wakker, dan zal Siri dit begrijpen. Bij alleen spraakherkenning moet je zeggen: zet alarm 10:23 uur. Jij - de gebruiker - moet de handleiding van de spraakherkenning weten. Siri werkt net andersom: die leert jouw handleiding kennen. Na een tijdje weet Siri bijvoorbeeld het juiste contact te selecteren als je het over je moeder hebt. Uiteraard staat dit nog allemaal in de kinderschoenen, maar eh, laat dit soort systemen maar doorbreken en ik ben zeer benieuwd waar we over 5 jaar staan :9
Helaas, dit werkt alleen als Siri weet wie je moeder in de contact lijst is. Dus dat zal hij moeten vragen en vastleggen. Uiteindelijk doet Siri niks anders dan vragen wat je bedoeld en dit vastleggen zodat je uiteindelijk met het eerste commando de actie kunt starten. Een schil om spraakherkenning dus.
Als hij het niet weet kan je het gewoon via spraak vertellen en onthoud hij het.
Voor Google is er al een soortgelijke app te downloaden: Iris.
iris is een anagram van siri

afwachten of elppa een rechtzaak tegen elgoog begint
als iris hetzelfde zou kunnen of doen, dan kan je over een rechtzaak gaan nadenken (als daar Łberhaupt ruimte voor is).

voorlopig doet iris niks wat siri wel doet.
Soort gelijken systemen hebben alle grote bedrijven recentelijk gekocht.
Amazon heeft er 1 http://www.geeksailor.com...st-apples-siri-assistant/
Ook google bought aardvark (in april already)
daarnaast heeft apple siri niet gemaakt maar is ook een gekocht bedrijf. zijn er alleen het eerste echt mee naar buiten gekomen
Siri
Is een combinatie van speech to text en natural language processing.

Misschien een verrassing voor velen,
http://www.chatbots.org/nl
een lading chatbots die hetzelfde doen. Weliswaar een stuk beperkter, het is dienstverlening, maar het principe is hetzelfde. Apple heeft een concept leuk herverpakt, en goed neergezet,
maar het bestaat al langer.

In mijn optiek is het ook vreemd dat grote bedrijven hier al gretig gebruik van maken, maar dat het voor de consument maar mondjesmaat beschikbaar was.
Apple heeft een concept leuk herverpakt, en goed neergezet, maar het bestaat al langer.
Dat is toch de hele mantra van Apple? Iets nemen wat al bestaat maar zo verschrikkelijk om te gebruiken dat niemand het gebruikt.
Een eigen versie maken welke WEL zo goed werkt dat het WEL gebruikt wordt?

Zij zijn bekend met hu mp3-speler, dan een telefoon, een tablet, nu spraakbesturing.

Ik hoop ook dat eens een tv kan neerzetten, hoef ik mijn ouders van 70 tenminste niet meer uit te leggen hoe ze moet overschakelen naar HDMI2 om tv te kijken....
Het feit dat ze zonder uitleg mijn iPad al kunnen gebruiken...
Dat is toch de hele mantra van Apple? Iets nemen wat al bestaat maar zo verschrikkelijk om te gebruiken dat niemand het gebruikt.
Een eigen versie maken welke WEL zo goed werkt dat het WEL gebruikt wordt?

Zij zijn bekend met hu mp3-speler, dan een telefoon, een tablet, nu spraakbesturing.
Vergeet de muis en de GUI niet ;) Anderzijds waren die oorspronkelijk niet zo verschrikkelijk, maar kon Apple ze makkelijk oppikken omdat Rank Xerox er niet zoveel in zag.
als iris hetzelfde zou kunnen of doen, dan kan je over een rechtzaak gaan nadenken (als daar Łberhaupt ruimte voor is).
Daar is geen ruimte voor, omdat apple technologie van een ander bedrijf gebruikt. Siri is in weze alleen een hele slimme frontend voor dat systeem. De voice2text en text2voice algoritmen zijn niet van apple, echter. (maar van Nuance)
voorlopig doet iris niks wat siri wel doet.
Echt wel (lang niet alles maar iris kan een hoop wat siri ook kan) :) Niet dat ik het ga gebruiken, als het ter was al had ik het nog niet gebruikt tenzij jdat zou inhouden dat ik niet hoef te praten tegen me telefoon maar de app direct hersengolven aftapt :)

[Reactie gewijzigd door watercoolertje op 15 november 2011 09:40]

Ten eerste heeft Google deze app niet gemaakt, maar een aantal onafhankelijke developers. Die hadden zich de challenge gezet om een Siri achtige applicatie te maken binnen 8 uur, wat ze gelukt is. Over de kwaliteit van de eerste versie kunnen we simpel zijn, die was niet super.

Ten tweede zit spraakherkenning al langer in Android dan de release van Siri met IOS 5. Dat is ook de reden dat Iris zo snel in elkaar te flansen was, de solide voice recognition basisfunctionaliteit die Google in Android ingebouwd had.

Ten derde heeft Apple deze technologie ook alleen maar ingekocht door het overnemen van een extern bedrijf (http://scobleizer.com/201...ews-siri-bought-by-apple/). Ze hebben dus zelf niks verzonnen (doen ze wel vaker met "magic" technologie).
Niet om het een of ander maar voor Siri zat er ook al spraakherkenning in iOS.
Anagram is de letters wel wat meer door elkaar husselen dan achterstevoren. Of is elppa een bestaand woord en elgoog. Je had er beter pepla of appel van kunnen maken. Kon van google niet meer maken dan gleg.
Heb je die ook daadwerkelijk geprobeerd? Ik vind dat echt een rampzalig programma. Als ik de demofilmpjes van Siri zie, is dat wel echt een totaal andere beleving.

edit: Heb het hier over gebruikersfilmpjes natuurlijk ;)

[Reactie gewijzigd door MikeyMan op 15 november 2011 09:50]

Demofilmpjes, als in door Apple opgenomen, of door de gebruiker.

Ik moet zeggen dat ik verbaast sta hoe goed spraakherkenning werkt op android.

Maar demofilmpjes van de fabrikant werken altijd goed.
Het is Apple, wat denk je dan? Er worden dan meer gebruikersfilmpjes gemaakt dan welke fabrikant dan ook.
Al dan niet door "professionele" reviewers...

http://obamapacman.com/20...ne-4s-open-pod-bay-doors/

http://www.youtube.com/results?search_query=siri&oq=siri
Zoekresultaten voor siri
Ongeveer 102000 resultaten
Check op 4:17 eens de tekst die hij 'ingesproken' heeft.

Wel iPhone herkennen en mooi met een hoofdletter P, maar dan wel van 4S '4 ass' maken! :+
Leuk om te zien dat Apple Siri ervan gemaakt heeft, wat een lettermengeling hiervan is. :+
Klopt, ik gebruik op Android Speaktoit, werkt echt fantashtisch. En als TTS engine gebruik ik SVOX klinkt veel beter dan de standaard PICO TTS engine.
Wachten? Het was er in diverse vormen al zo'n 10 jaar geleden.
WP leverde een complete set (software en koptelefoon met microfoon) mee met naar mijn mening versie 7.
Nogal oude telefoons konden op uitgesproken naam nummers draaien en ander basisfuncties uitvoeren.
Er is dus niets nieuws onder de zon, hooguit dat de herkenning wat beter is geworden.
Ja, spraakherkenning is er inderdaad allang. 10 jaar geleden ook al eens mee gespeelt maar het stond toen nog in de kinderschoenen.

Het is mij ook niet helemaal duidelijk wat de ophef over siri veroorzaakt maar misschien kan ik het ook niet goed beoordelen(ik heb geen iphone).
Is het slechts een volgende stap in de ontwikkeling die af en toe met horten en stoten gaat of is het een breakthrough?
Ik begrijp wel dat het alleen werkt als er een 3G verbinding is dus dan is het al weer minder. Met de huidige abbo vormen wil je alle nodeloze 3G vermijden
Er is een heel groot verschil tussen spraakherkenning "dial number work" en AI dat natuurlijke tekst kan interpreteren "is it going to snow tomorrow"

http://obamapacman.com/20...ne-4s-open-pod-bay-doors/

[Reactie gewijzigd door kmf op 15 november 2011 09:17]

Het verschil tussen wat er 10 jaar geleden gebruikt werd (voice dialing en/of voice command) is dat je telefoon niet weet wat je zegt, maar herkent dat je iets hebt gezegd dat bij een nummer/commando hoort.

Siri is veel uitgebreider: Het converteert je spraak naar tekst en maakt er een commando van. de conversie gebeurt op een server (cloud-principe) en je telefoon krijgt iets eenvoudigs terug.
Ja, spraakherkenning is er inderdaad allang. 10 jaar geleden ook al eens mee gespeelt maar het stond toen nog in de kinderschoenen.

Het is mij ook niet helemaal duidelijk wat de ophef over siri veroorzaakt maar misschien kan ik het ook niet goed beoordelen(ik heb geen iphone).


Volgens niet de minste is Siri toch wel een goede innovatie.

Apple's Siri is a significant development-a voice-activated means of accessing answers through iPhones that demonstrates the innovations in search.
Google’s Eric Schmidt
http://gizmodo.com/585683...schmidt-is-scared-of-siri

Al de andere spraakherkenning kunnen alleen losse opdrachten snappen:
Call 123-245-555
Text contact xxx

Siri snapt:
Hoe koud wordt het vandaag?
Text my girlfriend.
Remind me to do xxx when i leave work
etc
etc
Dat is toch wel ff iets anders dan woorden zoeken.

Maar terug ontopic:
Goede ontwikkeling.
En ja, tuurlijk mikt Apple op overstappers door Sire.
Ze zijn een hardware bedrijf.
Anders hadden ze niet de harde koppeling tussen software en hardware gedaan.
En sommige Tweakers zijn misschien heel jong, maar toen Apple in de jaren 90 kloons had gelicenceerd, kocht niemand meer Apple's
De eerste iPhone kon ook een 3rd party apps aan en de eerste apps mochten ook geen mail functionaliteit hebben.
Dat is allemaal verandert.
Even geduld kinders, over een jaartje kan je op elke iPod/iPhone heel veel apps aanspreken met Siri.

[Reactie gewijzigd door weeraanmelden op 15 november 2011 09:53]

Pardon, het bestond al voor de Texas Instruments Professional Computer, in 1983!

En het werkte perfect! Ik heb er diverse demo's mee gedaan. 't Was alleen een "beetje duur" - mijn huis destijds was goedkoper dan de PC...
Daar had je dan wel alle software - inclusief developement s/w - voor, maar toch.

Edit: Het heette Speech Command System

[Reactie gewijzigd door The Van op 15 november 2011 15:52]

Er is dus niets nieuws onder de zon, hooguit dat de herkenning wat beter is geworden.
hooguit dat je het kunt vragen zoals je het aan aan mens kunt vragen.
we spreken over een aantal jaren nog, kijken of je er hetzelfde over denkt.

[Reactie gewijzigd door bakman op 15 november 2011 10:04]

Begrijp ik het nu goed en werkt Siri
a) alleen met actieve dataverbinding. En dus niet in het buitenland zonder roaming? Zelfs al is het maar om een afspraak te maken in je eigen agenda?
b) niet op de telefoon, maar op de servers van Apple? Dat zou willen zeggen dat het argument van 'te weinig rekenkracht' voor de iPhone 4 of 3 niet meer op gaat.
Interessant!
Je begrijpt het bijna goed....
De conversie van spraak naar tekst gebeurt op de servers van apple... die data wordt gedetailleerd teruggestuurd.
Die gedetailleerde data wordt wel lokaal verder verwerkt zo lijkt het. En ik kan me ook voorstellen dat daar een aanzienlijk stukje rekenkracht voor nodig is; Een zin analyseren, ontleden en vervolgens een vraag of opdracht daaruit filteren....

Ik weet niet zeker of dat zo is, maar uit het bovenstaande experiment begrijp ik dat alleen de spraak online omgezet wordt naar tekst en verder alles offline gebeurt.
Je hebt dus wel die dataverbinding nodig ja, maar een request is nog geen 100KB dacht ik.
De conversie van spraak naar tekst gebeurt op de servers van apple... die data wordt gedetailleerd teruggestuurd.
Die gedetailleerde data wordt wel lokaal verder verwerkt zo lijkt het. En ik kan me ook voorstellen dat daar een aanzienlijk stukje rekenkracht voor nodig is; Een zin analyseren, ontleden en vervolgens een vraag of opdracht daaruit filteren....
Ergens vind ik dat wel een beetje creepy, al jouw persoonlijke afspraken, gedicteerde mails, communicatie met de buitenwereld wordt geanalyseerd door Apple :/ Vind ik wel jammer dat dit niet lokaal draait eigenlijk, ik kan begrijpen dat je data nodig hebt om wolfram alpha te benaderen, maar om een agenda-afspraakje te maken? :s
Inderdaad. Hoewel de afspraken vervolgens toch (ook) in iCloud worden opgeslagen in mijn geval, waardoor ze dat toch wel doen. En dit is niet uitsluitend een Apple 'probleem'. Wat dacht je van de mails in GMail/GCal of Hotmail? Of het een privacy-issue is? Vast. Is het nieuw? Nee, totaal niet.
het zit 'm in de natural language en het leren van dialect wat meer zal vereisen dan je iphone aan zal kunnen.
Nou ja, bijna. Je moet nog wel "real-time" de spraak comprimeren en ik denk dat daarvoor ook de achtergrondruis eruit gefilterd wordt. Het is namelijk een van de weinige spraak applicaties die het redelijk goed doet in een rumoerige omgeving.
a) correct.
b) kan correct zijn. Gezien de audio compressed word vereist dit wat kracht, aan de andere kant is dit dezelfde compressie die word gebruikt voor VOIP, zou geen probleem moeten zijn.

Apple zal waarschijnlijk device-id's blacklisten om misbruik te voorkomen.
En men zich dan afvragen waarom Apple de juridische honden loslaat? Deze manier van werken riekt enorm naar kopieergedrag.

Ga er maar vanuit dat Apple het gehele proces heeft gepatenteerd, wat applicaties die op dezelfde manier werken nimmer uitgebracht zullen worden...
En men zich dan afvragen waarom Apple de juridische honden loslaat? Deze manier van werken riekt enorm naar kopieergedrag.
Die ontwikkelaars uit het bericht hebben niks met grote bedrijven te maken en dus ook niet met de oorlog tussen bedrijven. Dus dit heeft niks te maken met de 'juridische honden' die Apple los laat op HTC, Samsung of nokia :)
Apple kan het moeilijk patenteren als de technologie van Nuance komt :)

Hetzelfde bedrijf dat indertijd L&H opgekocht heeft (spraaktechnologiebedrijf van West-Vlaanderen) en zowat elk innovatief bedrijf opkoopt in de sector van Spraaktechnologie om geen concurrenten te laten groeien.

Combineer spraaktechnologie met Wolram Alpha en dan heb je Siri (simplistisch gezegd)

See you in an hour

[Reactie gewijzigd door NicoJuicy op 15 november 2011 09:57]

  • Ik vind het apart dat deze Applidium groep eerst VLC uit de iOS App Store haalt omdat deze niet zou voldoen aan de GPL-licentie, maar daarna wel de iOS licentie schendt om deze Siri communicatie te kraken...
  • Lijkt mij dat Apple in de volgende versie van Siri om te beginnen de communicatie met een vast, bekend SSL certificaat gaat beveiligen. Dan is dat alvast een extra drempel.
  • Grappig dat, toen Siri uitkwam meerdere mensen riepen dat Android dit al had, maar nu opeens iedereen probeert om Siri te kraken om er gebruik van te kunnen maken. Blijkbaar doet Siri dus meer dan wat Google in Android heeft gemaakt...
Ik vind het apart dat deze Applidium groep eerst VLC uit de iOS App Store haalt omdat deze niet zou voldoen aan de GPL-licentie, maar daarna wel de iOS licentie schendt om deze Siri communicatie te kraken...
Applidium heeft hun VLC app niet uit de App Store gehaald, dat heeft Apple gedaan na een klacht van de VLC developers.

[Reactie gewijzigd door Dreamvoid op 15 november 2011 09:44]

Je hebt gelijk, het was niet de Applidium groep direct.
Echter, wie had die klacht ingediend?
Rťmi Denis-Courmont, een van de ontwikkelaars van VLC.
Zie http://applidium.com/en/n...led_vlc_off_the_appstore/

Apple is hier niet de boeman, zij hebben slechts gereageerd op een klacht van een de ontwikkelaars die perse kleinzielig wilde doen.

Offtopic:
Ik zie het probleem niet van VLC voor iOS.
VLC voor iOS was gratis, de code was beschikbaar om aan te passen voor iedereen die dit wilde doen. Dat is toch precies wat de GPL wil?
Ja, je moet iOS developer zijn om de applicatie op je iOS device te kunnen draaien.
Maar dat is ook voor andere GPL projecten. Je hebt Windows nodig om een Windows-GPL project te kunnen gebruiken, Linux voor een Linux-GPL project, enzovoort...
De GPL zegt dat er nooit extra restricties bovenop de GPL geplaatst mogen worden mbt de verspreiding van de applicatie. De App Store doet dat wel (de "terms of usage" van Apple namelijk). Geen enkel programma met GPL code mag dus ooit in de App Store staan (ook niet in Microsoft's app store, trouwens). Minder restrictieve licensies als de BSD, Mozilla en Apache license staan dit wel toe.

[Reactie gewijzigd door Dreamvoid op 15 november 2011 18:57]

Ze hadden toch ook al Siri geport naar de iPhone 4 en 3Gs?
Klopt, maar dat was alleen zorgen dat de App die Apple levert voor de iPhone 4S ook draait op de 4 en 3GS na een aantal minimale aanpassingen, daarvoor heb je geen kennis van het Siri protocol nodig.

Dit nieuwsbericht heeft het over het helemaal zelf in elkaar zetten van een app die hetzelfde werkt als Siri, men heeft het protocol dat Siri gebruikt namelijk ge-reverse-engineerd.
Klopt, maar dat was alleen zorgen dat de App die Apple levert voor de iPhone 4S ook draait op de 4 en 3GS na een aantal minimale aanpassingen, daarvoor heb je geen kennis van het Siri protocol nodig.
Wat ReTechNL misschien meer bedoeld,
De 4 & 3S hebben ook geen geldige 4S-identifier. waardoor het er meer op gelijkt dat er momenteel een geldig (Apple)-ID nodig is.
En volgens deze ontwikkelaars/hackers is er enkel communicatie mogelijk met een geldig 4S-ID.

Apple kan hier op hun servers natuurlijk nog een extra lock/check voor inbouwen.
Bij die port was bewezen dat er geen hardwarematige beperking was om siri op de oude toestellen te draaien. Wel was toen duidelijk geworden dat je geen response van de server kreeg, omdat er geen correcte ID meegestuurd kan worden.

Dus wel een 4S-dD
Blijf het knap vinden hoe mensen Siri weten te degraderen omdat het van "Apple" is. Vergelijken van Siri met de oude spraakherkenning welke in veel telefoons zit, is een auto en een fiets met elkaar vergelijken.
Ik denk dat dit het begin van iets nieuws is, en ongetwijfeld zullen andere fabrikanten volgen.
Nu zit het in een telefoon, straks in veel meer apparaten. We kennen allemaal de films waarin iemand wat zegt en vervolgens lichten aan gaan, nieuwe berichten worden voorgelezen etc.
Met iets als Siri komt dat wel heel dichtbij. Ik ben er aardig enthousiast over, het is vele malen beter dan de oude technieken en over een aantal jaar weten we niet beter dan dat het er gewoon bij hoort.

Op jailbreaks etc. hoeft men denk ik niet te rekenen. Apple zal alles doen om dit te blokkeren, wat natuurlijk begrijpelijk is.
Vraag me af hoe het draait op zo' n "oudere" iPhone en was de kwaliteit van de microfoon ook niet een probleem, om het op deze modellen zo goed te laten werken als op de 4S?
Ik blijf het knap vinden dat mensen denken dat dit revolutionair is, terwijl het gewoon nog een praktische toepassing is van iets wat er al lang is.

Apple weet wel 1 ding mooi te doen: Een hype creŽren, en zoals je al zegt zullen veel fabrikanten volgen, want waar een hype is, is geld te halen. En daar is Apple de onverslagen kampioen in.

Wat jouw toekomstvisie betreft; Er zijn al veel knappe koppen bezig met domotica, en het is een groeiend fenomeen, helaas zit er niet zo'n grote drijfveer achter als bij Apple's multimiljardenbedrijf en trouwe fanbase, dus het gaat helaas allemaal niet zo hard.

Het is misschien een kleine glimp van wat de toekomst gaat bieden, en zeker interessant, maar je moet er niet meer van maken dan het is.
Er was inderdaad al lang spraaktechnologie.

Maar hier spreken we over spraaktechnologie met een beginende vorm van AI!
Je moet zoals eerder gezegd niet meer vaste commando's geven aangezien siri in staat is contexten te begrijpen. Hierdoor kunnen er meer natuurlijke gesprekken gevoerd worden.

Ik heb al verschillende spraaktechnologieŽn uitgeprobeerd, maar siri gaf me een heel ander gevoel en is een geval appart.

Ik hoef geen vaste commando's te geven, ik kan zowel vragen welke temperatuur het is, of het gaat regenen, of het gaat sneeuwen, naar het weer vragen of zelfs vragen of ik een trui of paraplu nodig heb. Ze interpreteert het allemaal juist en geeft vervolgens een gepast antwoord. Net hetzelfde voor je agenda te checken, alarm te zetten,...

Maar ook de humor die op geniale wijze ingebouwd is weet te verrassen (kijk bijvoorbeeld maar eens op http://shitthatsirisays.tumblr.com/)

Dus geen apples (sorry flauw :p) met peren vergelijken... ;)
Dat is het probleem nou net...

Het is geen echte "AI", en ik kan het weten, ik ben zelf ook met ECHTE AI projecten bezig, en Siri is een (geavanceerde) weak-AI (valt onder categorie chatbot).

En ik spreek niet tegen dat Siri heel handig kan zijn, en goed werkt, grappig is en al dat goeie poeier, maar het is simpelweg niet zo geavanceerd als iedereen wil doen beweren.

Strong-AI (echte intelligentie) is in ieder geval niet te onderscheiden van mens, de Turing test is een alombekend voorbeeld van een meting daarvan. Hoewel deze meting niet perfect is word deze nog wel als geldig beschouwd.

Siri heeft geen diep besef van wat het zegt, heeft geen emotie, geen verlangens of honger naar kennis, het is een geavanceerd programma... maar nog steeds een programma.

[Reactie gewijzigd door Blue_Entharion op 15 november 2011 14:35]

AI bestond al toen ze bezig waren met LOTR, daar is een mooi voorbeeldje...
Bij het renderen van grote battle's met CGI-characters bleek tijdens het bekijken van de beelden dat de computer enkele commando's had gecombineerd, dat zorgde ervoor dat sommige characters bang wegliepen van het slagveld, dit terwijl dit niet gepland was.

Siri heeft gelukkig niet deze AI eigenschappen, want anders zou je telefoon een eigen wil krijgen. Het gaat hier wel om het begrijpen van een context en een boodschap en vervolgens hierop goed reageren in tegenstelling tot de oude spraaktechnologie met vaste comando's.
Volgens zegt de heer Blue_Entharion niet veel anders, maar wat hij meent te zeggen is dat Siri niet echt de context begrijpt, maar doet alsof door bepaalde onbekende parameters in het systeem een betekenis te geven.

De volgende keer als jij hetzelfde zegt, wat voorheen een onbekende parameter, dan snapt Siri dat. Alleen dit zegt niet dat het systeem de context weet te snappen, wat immers is context het geheel, waaruit iets zijn betekenis krijgt.

Als Siri dat zou begrijpen, dan kan hetgeen geen problemen krijgen met gezegdes en spreekwoorden. Of het sarcasme in zinnen. Maar goed, ik denk dat niemand sarcastische opmerkingen maakt of vragen tegenover zijn mobiel, dus dat is het geval niet, maar iig is wel duidelijk dat siri niet de context begrijpt als men dat doet beweren. Feitelijk is Siri een dom mens, die alleen onthoudt wat men zegt en definieert,maar weet zelf niet in context te brengen in lastige situaties waar de omgeving of emotie in spraak ook een rol speelt.

Ik denk dat Blue Entharion dat duidelijk wilt maken dat men hier niet kan spreken over begrijpen van context.
LOL onze 'professor' gaat nu vertellen dat strong-AI niet te onderscheiden is van een mens? Dus als wij deze logica volgen bestaat er geen enkele game die een AI bezit? Zijn allemaal "chat botjes"? lol echt lachen met jou.

*even vragen aan Siri zelf hoe het met haar AI zit*
Dat was mijn eerste reactie ook toen ik voor het eerst over deze voice assistant hoorde. Welke gek gaat er nu tegen zijnj telefoon praten?Het label "forever alone" plakte ik daar dan niet an vast maar goed.

Maar toen ik het zelf eens in de praktijk gebruikt had wist ik wel beter. Wat dat betreft helpt Siri je zelfs als je je "alleen voelt. Zij spoort je vriendin, vriend op en geeft je een route hoe je er op de snelste manier naartoe kan gaan. of stuurt een message met de vraag hoe laat ze vanavond van bil zou wlllen gaan met je.

Geloof me, je kan je amper voorstellen wat de mogelijkheden allemaal met Siri zijn.
OMG weer zo iemand die gaat dat beweren dat dit 'allang bestaat'. Zucht.

Ga het eerst eens zelf uitproberen voordat je met je anti Apple proza aankomt.

Alles met wat APPLE op de proppen komt "bestaat allang" maar alleen niet zo goed. touchscreens bestonden voor 2007 ook al voordat Apple met de eerste iPhone op de markt kwam. Wel eens van evolutie gehoord?
Ga het zelf eens uitproberen knul. Welke telefoon had voor deze Siri technolgie in de iPhone al en voice assistent met A.I.? Vertel het me eens.
De specifieke Siri technologie is copyrighted en gepatenteerd sinds 2010, ontwikkeld door een derde partij genaamd SRI International en opgekocht door Apple, en zou origineel voor meerdere platforms ontwikkeld worden.

Dus eigenlijk geen, Apple heeft het bedrijf opgekocht om monopolie te creŽren :)

Niet boos worden, zo werkt dat in zakenland, bedrijf A maakt iets, bedrijf B koopt bedrijf A op en bedrijf B gaat met de patenten lopen.

De technologie achter Siri bestaat al langer, al dan niet op een telefoon (dus niet 100% identiek), we hebben het dan over chatbots met semantic searching, voice reckognition software en pattern reckognition software.
Probleem met een 3GS iphone (speaker) idd maar op iPhone 4 werkt Siri meer dan prima.

Wat ik ook opmerkelijk vind trouwens, is dat Siri je in een drukke Mac Donalds (met allemaal gillende kinderen op de achtergrond in de ballenbak) je stem nog feilloos kan onderscheiden van het geschreeuw en alles zonder fouten verstaat. En mijn Engels uitspraak is ook niet van uitzonderlijk hoog niveau btw.

[Reactie gewijzigd door benito100 op 15 november 2011 14:20]

Leuk, maar dus niet nuttig voor Iphone 4, 3s of android gebruikers.
Wel jammer, want voor wat ik gezien heb werkt dat Siri wel erg netjes.

Op dit item kan niet meer gereageerd worden.



LG G4 Battlefield Hardline Samsung Galaxy S6 Edge Microsoft Windows 10 Samsung Galaxy S6 HTC One (M9) Grand Theft Auto V Apple iPad Air 2

© 1998 - 2015 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True