Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 38 reacties
Bron: C|Net, submitter: heladepela

De waarschijnlijkheidstheorie van Bayes, ruim tweehonderd jaar oud, is nu herontdekt en gebruikt in de ontwikkeling van software van onder andere Microsoft en Google. Thomas Bayes, een achttiende-eeuwse wetenschapper, stelde zijn theorie als volgt: de kans dat iets gebeurt, kan goed geschat worden met het gebruik van gegevens uit het verleden. Google gebruikt de theorie om databases sneller te doorzoeken. Hoe vaker de gevonden pagina in het verleden de juiste was, hoe groter de kans dat deze het nu weer is.

Ook kunstmatige intelligentie is al enkele jaren afgestapt van zijn logische grondlegging, om over te gaan naar de Bayestheorie. Er is niets zo moeilijk logisch te verklaren als gedrag, en deze theorie is een van de weinigen die het toeval erkent en toepast in zijn waarschijnlijkheidsprincipe. Microsoft gebruikt deze theorie in zijn Notification Platform. Op basis van ervaring leert een apparaat met deze software om berichten door te sturen, vergaderingen te plannen of een mailbox te filteren:

Bayer Probabilistic techniques are already embedded in Microsoft's products. Outlook Mobile Manager, which determines when to send a deskbound e-mail to a mobile device, grew out of Priorities, an experimental system unveiled at Microsoft in 1998. The troubleshooting engine in Windows XP also relies on probabilistic calculations.

[...] An application named Coordinate, a major element of the Notification Platform, gathers data from personal calendars, keyboards, sensor cameras and other sources to create a mosaic of a person's life and habits. The data gathered can include arrival schedules, typical time and length of lunches, what types of phone and e-mail messages are kept or discarded, how frequently the keyboard is in use at given times of the day, and so on.
Moderatie-faq Wijzig weergave

Reacties (38)

Nadeel is wel dat oudere pagina's dan een voorsprong hebben. Want die zijn (soms bij gebrek aan beter) tot dan toe de meest bezochte pagina's over een bepaald onderwerp. Nieuwe pagina's met betere informatie hebben dus minder kans met dit systeem. Het zou verstandig zijn als Google nieuwere pagina's over een onderwerp 'at random' ook eens bovenaan zet om ze een kans te geven. Maar misschien doen ze dat ook wel, want het zijn slimme gasten daar bij Google.
Ook kunstmatige intelligentie is al enkele jaren afgestapt van zijn logische grondlegging, om over te gaan naar de Bayestheorie.
Dat lijkt me toch niet.
De Bayestheorie heeft veel aanhang onder de kunstmatige intelligentie experts, maar er zijn ook zat andere theorien voor.
Plus dat er ook nog een hele zooi mensen zijn die het logische fundament nog wel volhouden.

(Ik wil hier niet een hele discussie over houden, maar ik wil het punt wat nuanceren...)
Plus dat er ook nog een hele zooi mensen zijn die het logische fundament nog wel volhouden.
Dat is altijd zo bij een paradigma-verandering: the old guys have to die out first.. ;)

Maar logica en waarschijnlijkheidstheorie sluiten elkaar IMHO niet zo sterk uit als het stukje suggereert. Je ziet in AI veel dat men probeert logische theorieŽn probabilistisch te generaliseren (de logica is dus inderdaad het `fundament'). Puur logische formalismes om redeneren/beslissen te simuleren hebben vaak een enorme computationele complexiteit, oa. omdat die formalismes inductief moeten zijn - en `logisch gezien' kan dat niet; pure logica's zijn puur deductief.
[versimpeling]
Een logisch beslissingsmodel moet voor iedere geobserveerde situatie een nieuwe mogelijkheid postuleren - een logisch-probabilistisch model ook, maar die houdt ook bij hoevaak wat wordt gezien, terwijl een puur logische aanpak ze allemaal op een hoop moet gooien (speciaal geval - alles even waarschijnlijk). Dan heb je vrij ingewikkelde kunstgrepen nodig om nog enigzins een beslissing te kunnen nemen als er meerder acties mogelijk zijn gegeven een bepaalde situatie - terwijl je met een probabilistische aanpak `simply' de actie met de hoogste waarschijnlijkheid kan uitvoeren.
[/versimpeling]
Eenmaal in een systeem geintroduceerde fouten zijn er moeilijk uit te krijgen wanneer het systeem het Bayes theorem gebruikt. Dat is dan wel weer een nadeel.
In het artikel staat ondermeer:
said Eric Horvitz, senior researcher and group manager of the Adaptive Systems & Interaction Group at Microsoft Research. "I personally believe that probability is at the foundation of any intelligence in an uncertain world where you can't know everything."
Dat vind ik nu dus precies niet: een keus maken op basis van waarschijnlijkheid is niet perse intelligent, het is eerder dom: een computer kan het ook.
Intelligentie is in staat om op basis van ' feeling ' etc. een keus te kunnen maken, ook al is die niet de meest waarschijnlijke. Daar heb je dan nog steeds niet alle informatie voor nodig.
En verder: Ik kan me voorstellen dat dit voor bepaalde toepassingen nuttig gebruikt kan worden, maar nogmaals, als het de plaats van echte intelligentie over gaat nemen, hoop ik niet dat mee te moeten maken. "Een computerprogramma dat mijn agenda gaat invullen" maak het nou een beetje }:O
Dat is nu juist een toepassing van Bayesiaanse analyse. Je kunt van te voren een inschatting maken hoe jij denkt dat de werkelijkheid in elkaar zit. Dan voeg je daar de data uit het verleden bij (de 'likelihood') en daarmee wordt een inschatting van de toekomst gemaakt.

Het artikel kan ik nauwelijks nog serieus nemen, want er staat in het kader een formule, waarvan iedereen met een paar jaar wiskunde kan zien dat het absolute onzin is.De juiste formule is P(Truth|Data) = P(Truth) * P(Data|Truth) / P(Data). Ik heb sowieso het idee dat het artikel een klok en klepel probleempje heeft.
Je kunt van te voren een inschatting maken hoe jij denkt dat de werkelijkheid in elkaar zit.
En dat is nu juist het grote probleem wat veel mensen met de theorie hebben. Doordat je de eigen verwachting in de begin veronderstellingen stop beinvloed je (enigzins) de uitkomsten.

Om dat op te lossen werk je met een non-informative prior, oftewel je neemt gewoon helemaal niets aan, je doet alsof je van niets weet en al de resultaten volgen uit de data.

Op deze wijze kunnen ook resultaten uit de klassieke statistiek gereproduceerd worden, waarbij alleen de interpretatie anders blijft.
de kans dat iets gebeurt, kan goed geschat worden met het gebruik van gegevens uit het verleden.
Ik kan me niet aan de indruk onttrekken dat ze op het Damrak daar heel anders over denken :D
Binnenkort staat er op de zoekpagina van Google dan ook "In het verleden behaalde resultaten bieden geen garantie voor de toekomst" ;)
hmmm, ik weet niet wat mr spock hier van moet denken.

maar goed,
het betekend wel allemaal dat je het voordeel van de machine als feilloos apparaat kwijt bent.
een computer gaat dus overwegingen maken die niet op ratio berusten maar op kans.
dat betekend dat een computer dus fouten gaat maken.
volgens mij hebben we al 6 miljard van dat soort schepsels rond lopen.

wat is nu de winst?
Misschien dat die machine sneller meer fouten kan maken? :? :D
Is dat nu niet de (bijna) bedoeling van AI?
"Zelfdenkende" Machines.

Ja, die maken wel eens fouten. De mens toch ook?(zeg jezelf ook al). Ik bedoel, niemand is perfect, waarom een machine wel dan. Een machine is een dom ding, wij maken het intelligent, dan moeten wij niet verwachten dat het perfect functioneert.

Verder, het zal niet een simpel iets zijn, dus ik verwacht ook niet dat het zo zal zijn dat ie simpel op kansberekening iets doet waardoor het een fout zal maken. Als je zoiets kan programmeren, dan kan je ook wel iets programmeren die de kansberekening checkt.
Een mens is net een ezel, stoot zich 3 keer aan de zelfde steen (sommigen nog vaker ;)), een computer leert echter uit zijn fouten en zal het de volgende keer gewoon goed doen. Natuurlijk moet je zulke systemen geen beslissing over leven en dood laten maken....
Perfect is de vijand van goed.
Maar hoe weet Google dan dat ie de juiste pagina geeft? Je hebt wel een rating systeem, maar ik heb daar iig nog nooit een pagina mee gequoteerd. Kan me niet voorstellen dat veel mensen dat doen. En toch is die machine retegoed.
google kan wel registreren als je dat terug of back knop gebruikt. Dan vraag je immers vanop dezelfde IP meerdere malen binnen een zeer korte tijdspanne de pagina met resultaten op. Dan neemt google dus aan dat de bezochte pagina niet relevant was. Ga je na 10 min pas terug naar google kan er worden aangenomen dat de pagina iets bevatte wat intressant was.
Oh, gebruikt jouw browser geen cache als je je Back knop gebruikt dan?
Je browser gebruikt zijn cache alleen op aangeven van de server hoor.

Je browser geeft aan welke versie hij van het documnet lokaal in de cache heb en de server zal antwoorden met een HTTP 304 ofdat het desbetreffende item uit de cache gebruikt mag worden of niet.

Dus er is ten alle tijden Communicatie tussen de WebServer en jouw browsertje.
De back knop van mijn browser (Opera) haalt zijn pagina dan echt wel uit de cache. Dit in tegen stelling tot MS IExplorer. Alleen als je op een link klikt die in de cache staat zal Opera met de server verifieren of de cache nog up to date is.

Overigens gebruik ik in Opera niet eens de back button, maar de rechter-linker muisknop combo om terug te gaan ;)
Werkte de startknop ook al niet een beetje op die manier? Veel gebruikte opties wel weer laten geven en weinig gebruikte niet?
Dat werkt met een simpel tellertje wat bijhoudt hoe vaak elk programma is gestart...
Dat is nu precies de theorie. Je pc blijft oerdom. Maar door te tellen kan een pc wel het doen en het laten van de mens analyseren. Hoewel ik zeer gekant bent tegen het "luna" gedoe is het soms wel handig.
Zo gaat het natuurlijk wel goed met de informatica! ;)
Maarre, was dit niet al lang oud nieuws?
Ik dacht dat dit al jŠren zo toegepast door oa Google... :?
Lijkt meer op een advertorial van MS ;)

BTW de spamfilter van Mozilla Mail maakt ook gebruik van Bayes theorem.
Hmm, krijgen we dan eindelijk een browser die voorspelt welke internetpagina je na deze gaat bekijken, en die vast preload terwijl je de huidige pagina aan het lezen bent? Lijkt me verdomd handig :)
Die is er al: Opera 7. Als die een next-link ziet kun je op de forwardknop drukken om daar automatisch heen te gaan, bijv. in Google werkt dat best handig. In de toekomst zal dat inderdaad alleen maar toenemen en daar is Bayes denk ik zeer geschikt voor.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True