Bayestheorie toegepast in softwaredesign

De waarschijnlijkheidstheorie van Bayes, ruim tweehonderd jaar oud, is nu herontdekt en gebruikt in de ontwikkeling van software van onder andere Microsoft en Google. Thomas Bayes, een achttiende-eeuwse wetenschapper, stelde zijn theorie als volgt: de kans dat iets gebeurt, kan goed geschat worden met het gebruik van gegevens uit het verleden. Google gebruikt de theorie om databases sneller te doorzoeken. Hoe vaker de gevonden pagina in het verleden de juiste was, hoe groter de kans dat deze het nu weer is.

Ook kunstmatige intelligentie is al enkele jaren afgestapt van zijn logische grondlegging, om over te gaan naar de Bayestheorie. Er is niets zo moeilijk logisch te verklaren als gedrag, en deze theorie is een van de weinigen die het toeval erkent en toepast in zijn waarschijnlijkheidsprincipe. Microsoft gebruikt deze theorie in zijn Notification Platform. Op basis van ervaring leert een apparaat met deze software om berichten door te sturen, vergaderingen te plannen of een mailbox te filteren:

Probabilistic techniques are already embedded in Microsoft's products. Outlook Mobile Manager, which determines when to send a deskbound e-mail to a mobile device, grew out of Priorities, an experimental system unveiled at Microsoft in 1998. The troubleshooting engine in Windows XP also relies on probabilistic calculations.

[...] An application named Coordinate, a major element of the Notification Platform, gathers data from personal calendars, keyboards, sensor cameras and other sources to create a mosaic of a person's life and habits. The data gathered can include arrival schedules, typical time and length of lunches, what types of phone and e-mail messages are kept or discarded, how frequently the keyboard is in use at given times of the day, and so on.

Vorig nieuwsartikel Volgend nieuwsartikel

Door Tamara van Hal

Nieuwsposter

Feedback • 19-02-2003 09:02
38 • submitter: heladepela

19-02-2003 • 09:02

Submitter: heladepela

Bron: C|Net

Lees meer

SNARF bezorgt e-mail op sociale manier Nieuws van 3 december 2005

'AI-software kan rechtspraak helpen' Nieuws van 13 september 2005

Onderzoekers maken kunstmatige intelligentie slimmer Nieuws van 16 december 2001

IBM komt met zelfdenkende helpdesk-software Nieuws van 14 juli 2001

Terugblik op de afgelopen jaren wat betreft AI Nieuws van 14 december 2000

Meer producten en artikelen

Software

Reacties (38)

-Moderatie-faq

Wijzig sortering

Verwijderd 19 februari 2003 09:21

Nadeel is wel dat oudere pagina's dan een voorsprong hebben. Want die zijn (soms bij gebrek aan beter) tot dan toe de meest bezochte pagina's over een bepaald onderwerp. Nieuwe pagina's met betere informatie hebben dus minder kans met dit systeem. Het zou verstandig zijn als Google nieuwere pagina's over een onderwerp 'at random' ook eens bovenaan zet om ze een kans te geven. Maar misschien doen ze dat ook wel, want het zijn slimme gasten daar bij Google.

Neelix 19 februari 2003 09:24

Ook kunstmatige intelligentie is al enkele jaren afgestapt van zijn logische grondlegging, om over te gaan naar de Bayestheorie.

Dat lijkt me toch niet.
De Bayestheorie heeft veel aanhang onder de kunstmatige intelligentie experts, maar er zijn ook zat andere theorien voor.
Plus dat er ook nog een hele zooi mensen zijn die het logische fundament nog wel volhouden.

(Ik wil hier niet een hele discussie over houden, maar ik wil het punt wat nuanceren...)

Mick @Neelix • 19 februari 2003 16:23

Plus dat er ook nog een hele zooi mensen zijn die het logische fundament nog wel volhouden.

Dat is altijd zo bij een paradigma-verandering: the old guys have to die out first..

Maar logica en waarschijnlijkheidstheorie sluiten elkaar IMHO niet zo sterk uit als het stukje suggereert. Je ziet in AI veel dat men probeert logische theorieën probabilistisch te generaliseren (de logica is dus inderdaad het `fundament'). Puur logische formalismes om redeneren/beslissen te simuleren hebben vaak een enorme computationele complexiteit, oa. omdat die formalismes inductief moeten zijn - en `logisch gezien' kan dat niet; pure logica's zijn puur deductief.
[versimpeling]
Een logisch beslissingsmodel moet voor iedere geobserveerde situatie een nieuwe mogelijkheid postuleren - een logisch-probabilistisch model ook, maar die houdt ook bij hoevaak wat wordt gezien, terwijl een puur logische aanpak ze allemaal op een hoop moet gooien (speciaal geval - alles even waarschijnlijk). Dan heb je vrij ingewikkelde kunstgrepen nodig om nog enigzins een beslissing te kunnen nemen als er meerder acties mogelijk zijn gegeven een bepaalde situatie - terwijl je met een probabilistische aanpak `simply' de actie met de hoogste waarschijnlijkheid kan uitvoeren.
[/versimpeling]

Verwijderd 19 februari 2003 09:48

Eenmaal in een systeem geintroduceerde fouten zijn er moeilijk uit te krijgen wanneer het systeem het Bayes theorem gebruikt. Dat is dan wel weer een nadeel.

Major 7 19 februari 2003 10:09

In het artikel staat ondermeer:

said Eric Horvitz, senior researcher and group manager of the Adaptive Systems & Interaction Group at Microsoft Research. "I personally believe that probability is at the foundation of any intelligence in an uncertain world where you can't know everything."

Dat vind ik nu dus precies niet: een keus maken op basis van waarschijnlijkheid is niet perse intelligent, het is eerder dom: een computer kan het ook.
Intelligentie is in staat om op basis van ' feeling ' etc. een keus te kunnen maken, ook al is die niet de meest waarschijnlijke. Daar heb je dan nog steeds niet alle informatie voor nodig.
En verder: Ik kan me voorstellen dat dit voor bepaalde toepassingen nuttig gebruikt kan worden, maar nogmaals, als het de plaats van echte intelligentie over gaat nemen, hoop ik niet dat mee te moeten maken. "Een computerprogramma dat mijn agenda gaat invullen" maak het nou een beetje

General_Failure @Major 7 • 19 februari 2003 11:05

Dat is nu juist een toepassing van Bayesiaanse analyse. Je kunt van te voren een inschatting maken hoe jij denkt dat de werkelijkheid in elkaar zit. Dan voeg je daar de data uit het verleden bij (de 'likelihood') en daarmee wordt een inschatting van de toekomst gemaakt.

Het artikel kan ik nauwelijks nog serieus nemen, want er staat in het kader een formule, waarvan iedereen met een paar jaar wiskunde kan zien dat het absolute onzin is.De juiste formule is P(Truth|Data) = P(Truth) * P(Data|Truth) / P(Data). Ik heb sowieso het idee dat het artikel een klok en klepel probleempje heeft.

Verwijderd @General_Failure • 19 februari 2003 12:07

Je kunt van te voren een inschatting maken hoe jij denkt dat de werkelijkheid in elkaar zit.

En dat is nu juist het grote probleem wat veel mensen met de theorie hebben. Doordat je de eigen verwachting in de begin veronderstellingen stop beinvloed je (enigzins) de uitkomsten.

Om dat op te lossen werk je met een non-informative prior, oftewel je neemt gewoon helemaal niets aan, je doet alsof je van niets weet en al de resultaten volgen uit de data.

Op deze wijze kunnen ook resultaten uit de klassieke statistiek gereproduceerd worden, waarbij alleen de interpretatie anders blijft.

EfBe 19 februari 2003 09:09

de kans dat iets gebeurt, kan goed geschat worden met het gebruik van gegevens uit het verleden.

Ik kan me niet aan de indruk onttrekken dat ze op het Damrak daar heel anders over denken

PowerFlower @EfBe • 19 februari 2003 09:55

Binnenkort staat er op de zoekpagina van Google dan ook "In het verleden behaalde resultaten bieden geen garantie voor de toekomst"

GiLuX 19 februari 2003 09:25

hmmm, ik weet niet wat mr spock hier van moet denken.

maar goed,
het betekend wel allemaal dat je het voordeel van de machine als feilloos apparaat kwijt bent.
een computer gaat dus overwegingen maken die niet op ratio berusten maar op kans.
dat betekend dat een computer dus fouten gaat maken.
volgens mij hebben we al 6 miljard van dat soort schepsels rond lopen.

wat is nu de winst?

ATS @GiLuX • 19 februari 2003 09:53

Misschien dat die machine sneller meer fouten kan maken?

TeeDee @GiLuX • 19 februari 2003 11:17

Is dat nu niet de (bijna) bedoeling van AI?
"Zelfdenkende" Machines.

Ja, die maken wel eens fouten. De mens toch ook?(zeg jezelf ook al). Ik bedoel, niemand is perfect, waarom een machine wel dan. Een machine is een dom ding, wij maken het intelligent, dan moeten wij niet verwachten dat het perfect functioneert.

Verder, het zal niet een simpel iets zijn, dus ik verwacht ook niet dat het zo zal zijn dat ie simpel op kansberekening iets doet waardoor het een fout zal maken. Als je zoiets kan programmeren, dan kan je ook wel iets programmeren die de kansberekening checkt.

voodooless @GiLuX • 19 februari 2003 11:20

Een mens is net een ezel, stoot zich 3 keer aan de zelfde steen (sommigen nog vaker

), een computer leert echter uit zijn fouten en zal het de volgende keer gewoon goed doen. Natuurlijk moet je zulke systemen geen beslissing over leven en dood laten maken....

Verwijderd @GiLuX • 19 februari 2003 13:13

Perfect is de vijand van goed.

Verwijderd 19 februari 2003 09:08

Maar hoe weet Google dan dat ie de juiste pagina geeft? Je hebt wel een rating systeem, maar ik heb daar iig nog nooit een pagina mee gequoteerd. Kan me niet voorstellen dat veel mensen dat doen. En toch is die machine retegoed.

Verwijderd @Verwijderd • 19 februari 2003 10:23

google kan wel registreren als je dat terug of back knop gebruikt. Dan vraag je immers vanop dezelfde IP meerdere malen binnen een zeer korte tijdspanne de pagina met resultaten op. Dan neemt google dus aan dat de bezochte pagina niet relevant was. Ga je na 10 min pas terug naar google kan er worden aangenomen dat de pagina iets bevatte wat intressant was.

sab @Verwijderd • 19 februari 2003 15:09

Oh, gebruikt jouw browser geen cache als je je Back knop gebruikt dan?

Verwijderd @sab • 19 februari 2003 15:23

Je browser gebruikt zijn cache alleen op aangeven van de server hoor.

Je browser geeft aan welke versie hij van het documnet lokaal in de cache heb en de server zal antwoorden met een HTTP 304 ofdat het desbetreffende item uit de cache gebruikt mag worden of niet.

Dus er is ten alle tijden Communicatie tussen de WebServer en jouw browsertje.

Robo @sab • 19 februari 2003 17:09

De back knop van mijn browser (Opera) haalt zijn pagina dan echt wel uit de cache. Dit in tegen stelling tot MS IExplorer. Alleen als je op een link klikt die in de cache staat zal Opera met de server verifieren of de cache nog up to date is.

Overigens gebruik ik in Opera niet eens de back button, maar de rechter-linker muisknop combo om terug te gaan

musiman

19 februari 2003 09:06

Werkte de startknop ook al niet een beetje op die manier? Veel gebruikte opties wel weer laten geven en weinig gebruikte niet?

Verwijderd @musiman • 19 februari 2003 09:07

Dat werkt met een simpel tellertje wat bijhoudt hoe vaak elk programma is gestart...

Verwijderd @Verwijderd • 19 februari 2003 09:33

Dat is nu precies de theorie. Je pc blijft oerdom. Maar door te tellen kan een pc wel het doen en het laten van de mens analyseren. Hoewel ik zeer gekant bent tegen het "luna" gedoe is het soms wel handig.

Q-collective

19 februari 2003 09:08

Zo gaat het natuurlijk wel goed met de informatica!

Maarre, was dit niet al lang oud nieuws?
Ik dacht dat dit al járen zo toegepast door oa Google...

bartvb

@Q-collective • 19 februari 2003 09:48

Lijkt meer op een advertorial van MS

BTW de spamfilter van Mozilla Mail maakt ook gebruik van Bayes theorem.

roelio 19 februari 2003 11:02

Hmm, krijgen we dan eindelijk een browser die voorspelt welke internetpagina je na deze gaat bekijken, en die vast preload terwijl je de huidige pagina aan het lezen bent? Lijkt me verdomd handig

General_Failure @roelio • 19 februari 2003 11:25

Die is er al: Opera 7. Als die een next-link ziet kun je op de forwardknop drukken om daar automatisch heen te gaan, bijv. in Google werkt dat best handig. In de toekomst zal dat inderdaad alleen maar toenemen en daar is Bayes denk ik zeer geschikt voor.

Op dit item kan niet meer gereageerd worden.

Lees meer

Reacties (38)

Sorteer op:

Weergave: