De chatbot Eugene Goostman heeft naar verluidt de Turing-test doorstaan. Dat meldt University of Reading, waar de test afgelopen weekend werd gehouden. Volgens de universiteit wist de bot een derde van de participanten ervan te overtuigen met een mens van doen te hebben.
De Turing-test komt uit de jaren vijftig en is vernoemd naar de Britse informaticus Alan Turing. Die stelde dat een machine menselijke intelligentie toont als hij tijdens een experiment dertig procent van de deelnemers ervan kan overtuigen dat hij een mens is.
In Londen hield de University of Reading onder toezicht van het Europees consortium RoboLaw een wedstrijd, waarbij wetenschappers verschillende chatbots aan de Turing-test onderwierpen. Behalve Eugene Goostman deden daar ook vier andere bots aan mee, waaronder Cleverbot en Albot.
Volgens de University of Reading wist Eugene Goostman tijdens de wedstrijd, Turing 2014, 33 procent van de menselijke participanten ervan te overtuigen dat het programma een mens was. Dat betekent dat de chatbot de eerste is die de Turing-test in deze vorm heeft doorstaan. Er zijn eerdere varianten geweest en er is dan dus al eerder beweerd dat een programma de Turing-test kan doorstaan. "Het gebeurde niet eerder dat er zoveel tests gelijktijdig werden uitgevoerd, die onafhankelijk werden gecontroleerd. Ook is het cruciaal dat de gesprekken niet werden beperkt; bij een echte Turing-test worden er van tevoren geen vragen of onderwerpen vastgelegd", zo laat de universiteit in een verklaring weten.
Eugene Goostman is een computerprogramma dat een team, onder leiding van de Russische computerwetenschapper Vladimir Veselov, sinds 2001 ontwikkelt. Het programma simuleert het karakter van Eugene, een 13-jarige jongen uit het Oekraïense Odessa. De jongen kent enkele karakteristieke kenmerken. Zo praat hij over zijn cavia en zijn vader, die gynaecoloog is. "Ons idee was dat Eugene kan claimen dat hij alles weet, maar dat zijn leeftijd het perfect logisch maakt dat dit niet het geval is", stellen de wetenschappers.
De chatbot breekt de zinnen die het programma krijgt op in stukjes, zogeheten tokens. Die tokens krijgen een bepaalde rang en aan de hand daarvan geeft de bot een 'relevant' antwoord, waarbij de informatie uit een database wordt opgehaald. Volgens de programmeurs kan Eugene ook informatie terugkoppelen die betrekking heeft op eerdere zinnen in een gesprek. De bot onderscheidt zich daarnaast met een persoonlijkheid, waarover niet alle concurrerende bots als Cleverbot beschikken.
Een onbekende naam is het computerprogramma overigens niet. Bij een soortgelijke wedstrijd van de University of Reading twee jaar geleden wist Eugene 29 procent van de proefpersonen ervan te overtuigen dat het programma een mens is, waarmee het net niet de Turing-test doorstond. Daarnaast stond het team van Veselov eerder in de finale van de jaarlijkse Loebner-competitie, een gerenommeerde wedstrijd op het gebied van kunstmatige intelligentie. Die competitie kent wel de beperking dat een gesprek van tevoren over een bepaald onderwerp moet gaan. De Loebner-wedstrijd werd vorig jaar gewonnen door Mitsuku.
Professor Kevin Warwick van de University of Reading prijst de prestatie van Veselov, die volgens hem gevolgen heeft voor de huidige maatschappij. "Een computerprogramma dat zich kan voordoen als iemand die wij kunnen vertrouwen, betekent een wake-up-call in het kader van cybercrime. De Turing-test is een belangrijk hulpmiddel om dit tegen te gaan. Het is belangrijk om te weten hoe online- en realtimecommunicatie een mens kan beïnvloeden."
Bij het experiment zijn overigens wel enkele kanttekeningen te plaatsen. De University of Reading zegt bijvoorbeeld niet hoeveel participanten bij het onderzoek waren betrokken. Daarnaast is het onduidelijk of zij van tevoren op de hoogte waren van de persoonlijkheid van Eugene, waaraan ze de bot zouden kunnen herkennen. Het is dus mogelijk dat de persoonlijkheid de interpretatie beïnvloedde, maar dit kan niet met zekerheid worden gezegd omdat de onderzoeksgegevens hierover nog ontbreken. Hoe dan ook: de uitkomst van het experiment betekent niet meteen dat computers nu 'slimmer' en 'menselijker' kunnen zijn dan voorheen.
De Turing 2014-wedstrijd werd afgelopen zaterdag in het Verenigd Koninkrijk gehouden. Er waren meerdere chatsessies per bot en voor iedere sessie waren er vijf juryleden. Een van de juryleden was de acteur Robert Llewellyn, die de robot Kryten speelt in de Britse sciencefiction-komedie Red Dwarf. Een ander was Lord Sharkey, die zich inzette voor de gratie die Turing vorig jaar kreeg.
Turing speelde een belangrijke rol bij het kraken van de codes van Duitse Enigma-rotormachines tijdens de Tweede Wereldoorlog en wordt gezien als briljant wiskundige. Hij maakte onder andere faam met zijn onderzoek naar berekenbaarheid, dat hij publiceerde onder de titel On Computable Numbers, with an Application to the Entscheidungsproblem. Op basis van dit artikel ontstond het gedachte-experiment de Turingmachine, die als een mijlpaal in de geschiedenis van de informatica bekendstaat. In 1950 beschreef Turing in een artikel met als naam Computing Machinery and Intelligence de beroemde Turing-test. In 1954, twee jaar na zijn veroordeling en verplichte chemische castratie pleegde hij zelfmoord. Dat was zaterdag, op de dag van de wedstrijd, precies zestig jaar geleden.
Update, 11 juni - Kanttekeningen toegevoegd dankzij feedback.