Google heeft een computerprogramma ontwikkeld dat in staat is om een professionele speler te verslaan in het bordspel go. Het programma AlphaGo versloeg de Europese kampioen van het spel, Fan Hui, vijf uit vijf keer.
Go wordt gezien als een van de meest uitdagende klassieke spellen voor kunstmatige intelligentie om te leren, vanwege de grote zoekruimte en de moeilijkheid van het bepalen van bordposities en zetten. De software werd ontwikkeld door DeepMind, een bedrijf dat Google in 2014 kocht. Hoe AlphaGo in staat was om te winnen in het complexe spel is uiteengezet in een onderzoek in Nature.
AlphaGo beschikt over twee netwerken, een ervan voorspelt de volgende zet van de tegenstander, terwijl het andere de uitkomst van verschillende zetten op het bord probeert te voorspellen. Deze netwerken worden gecombineerd met een kunstmatige-intelligentie-algoritme om vooruit te kijken in het spel op zoek naar mogelijke zetten.
AlphaGo gebruikt waardenetwerken om de bordposities op te nemen en policy networks om zijn volgende zetten te kiezen. Het programma beschikt over neurale netwerken die zijn getraind door het leren van wedstrijden die gespeeld zijn door experts en het leren van de spellen die het programma zelf speelt. Het policy network suggereert de beste zetten om te maken, terwijl de waardenetwerken de gehaalde posities evalueren. Daarna kiest AlphaGo de zet die het meest succesvol is in zijn simulaties. De zelf gespeelde spellen komen voort uit een zoekalgoritme dat gebruikmaakt van de Monte Carlo-methode, waarmee het programma duizenden spellen simuleert.
Go is een complex spel waarin twee spelers elkaar proberen te omsingelen en territorium proberen te winnen. In het spel heeft een speler op elk moment een keuze uit ongeveer 200 zetten, in vergelijking tot 20 zetten bij schaken. Hierdoor is het volgens Google-onderzoeker David Silver niet mogelijk om met brute kracht alle mogelijkheden te onderzoeken. In plaats daarvan maakt AlphaGo gebruik van een meer menselijke aanpak, waarbij de mogelijkheden worden beperkt. Hierdoor lijken de zetten meer gebaseerd op een systeem vergelijkbaar met de menselijke intuïtie.
De combinatie hiervan zorgde ervoor dat AlphaGo in staat was om de Europese go-kampioen Fan Hui vijf keer op een rij te verslaan. Ook heeft het programma een 99,8 procent succespercentage tegen andere go-programma's. In maart gaat AlphaGo het opnemen tegen een van de wereldkampioenen van Go, Lee Sedol.