Menselijke speler verslaat go-AI KataGo

Een menselijke speler heeft een kunstmatige intelligentie verslagen in het bordspel go. Hij werd daarbij weliswaar zelf ondersteund door een computer, maar het gebeurt inmiddels zelden dat mensen het spel kunnen winnen van een AI.

De Amerikaanse Kellin Pelrine versloeg KataGo-bot JBXKata005, een kunstmatige intelligentie die is ontworpen om het bordspel go te spelen, in 14 van de 15 spellen. Go is een eeuwenoud spel waarbij spelers elkaar op een bord van 19 bij 19 velden met zwarte en witte stenen proberen te omsingelen. In de afgelopen jaren werden er meerdere kunstmatige intelligenties opgezet die bedoeld waren om go te kunnen winnen, met als bekendste voorbeeld AlphaGo van Google. Dat won in 2017 voor de eerste keer een wedstrijd tegen een mens. Later stopte een wereldspeler met het spel toen die vond dat de AI altijd beter zou zijn dan een mens.

Sindsdien zijn de go-modellen alleen maar beter geworden, maar naar nu blijkt dus niet volledig onverslaanbaar. Pelrine kon winnen van KataGo met hulp van een andere AI. Het Amerikaanse onderzoeksbedrijf FAR AI liet een eigen programma een miljoen spellen spelen tegen KataGo om te onderzoeken of KataGo bekende kwetsbaarheden in het spel had. Daaruit kwam een strategie rollen die Pelrine vervolgens kon toepassen in het spel. Die strategie bestond eruit dat Pelrine een grote lus rondom de groepen van de AI heen legde en de AI ondertussen afleidde door stenen in de hoeken van het bord te leggen.

Volgens de makers hoefde er niet per definitie een AI te worden ingezet om die kwetsbaarheid te vinden. Dat was 'moeilijk, maar niet onmenselijk', zeggen de makers. Een menselijke speler op topniveau zoals Pelrine wordt dus tijdens het spel zelf niet ondersteund door de helpende AI. Later wist Pelrine ook te winnen van Leela Zero, een alternatieve go-AI.

Door Tijs Hofmans

Nieuwscoördinator

20-02-2023 • 11:34

79 Linkedin

Reacties (79)

79
79
39
8
0
29
Wijzig sortering
Later stopte een wereldspeler met het spel toen die vond dat de Ai altijd beter zou zijn dan een mens.
Dat was Lee Sedol:
On 19 November 2019, Lee announced his retirement from professional play, stating that he could never be the top overall player of Go due to the increasing dominance of AI. Lee referred to them as being "an entity that cannot be defeated".
Als dat ECHT de reden is waarom hij is gestopt, dan is dat in mijn ogen een absurde beslissing. Stoppen met go spelen vanwege het bestaan van computers, is hetzelfde als niet beginnen met gewichtheffen omdat er vorkheftrucks bestaan.
Als dat ECHT de reden is waarom hij is gestopt, dan is dat in mijn ogen een absurde beslissing. Stoppen met go spelen vanwege het bestaan van computers, is hetzelfde als niet beginnen met gewichtheffen omdat er vorkheftrucks bestaan.
Vind dat ietwat kort door de bocht, hij heeft 24 jaar lang GO gespeeld, officieel totaal tegen 980 1417 tegenstanders gespeeld (AI niet meegerekend) en hiervan 980 gewonnen (69.2%).

Qua prijzen:
30x binnenlandse toernooien gewonnen
2x Continentale toernooien gewonnen
18x Internationale toernooien gewonnen

Hij heeft een enorm lange carrière achter de rug, eigenlijk alles wat er te winnen valt gewonnen en neemt nu wegens meerdere redenen afscheid van het spel op toernooigebied.

Nu kan hij rustig zijn tijd besteden aan zijn vrouw- en dochter en van andere dingen in het leven genieten zonder de druk die media-aandacht en de toernooien met zich meebrengt.

@Groningerkoek Dank voor de verbetering, niet goed gekeken naar de tabel. |:(

[Reactie gewijzigd door Kantenklaar op 21 februari 2023 02:22]

officieel totaal tegen 980 tegenstanders gespeeld (AI niet meegerekend) en hiervan 437 gewonnen (69.2%).
Even opgezocht omdat die getallen niet kunnen kloppen.

1417 officiële matches gespeeld
980 gewonnen
437 verloren

En dan klopt het winstpercentage van 69,2% wel ;)
Hij heeft een enorm lange carrière achter de rug, eigenlijk alles wat er te winnen valt gewonnen en neemt nu wegens meerdere redenen afscheid van het spel op toernooigebied.
Correct.
Nu kan hij rustig zijn tijd besteden aan zijn vrouw- en dochter en van andere dingen in het leven genieten zonder de druk die media-aandacht en de toernooien met zich meebrengt.
Als dat is wat hij wil, dan had hij dat natuurlijk gewoon kunnen zeggen, want dat is zijn goed recht. Maar misschien kan/mag dat niet in de Zuid-Koreaanse cultuur. Ik zou het niet weten. In de schaakwereld heeft Magnus Carlsen gezegd "Ik speel niet meer voor het WK; geen zin meer in om een half jaar voor één match te moeten voorbereiden. Ik speel liever gewoon toernooien." Dus hij verdedigt bewust zijn wereldtitel niet.
Vergeet niet dat in die regio's van de wereld het spel GO voor velen als echte kunst wordt gezien waarin je zetten aantonen wat je personaliteit is en die voor de profspelers echt bijna een soort sub-religie is.
Lee Sedol had tegen de machine gespeeld en daar was de fameuze "move 37" gespeeld. Een zet die zo atypisch was voor het spel go (waar je de eerste X zetten 'normaal' aan de buitenste paar rijen van het bord speelt), dat iedereen verbluft was. De wereldkampioen heeft meer dan een kwartier nodig gehad om te analyseren hoe of wat. De zet bleek dan achteraf goed gezet (al is daar discussie over).
Er wordt gezegd - maar ook hier is het niet zeker hoe juist dit is - dat deze move mee de oorzaak is dat hij gestopt is, omdat een entiteit van een computer een soort persoonlijkheid kreeg die niet alleen niet past in zijn Go wereld, omdat hij niet kan inschatten wat voor persoon er nu effectief speelt tegen hem, maar die dan ook nog eens intuitief zoveel beter speelde dan hij - terwijl hij de regerende wereldkampioen was.

"Move 37" wordt in de AI wereld soms nog gebruikt om aan te geven dat AI soms in staat is om dingen zo snel te analyseren dat sommigen hun job er bij zal verdwijnen. Of om op zijn minst de impact op bepaalde sectoren te bekijken omdat deze serieus door elkaar gerammeld kunnen worden.
"Move 37" is een van die zetten waarvan mensen tot voor kort dachten "dat kan niet, dat is niet speelbaar." In de schaakwereld is hetzelfde gebeurd sinds het uitvinden / invoeren van neurale netwerken. Complete openingen die werden gezien als "onspeelbaar" bleken opeens wél speelbaar te zijn. Openingen die werden gezien als "uitgeanalyseerd" en "remise-achtig" bleken toch nog een extra laag aan ideeën en mogelijkheden te hebben. Er zijn strategieën in het middenspel langsgekomen waarin positionaliteit ZOVEEL belangrijker is dan materiaal dat een engine een compleet stuk opgeeft voor positioneel voordeel.

Dat is ook allemaal in Go gebeurd. Mogelijk is Lee Sedol gestopt omdat hij zich realiseerde dat hij eigenlijk helemaal niet zo goed was in Go, in vergelijking tot wat er ECHT mogelijk is. Ik kan me voorstellen dat dat een enorme mentale klap was. Maar, andere grootmeesters zijn niet gestopt, en hebben geleerd van de computer...
Aannemende dat wat je zegt klopt, want het is aannemelijk, dan geeft het wel blijk van een zeker (ontbrekend) karakter bij Lee Sedol. Als hij de conclusie trekt dat er meer lagen en strategieën te onttrekken zijn, ondanks de gevestigde kennis van zaken, dan kan dat toch ook juist motiveren om dat te bestuderen? Je bent immers topspeler. Dit zou je moeten inspireren om buiten jezelf te kijken, om beter te worden dan je tegen een mens zou kunnen.

Dat je je neerlegt bij het vermogen van computers om dat beter te kunnen dan mensen, begrijp ik. Maar je neerleggen bij het idee dat een computer beter is in het spelletje vind ik een wat zwak argument voor iemand met zoveel karakter als en topspeler.

Ga mee met de tijd en leer van of maak gebruik van de mogelijkheden!
Mooie documentaire over de wedstrijd tussen Lee Sedol en AlphaGo:
https://www.youtube.com/watch?v=WXuK6gekU1Y

De documentaire laat wel zien dat verslagen worden door een computer best een grote impact had op Lee Sedol, en de Go community.
Dat krijg je, als je het idee hebt dat "Go het meest complexe spel ter wereld is, waar een computer NOOIT beter kan worden dan een mens." Het enige dat de computer heeft tegengehouden was een gebrek aan onderzoek. Het schaakspel is sinds 1950 onderzocht en de klassieke alpha-beta + evaluatie is ondertussen geperfectioneerd.

Echter, die techniek werkt niet voor Go, vanwege het formaat van het bord en omdat er delen in de positie kunnen zitten die nog niet "af" zijn (kunnen niet alleen-staand beoordeeld worden, zoals dat met een gehele schaakstelling wel kan). Monte-Carlo (gebruikt in Go in 2001; effectief gezien "probeer heel snel heel veel, en kies dan de weg met de beste kansen") + neuraal netwerk (voor kennis) was voor Go een betere oplossing dan alpha-beta + evaluatie.

Dezelfde technieken zijn ook geprobeerd voor het schaakspel. Een neuraal netwerk bevat veel meer kennis dan een statische klassieke evaluatie. Daarom is die laatste ook zo ongeveer vervangen in alle high-end engines. Het leverde echter minder op dan bij Go, omdat de statische evaluatie al zover geperfectioneerd was. Monte-Carlo werkt wel voor schaakprogramma's, maar alpha-beta is nog steeds de betere techniek.

Het was een kwestie van tijd voordat de computer Go zou kunnen spelen op, of beter, dan de wereldkampioen, maar de Go-wereld heeft zich vastgeklampt aan het feit dat Kasparov in 1997 al verslagen werd door een computer, en Go-programma's niet eens in de buurt kwamen van een sterke clubspeler. Dat was dus echter enkel een kwestie van meer onderzoek doen.

We zijn nu zo ver dat een Rapsberry Pi sterk genoeg is om een gemiddelde grootmeester een goede partij te geven. Dat zal voor Go ook het geval zijn op een gegeven moment.
Het enige dat de computer heeft tegengehouden was een gebrek aan onderzoek.
Wat de computer heeft tegengehouden is vooral het gebrek aan rekenkracht. Schaken voor 7 stukken of minder is opgelost (endgame tablebase: https://en.wikipedia.org/wiki/Endgame_tablebase). Voor meer is het aantal mogelijke zetten teveel om te berekenen. In Go is dit probleem nog veel groter, het aantal mogelijke 'moves' is vele malen groter.

Hier komen neurale netwerken van pas. Deze zijn getraind zodat ze kunnen zeggen welke zetten potentieel goed zijn, en welke niet. Deze kan de computer dan verder doorrekenen, en minder goed lijkende zetten niet. Grappig is dat je de computer op die manier een soort mensenlijke intuitie geeft.

En op zich bestond deze techniek in de basis al heel lang, 20 jaar geleden heb ik al over neurale netwerken geleerd op de universiteit. Waarschijnlijk bestaat het al veel langer. De grote vooruitgang in de laatste jaren is vooral de danken aan gespecialiseerde hardware (TPU's: https://en.wikipedia.org/wiki/Tensor_Processing_Unit) die grotere netwerken mogelijk maken.
En op zich bestond deze techniek in de basis al heel lang, 20 jaar geleden heb ik al over neurale netwerken geleerd op de universiteit.
Klopt; ik heb een vak "Intelligent Systems" gehad op de uni waarin zoekfuncties zoals alpha-beta, neurale netwerken en genetische algoritmen werden behandeld. Monte-Carlo heb ik toen nog niet gehad want dat was nog niet echt een ding op computergebied.
Rapsberry Pi sterk genoeg is om een gemiddelde grootmeester een goede partij te geven.
Wat?? Zelfs de wereldkampioen heeft geen schijn van kans tegen Stockfish op een Pi.
Geen idee. Zover ik weet heeft niemand ooit Stockfish op een Pi getest tegen Stockfish op een normale PC om de speelsterte te kunnen verifiëren.
Als dat ECHT de reden is waarom hij is gestopt, dan is dat in mijn ogen een absurde beslissing. Stoppen met go spelen vanwege het bestaan van computers, is hetzelfde als niet beginnen met gewichtheffen omdat er vorkheftrucks bestaan.
Tja, het zit allemaal tussen de oren. Je kan je ook afvragen of je leven wijden aan een bordspel of sport niet minstens zo absurd is. Waarom doen mensen nog aan gewichtheffen als we ook vorkheftrucks hebben?
Natuurlijk geeft "sterk zijn" of "tactisch denken" je een voordeel in het leven maar ik geloof niet dat je er écht iets aan hebt om de "sterkste" of "slimste" mens van de wereld te zijn. De op een na sterkste is ook al sterker dan nog nuttig is als het niet gewoon nadelig is door het risico op blessures.

Indirect heb je misschien iets aan de faam en aandacht die daar bij komen kijken maar dat is alleen voor de allerbesten en daar zijn er maar zo weinig van in de wereld dat het niet rationeel is om een carriere te bouwen die afhankelijk is van de beste van de wereld te worden.

Als dat toch je strategie in het leven is dan is het wel noodzakelijk dat je de allerbeste bent en veel aandacht krijgt. Als een stuk software dan meer aandacht krijgt dan snap ik dat het niet goed voor de carriere van de menselijke toppers is.

Sterker nog, vanuit het oogpunt van "aandacht" is stoppen misschien wel het slimste wat Lee Sedol kon doen. Dat nieuwtje plaatste hem opeens weer terug in het nieuws en heeft vast een aantal leuke interviews of betaalde spreekbeurten opgeleverd. Hij kan altijd opnieuw beginnen en dan een weer een nieuw persmomentje hebben.

Niet dat ik denk dat hij is gestopt als een puur rationele afweging tussen aandacht en inkomsten of zo iets, maar ik denk dat het psychologisch wel mee speelt dat hij verslagen wordt door een computer en duidelijk is dat daar niet tegen op te trainen valt door mensen. Het doet er niet toe hoe hard hij werkt, de computer zal voortaan altijd beter zijn en sneller vooruitgaan.

Dat kan het nog steeds een leuke hobby of sport zijn maar het idee dat je het hoogtepunt van het universum bent in je eigen specialiteit zal je moeten loslaten.

[Reactie gewijzigd door CAPSLOCK2000 op 20 februari 2023 12:41]

Indirect heb je misschien iets aan de faam en aandacht die daar bij komen kijken maar dat is alleen voor de allerbesten en daar zijn er maar zo weinig van in de wereld dat het niet rationeel is om een carriere te bouwen die afhankelijk is van de beste van de wereld te worden.
Faam begint ook al klein, de beste van de klas, de beste van de club, de beste van de poule, de beste van de regio etc... Faam is denk ik wel de grootse driver van alle topsporters... zonder de drive om altijd maar de beste te zijn wordt je denk ik nooit wereldkampioen.
dat weet ik niet, als je merkt dat je met je lijf de beste van de wereld kunt worden gaat het niet over de faam die daaromheen ontstaat. Maar dat jij dat kunt doen. De top van de Mount Everest. Of ik snap niet goed wat je met faam bedielt en zeggen we allebei hetzelfde
Ik denk dat we beide hetzelfde bedoelen... woordkeuze had inderdaad anders gekund.

Het gaat er vooral om dat ik denk dat de meeste mensen niet gelijk denken dat ze de beste van de wereld zijn of kunnen worden. Dat begint klein met successen, en die successen motiveren om meer succes te halen.

Ik denk precies hetzelfde als met geld verdienen... Als je doel is om een dure auto te kopen.... als je die éénmaal hebt ervaar je succes en wil je nog meer. Dan ga je gewoon weer hogere doelen stellen. Het zit in de mens.

[Reactie gewijzigd door The_Woesh op 21 februari 2023 20:04]

klopt. dan zouden mensen die miljardair zijn dit doen omdat ze willen kijken hoever ze komen. niemand heeft een miljard nodig natuurlijk. bizar eigenlijk
Dat kan het nog steeds een leuke hobby of sport zijn maar het idee dat je het hoogtepunt van het universum bent in je eigen specialiteit zal je moeten loslaten.
Zeker; en dat hebben we in de schaakwereld al in 1997 gedaan, en in de wereld van het dammen in 1994-95. Dammen is al zover gevorderd dat de openingsboeken en de eindspeldatabases *bijna* bij elkaar komen; de computer hoeft nog maar een zet of 10-15 zelf te spelen voordat hij zo vanuit het middenspel rechtstreeks de eindspeldatabase in kan duiken tijdens zijn berekening. Het zal niet lang meer duren voordat een computer dat kan, direct vanuit het openingsboek. (Met een 16+ core CPU kan het mogelijk al; weet ik niet. Maar ik houd me dan ook niet bezig met dammen.)

En toch zijn er nog steeds mensen die dammen / checkers spelen. (Ik snap ook niet waarom. Spel is veel te plat in vergelijking tot schaken. Dat geldt ook voor Go, maar dat heeft dan tenminste nog een groot bord waar je supercool niet IN de vakjes speelt, maar op de kruisingen, en in het begin van het spel 4 kleine partijen tegelijk kan spelen :P)

[Reactie gewijzigd door Katsunami op 20 februari 2023 14:14]

Ik vind go juist veel mooier dan schaken, omdat met heel simpele regels er wel een erg complex spel ontstaat. Schaken vind ik in vergelijking juist een beetje wanhopig opgebouwd om het maar spannender te maken.
Dat is smaak; ik heb in het verleden veel schaak en go gespeeld, en nu enkel alleen schaak. Hetgeen me uiteindelijk heeft overgehaald om alleen schaak te blijven spelen zijn een paar dingen:

- Schaken heeft dingen als lange-afstandsaanvallen met bijbehorende strategieën en tactieken. Xiangqi en Janggi (Chinees en Koreaans schaak) hebben dat veel minder, en de stukken zijn beperkter, waardoor ik die spellen niet prettig vind spelen.
- Elk gevecht in go is effectief hetzelfde: het draait om het veroveren van territorium door of efficiënter te spelen, of het vangen van stenen van tegenstanders. In schaak moet je de koning schaakmat zetten, maar dat kan gebeuren via een gevecht om één of meer velden of om materiaal, het kan een lange positionele partij zijn, of kort en tactisch met een combinatie. De focus van een partij kan compleet anders zijn dan die van een andere partij, terwijl die bij go altijd hetzelfde is.
- Uiteindelijk vind ik het schaakspel mooier (qua bord en stukken) dan go.
- Er bestaat een electronisch schaakbord om tegen engines te kunnen spelen.
- Er zijn honderden en honderden engines te krijgen van bijna willekeurige zetten tot onverslaanbaar sterk
- Ik speel langer schaak dan go.
- Ik onderhoud mijn eigen engine, en binnenkort begin ik aan een GUI daarvoor omdat hetgeen dat in de open-source wereld te krijgen is, oud is, brak is, slechte UX / UI heeft, of gewoon mogelijkheden mist. Omdat er geen electronisch go-bord is en het spel in het westen weinig gespeeld wordt, heb ik niet het gevoel dat het nuttig is om me met go-software bezig te houden.
Mooie vergelijking! Ik heb uiteindelijk beide spellen niet serieus gespeeld, zodat dingen als "hoe verschillend zijn partijen op de lange duur" bij mij niet zo opgekomen zijn. Leuk argument ook dat een schaakbord optisch mooier is, dat is inderdaad ook mijn mening.

Veel succes met je engine!
Vindt het een rare vergelijking.

Als je de nummer 1 in de wereld bent in GO of Schaken maar wel zo goed als altijd verliest van een AI dan betekent dat gewoon dat hoewel je de mensen verslaat je toch de sport niet perfect beheerst.

Bij gewichtheffen kun je nog zoveel trainen als je wilt maar uiteindelijk zit je aan je eigen fysieke beperking en kun je niet verder inheb je je persoonlijke top bereikt. Bij Go of Schaken is er eigenlijk geen einde aan het leerproces en is er altijd verbetering mogelijk. Beseffen dat ongeacht hoeveel je ook traint dat je nooit perfectie zult bereiken (of zelfs maar in de buurt zult komen) is best wel teleurstellend.
Bij Go of Schaken is er eigenlijk geen einde aan het leerproces en is er altijd verbetering mogelijk.
Dat is niet waar. Zelfs als je alles zou kunnen weten wat de computer weet (openingsboeken, eindspeldatabase, evaluatiekennis), dan kun je als mens niet in de buurt komen omdat je niet ver genoeg vooruit kunt kijken. Daar heb je gewoon de snelheid en het geheugen niet voor. Dus met schaken loop je wel degelijk tegen een fysieke (menselijke) beperking aan.
Een fysieke beperking die je ook al train je je hele leven niet zult bereiken. Daarnaast bestaat trainen vooral uit het herkennen van zoveel mogelijk speeltechnieken (En aldus eerder gespeelde potjes van jezelf en anderen). Maar wordt niemand oud genoeg om ze allemaal te kunnen opslaan in het eigen geheugen omdat er zo vreselijk veel opties zijn.

En dat bedoel ik met dat je kunt leren en verbeteren tot je laatste dag.
https://youtu.be/WXuK6gekU1Y

Voor degene die het nog niet hebben gezien, de documentaire is een echte aanrader, ook al heb je helemaal Niets met Go, zoals ik :o .

Het blijft een van de beste en verrassendste documentaires die je zult zien.
Ligt er heel erg aan, als jij jarenlang racet op een circuit in de absolute wereldtop en oppeens kan AI makkelijk langs je racen ga je je ook afvragen waar je dan voor aan het oefenen bent. Als AI gewoon beter en interessanter is dan ben je eigenlijk de sport aan het oefenen voor je eigen entertainment en niet iedereen doet het voor eigen entertainment, vooral op topsporter niveau waar men in principe het eigen lichaam kapotmaakt om maar die ene 0.1 procent sneller te zijn dan de rest. Als een AI dan langskomt en je er met 10% voorsprong uitknalt zou ik het niet meer proberen.

Natuurlijk, dat is een persoonlijkheid, sommige mensen zullen de AI zien racen en denken: wow dus het kan nog beter, ik vraag me af hoe. En zij zullen dan de nieuwe generatie aan racers zijn.
De frustratie van het niet kunnen winnen van de AI was voor hem echt wel een ding. Maar er speelde wel meer, zie https://en.yna.co.kr/view/AEN20191127004800315
[...]

Als dat ECHT de reden is waarom hij is gestopt, dan is dat in mijn ogen een absurde beslissing. Stoppen met go spelen vanwege het bestaan van computers, is hetzelfde als niet beginnen met gewichtheffen omdat er vorkheftrucks bestaan.
Niet veel anders dan Kasparov die in 1997 effectief stopte met schaken na de rematch verloren te hebben van Deep Blue. Schaken was lang het domein van menselijke, creatieve superioriteit, de triomf van de menselijke geest over de machine. Op moment dat dat doorbroken is, dan is het pleit gewoon beslecht: de computer heeft gewonnen. Einde oefening.

Er zat ook een diepere kant aan bij Kasparov: niet alleen was het menselijk ego (van de mensheid als geheel) een beetje geknakt, maar Kasparov vond ook dat daarmee het spel eigenlijk dood was gemaakt, want vanaf nu kon iedereen voorbereiden met een computer, en was het niet meer een kwestie van menselijk talent. Daar klaagde Bobby Fischer overigens al over (ver avant la lettre van A.i.) En die gedachten gang is goed te volgen.

N.B. Kasparov heeft overigens ongelijk gekregen; schaken is juist enorm verrijkt door de komst van superieur computers. Het heeft de top spelers in doen zien, dat er hele nieuwe strategieen mogelijk zijn (het beruchte spelen van het vroege h4, bijvoorbeeld). Dat zal ook voor Go wel gaan gelden.
Niet veel anders dan Kasparov die in 1997 effectief stopte met schaken na de rematch verloren te hebben van Deep Blue.
Ik denk dat je er hier een beetje naast zit. Er zitten 837 partijen van Kasparov in de Chessbase MegaBase, gespeeld tussen 1997 en 2005 (toen hij daadwerkelijk stopte). Tevens is tussen 1997 en 1999 zijn Elo-rating ook nog gestegen van 2795 naar 2851, die 15 jaar lang de hoogst behaalde rating ooit was. Dat noem ik niet echt "vrijwel gestopt met schaken."
Er zat ook een diepere kant aan bij Kasparov: niet alleen was het menselijk ego (van de mensheid als geheel) een beetje geknakt, maar Kasparov vond ook dat daarmee het spel eigenlijk dood was gemaakt, want vanaf nu kon iedereen voorbereiden met een computer, en was het niet meer een kwestie van menselijk talent.
Kasparov was niet tegen computers. Integendeel. Hij was een gebruiker van Chessbase van het eerste uur; zelfs al vanaf versie 1.0 op de Atari ST in 1986. Hij heeft een hele lijn schaakcomputers onder zijn naam gehad bij Saitek. Als er IEMAND is geweest die de computer vanaf het eerste begin bij zijn voorbereidingen heeft gebruikt dan was het wel Kasparov. Zoek maar eens met Google in de Chessbase website. Je kunt veel artikels terugvinden (zeker in de Duitse site) die het daarover hebben. Tegenwoordig geeft Kasparov zelfs TED-talks (zie Google) over computers, AI, en dat we daar niet bang voor moeten zijn, maar het wel goed moeten reguleren.
Pelrine kon winnen van KataGo met hulp van een andere AI. Het Amerikaanse onderzoeksbedrijf FAR AI liet een eigen programma een miljoen spellen spelen tegen KataGo om te onderzoeken of KataGo bekende kwetsbaarheden in het spel had. Daaruit kwam een strategie rollen die Pelrine vervolgens kon toepassen in het spel.
Dus de titel van het artikel klopt niet. Dit is zoiets als ChatGPT een artikel laten schrijven en dan claimen dat ik het geschreven heb.
Volgens de makers hoefde er niet per definitie een AI te worden ingezet om die kwetsbaarheid te vinden. Dat was 'moeilijk, maar niet onmenselijk', zeggen de makers.
Maar dat is wel gebeurd. Dus bewijs maar dat het zonder AI kan.
Ik vind het ook lastig. In feite hebben ze dus een strategie door een AI laten uitvinden, en die strategie vervolgens door een mens laten uitvoeren. Dat bij de uitvoering geen AI heeft geholpen, en de mens alle zetten zelf heeft moeten bedenken a.d.h.v. de strategie betekent voor mij niet zozeer dat de mens de AI heeft verslagen.

Het voelt voor mij een beetje alsof iemand een glitch in een game heeft gevonden, en jij die glitch uitbuit om van anderen te winnen. Heb je het dan echt op eigen kracht gedaan?
Heb je het dan echt op eigen kracht gedaan?
Eigenlijk ook wel eentje om over na te denken :). Als je miljoenen menselijke wedstrijden inlaadt in de AI, heeft die AI het dan wél op eigen kracht gedaan? Is de AI strategie dan niet net zo goed gebruik maken van glitches in de menselijke strategie?

[Reactie gewijzigd door WaterFire op 20 februari 2023 11:55]

Eigenlijk ook wel eentje om over na te denken :). Als je miljoenen menselijke wedstrijden inlaadt in de AI, heeft die AI het dan wél op eigen kracht gedaan? Is de AI strategie dan niet net zo goed gebruik maken van glitches in de menselijke strategie?
Voor de duidelijkheid, je kan geen wedstrijden inladen in een AI. Als je trainen op wedstrijden bedoelt, ja dat kan en daarom zijn deze AI ook zo goed. Iets 'op eigen kracht doen' is een betekenisloos begrip. Immers, een GO speler kan alleen maar beter worden door te spelen tegen betere tegenstanders. Als je vervolgens een wedstrijd wint tegen een goede speler heb je dat dan op eigen kracht gedaan? Nee natuurlijk niet, je hebt eerst jaren gespendeerd aan het spel leren.
Heel simpel gezegd noem je dat 'ervaring'. Een computer doet alleen iets sneller ervaring op dan een mens.
Mooie vergelijking met die glitch. De AI/strategie/adversary die de 'glitch' uitbuit is zelf ook verre van perfect. Ondanks dat je met deze strategie katago kan verslaan, verliest hij weer van een menselijke beginner.
However, a member of our team (Tony Wang) who is a novice Go player managed to convincingly beat this same adversary. This confirms that our adversarial policy is not generally capable, despite it beating victim policies that can themselves beat top human professionals. Instead, our victim policy harbors a subtle vulnerability.
Misschien dat je een parallel kan trekken met penalties in voetbal. Professionele teams duiken daar ook diep in de data en beelden van de tegenstanders. Als zij zien dat een keeper vaak de linkerhoek in duikt, en jij schiet daarom de rechterhoek in...... exploit je dan ook niet een glitch/zwakheid van die specifieke speler?
Wat er gebeurt is is dat een AI getraind is om zwakheden te vinden in een andere AI. Dat is niks nieuws, en is onder andere de basis voor technieken als GAN. Een realistische titel zou dus zijn 'Nieuwe AI in staat om zwakheden in eerder onverslaanbaar geachte GO AI te vinden', maar dat krijgt niet zoveel clicks. Vervolgens kan de GO AI weer op die nieuwe AI trainen en begint het riedeltje weer van vooraf aan opnieuw.

[Reactie gewijzigd door StefanSL op 20 februari 2023 11:53]

De strategie is -mede- door de AI opgesteld, de menselijke speler heeft 14 van de 15 spellen gewonnen. Of die laatste dan ook beter is, is de vraag. Ik neem aan dat de 'AI' lerend is en dat dit binnen de kortste keren niet meer kan.
Of die laatste dan ook beter is, is de vraag
Wat is 'beter' ? Dat is een kwestie van definitie.

Als het gaat om het aantal gewonnen potjes, dan is de mens (met behulp van een andere AI) op dit moment hier de winnaar.
Ook als het gaat om het begrijpen van het spel is de mens de winnaar. Een AI heeft immers nul begrip van wat hij aan het doen is. Hij past slechts statistische berekeningen toe.

Als het gaat om een breed scala aan tactieken te kunnen analyseren en daar ingewikkelde statistieken op los laten... dan is de AI ongetwijfeld de winnaar !
Ik zou 't anders zeggen.

Het is alsof een voetbalcoach aan ChatGTP vraagt om een strategie te verzinnen, en deze vervolgens toepast. Als ik het artikel goed begrijp is de AI alleen vooraf ingezet. Tijdens het spelen had de AI geen rol.
Een menselijke speler op topniveau zoals Pelrine wordt dus tijdens het spel zelf niet ondersteund voor de helpende AI.
Besides previously studying our adversary's game records, no algorithmic assistance was used in this or any of the following examples.
Dit is anders dan wat @Seditiar zegt hieronder. De AI heeft de mens 'getraind', maar daarna doet hij 't toch echt zelf. Hij kreeg niet stap voor stap instructies.
Het gaat erom dat AI een cruciale rol heeft gespeeld in het verslaan van een andere AI. Wie dan precies de zetten deed en welke analogie daar het beste bij past is niet zo belangrijk.
De AI heeft een cruciale rol gespeeld bij het trainen van de speler. De AI speelde geen rol bij de potjes zelf.

De speler heeft de strategie begrepen, onthouden, en toegepast in verschillende potjes go. De titel waarin staat dat een menselijke speler Katago heeft verslagen lijkt me dus prima.

Je kan 't ook omdraaien en zeggen dat mensen een cruciale rol hebben gespeeld in het creëren van Katago. Dus eigenlijk heeft Kellin Pelrine hier andere mensen verslagen? ;)
De AI heeft een cruciale rol gespeeld bij het trainen van de speler. De AI speelde geen rol bij de potjes zelf.
Niet waar. Het woord trainen staat niet eens in het artikel. Dit gaat puur om het uitbuiten van zwakheden. Eigenlijk probeer je gewoon gaten te vinden in een computer programma. Sterker nog, ik durf zelfs te beweren dat Pelrine er geen betere speler door is geworden aangezien een mens vrijwel meteen door zo'n simpele strategie heen prikt.
Niet waar. Het woord trainen staat niet eens in het artikel.
Dat het niet in het artikel staat wil niet zeggen dat het niet waar is. We trainen ook een AI om deze het spel en de tactieken te leren.
Nu draaien we de zaak om en wordt de mens getraind (als in: een tactiek/strategie aangeleerd) door de AI. Het is hetzelfde proces, alleen de rollen zijn omgedraaid. De terminologie van @svane is dus terecht.
Als je bedoelt dat het leren van een strategie die alleen maar werkt onder specifieke omstandigheden tegen één specifiek computer algoritme onder 'trainen' valt dan ben ik het ermee eens. Persoonlijk zie ik het meer als een soort cheatcode, een beetje zoals dat de AI van AOE2 niet om kan gaan met een towncenter naast hun base: https://www.youtube.com/watch?v=EyzMxlsDkog
Als je bedoelt dat het leren van een strategie die alleen maar werkt onder specifieke omstandigheden tegen één specifiek computer algoritme onder 'trainen' valt dan ben ik het ermee eens.
Dat bedoel ik !
Met die strategie is deze AI (op dit moment) te verslaan.

Met een cheatcode maak je gebruik van iets wat bewust geprogrammeerd is. Dat is hier niet het geval. Daarom is het in mijn beleving een tactiek en geen cheatcode. Maar goed, daar kun jij een andere definitie voor hebben.

[Reactie gewijzigd door T-men op 20 februari 2023 14:11]

Een bokser zal ook trainen op de specifieke gewoontes en zwakheden van zijn tegenstander, ze laten sparring partners vechten in de stijl van die tegenstander, tijdens de training.

Een basketballer bestudeert ook de gebruikelijke neigingen van zijn directe tegenstanders als het er echt op aan komt in de playoffs. Ze bekijken heel veel videobeelden wat een speler in bepaalde situaties doet, en bedenken hoe ze dat kunnen voorkomen of er gebruik van kunnen maken.

e-sporters bestuderen ook elkaars wedstrijden en proberen er achter te komen wat de neigingen zijn van een team of individuele spelers.

Studeren, trainen, voorbereiden, scouten. Geef het maar een naam. Het komt er op neer dat je van een specifieke tegenstander moet winnen op dat moment, en daar wil je van te voren alles van weten, en als het even kan, op oefenen.
Dat gaat om tekortkomingen van een persoon. Je buit hier een tekortkoming in de training data van de AI uit.
Dan zou KataGo er toch ook doorheen moeten prikken? Lijkt me dat die toch ook gewoon is getrained met wedstrijden. Zijn vast wel wedstrijden (misschien van niet professionele spelers) waarmee word getrained waar deze tacktiek ook wel eens in voorkomt
Nee dat hoeft zeker niet. Als de training data bestaat uit professionele potjes dan zullen dit soort strategieën er niet in voor komen. Hier zie je ook meteen het gebrek, of eigenlijk totale afwezigheid, van 'intelligentie' in zo'n AI. Het is niets anders dan een probabilistisch model.
Zonder AI had hij het ook kunnen doen alleen zou het veel langer duren, zie het als een rekenmachine zonder kan je ook, maar het duurt veel langer.
Een rekenmachine die voor jou een probleemstrategie uitdoktert?
Zeg dat tegen een topsporter getraind door een topcoach. De coach wordt inderdaad te vaak naar achter geschoven (door externen), maar we vieren toch altijd wel de sporter en/of het team dat wint en niet de coach.
In dit geval was de menselijke speler niks meer dan een interface tussen 2 AI's die met elkaar speelden.
Het hele bericht is puur media drama / clickbait.
Op Reddit zie je ook dat dit bericht wordt gedownvote.. De mens heeft helemaal niet gewonnen want deze deed dat met hulp van een computer. Maar wel mooie clickbait titel...
Dus.. Deze partijen inladen in het model en het 'gat' is gedicht?
Dus.. Deze partijen inladen in het model en het 'gat' is gedicht?
Ja. Maar het in principe niet mogelijk om alle gaten te dichten.
Bij dit spel kan een plek leeg zijn, een witte steen bevatten of zwarte steen. Dus 3 ^ 361 dus 1e172 mogelijkheden. Eigenlijk minder want aan het begin zullen de meeste vakken gewoon leeg zijn, maar nog wel reusachtig veel.
Dat betekend zelf als het netwerk, de data erg comprimeert. B.v., door dat het leert dat het bord rotatie symetrisch is, of dat het voor bepaalde patronen niet uitmaakt waar deze op het bord liggen. Hij eigenlijk nooit deze hele space kan leren.
Dus er zullen altijd bij erg afwijkende spel, situaties voorkomen waar hij geen oplossing voor weet.
Als dit een simpel supervised learning model zou zijn, dan is het inladen van meer training data inderdaad de beste optie. Echter maakt KataGo gebruik van een iets ingewikkeldere architectuur waar wordt getrained op borden van een verschillend formaat. Daarnaast zit er een random onderdeel in om er voor te zorgen dat zetten die in eerste instantie niet per se logisch lijken alsnog onderdeel uit kunnen maken van de beslissingsboom.

Vooral het eerste kan er voor zorgen dat deze strategie lastig weg te programmeren valt, kan ik me ze voorstellen: door het deels trainen op kleinere borden, "ziet" de computer grotere lussen niet vaak en in is er relatief minder informatie over hoeken beschikbaar.
Het probleem zit dus eigenlijk in de manier waarop de AI ingeleerd is?

Bij Go heb je een 19x19 bord, wellicht kost het meer tijd/resources om alleen daar op te trainen; en zal het model wellicht niet goed werken op een 24x24 bord. Maar de grootte van het bord is in Go toch niet variabel?
Het probleem zit dus eigenlijk in de manier waarop de AI ingeleerd is?
Zonder in diep in de resultaten te duiken is het lastig te zeggen of het inherent aan de architectuur is, maar het lijkt goed mogelijk dat dit deel van het probleem kan zijn. Meer training data met de bovenstaande strategie zal op zichzelf misschien al aardig werken om dit "gat" te dichten, maar misschien dat het nodig is om ook iets meer gewicht te geven aan de grotere borden. Dat zou allicht wel weer gevolgen hebben voor hoe goed het model presteert op kleinere borden.

@djexplo heeft het hierboven over het grote aantal mogelijkheden in Go, waardoor een model nooit alle mogelijkheden kan bevatten. Dat is op zich waar, maar niet echt een antwoord. ChatGPT heeft ook niet alle mogelijke combinaties van woorden in het model zitten, maar het heeft wel geleerd wat logische combinaties zijn; dat is exact het doel van machine learning in dit soort contexts. KataGo leert niet alle mogelijkheden, maar wel wat goede strategieën zijn. Het punt is dan dat je traingingendata representatief moet zijn voor je gebruik omdat je anders een strategie mist (wat hier mogelijk gebeurt is) of te veel waarde hecht aan een strategie die niet goed generaliseert (wat een risico is als je zonder veel aanpassingen een hoop extra training data voor specifiek deze strategie zou toevoegen).
Maar de grootte van het bord is in Go toch niet variabel?
19x19 is het standaard bord, maar voor snellere/makkelijkere spellen worden ook kleinere borden gebruikt. Daarnaast zijn sommige patronen die je ziet op een klein bord ook toepasbaar op een groter bord.
Speel jij er even duizenden op hoog niveau?
Nee, maar vanwaar jouw reactie op mijn reactie? Ik mis de connectie.

[Reactie gewijzigd door WaterFire op 20 februari 2023 12:59]

Er is best wat trainingdata nodig, vandaar mijn reactie.
Ik moet eerlijk bekennen dat deze berichten over AI die mensen overal voorbij streeft me een beetje down maakt.
Ik heb soms echt twijfel waar ik nog mijn energie in moet steken om intellectueel nog te groeien.
Met welk doel? Ik ben nog altijd beter in autorijden, ben nog beter in praten met mensen, spelen met kinderen, uitleg geven aan ouderen, dingen 'zelf' bedenken, creatief zijn, mijn leven is weinig 'minder' geworden door 'alle AI in de wereld'.
Waarom? Gereedschap is wat ons juist in staat steld om zo ver te komen. Omdat je minder energie in het ene proces moet steken kun je meer in het andere steken.

Daarom maken we gereedschap, zodat die iets beter en sneller kan dan jij.
"AI" is gewoon gereedschap, en doet intelectueel juist erg weinig.

Een computer kan bepaalde zaken nu eenmaal heel snel, dat maakt hem niet heel slim.

Ik voel mij zelf in elk geval niet slechter om dat een rekenmachine sneller kan rekenen dan ik, ik gebruik het om zelf sneller berekeningen te kunnen doen.
Net zo als dat ik een schaar gebruik om sneller en precieser papier te kunnen opdelen in kleinere stukken.
Ik moet eerlijk bekennen dat deze berichten over AI die mensen overal voorbij streeft me een beetje down maakt.
Niet down over zijn, ik snap je gevoel maar computers zijn al decennia veel beter in vrijwel alles wat 'wij' doen... Nu is het alleen eenvoudiger beschikbaar voor de normale mens...

Ik heb soms echt twijfel waar ik nog mijn energie in moet steken om intellectueel nog te groeien.
Nou, al vrij lang is bekend dat we enkel nog toekomst hebben in STEM. Dus de harde wetenschappen...
Maar is nooit een maatschappij geweest die kon leven van kunst of literatuur. Het is altijd wetenschap geweest dat ons vooruit brengt. Dat is allemaal niet anders tegenwoordig.

Verandering is moeilijk, zeker met het tempo dat we tegenwoordig ondergaan. Maar vrees niet, er is werk genoeg en omarm verandering. Zie de mooie dingen dat je er mee kan doen en probeer de vele nieuwe dingen te zien die jij nu ook kan doen zonder dat je de skills daarvoor hebt.

What a time to be alive!
Dus in feite is dit hetzelfde als ik een schaakpotje van een grootmeester win omdat een andere grootmeester precies zegt welke zetten ik moet doen en dus mijn strategie bepaald.
Nee, een betere vergelijking is dat een analyse is uitgevoerd op de schaakspel van die grootmeester waarbij naar voren komt dat deze specifieke openingen gebruikt, en een typische endgame heeft. Door dat te weten, kun je een strategie bepalen door bijv. een andere opening te gebruiken die beter werkt tegen de grootmeester, en dat de endgame tactiek die de grootmeester doorgaans gebruikt niet mogelijk te maken.
Oftewel: AI vs AI maar één van de AI partijen laat een menselijk hulpje klikken. Wat lange titel natuurlijk maar goed.
Tja, is dit wellicht de manier waarop de computers uiteindelijk de mensheid overnemen? Ze laten ons in de waan dat we zelf nog slim genoeg zijn en aan de touwtjes trekken, maar eigenlijk houden ze ons de touwtjes voor om aan te trekken.
Als ze menselijk gedrag gebruiken om te trainen, dan zal dat zeker gebeuren.
Het concept slim of dom bestaat natuurlijk niet in computers, dat is iets wat wij mensen graag gebruiken om ego's te strelen.
Voor een computer is het een onzinnig verspilling van resources zonder enig doel.
Nee, ze hebben met AI een nieuwe strategie gevonden.
En deze strategie wordt nu toegepast door een mens.

Het is niet zo dat hij 1-op-1 zetten uitvoert die een AI voorstelt.
Beter dan Chess-gpt die onmogelijke zetten gaat doen of zelfs dingen gaat inspawnen
Ik ben zelf meer een fan van 5D Chess With Multiverse Time Travel. Ben benieuwd hoe goed een AI daarmee omgaat. :)

[Reactie gewijzigd door The Zep Man op 20 februari 2023 11:45]

Ik ben zelf meer van quantum chess. Zodat je halve stappen kan maken en pas on collision zichtbaar worden :+

edit; steam link

[Reactie gewijzigd door jaenster op 20 februari 2023 11:46]

Jullie kunnen me wat met die moderne woordenbrei! Er gaat niks boven een lekker middeleeuws potje
Battle Chess!
Dat zal altijd zo zijn, een computer is gemaakt door de mens. En het is maar beter zo dat technologie niet de bovenhand krijgt. Zo is die ChatGPT en Bing Chat rommel van nu ook. Ik hoop echt dat het verdwijnt zo is het gekomen is. Ik wil niet in een wereld leven waar we tegen een hoop lood ijzer liggen te praten voor menselijk contact. Technologie wat de mens vervangt. Zijn we echt zo dom en niet wijzer dan dat ? Wat zoeken mensen in een nep wereld wat een computer je voorschotelt ? Het walhalla, het paradijs ? Tot je de stekker uittrekt en dat is met al die troep.

[Reactie gewijzigd door Meiklokje op 20 februari 2023 14:08]

Het verdwijnt niet maar wotdt wel verbeterd. Alles wat nu goed totnperfect functioneert was ooit van niveau "aardig maar wat heb ik er aan". Er is geen enkele reden te bedenken waarom we nu opeens niet meer door (zullen of moeten) gaan met verbeteren van wat er is. En technologie vervangt de mensen niet. Het zorgt er voor dat domme taken die een machine beter kan geen menselijke capaciteit verbruikt zodat we waar wij goed in zijn beter kunnen gebruiken. Ik laat liever offertes schrijven door AI en dat ik dan meer tijd kan door brengen met de mensen die ik lief heb en met werk wat voldoening brengt.

[Reactie gewijzigd door Frame164 op 20 februari 2023 14:51]

Op dit item kan niet meer gereageerd worden.

Tweakers maakt gebruik van cookies

Tweakers plaatst functionele en analytische cookies voor het functioneren van de website en het verbeteren van de website-ervaring. Deze cookies zijn noodzakelijk. Om op Tweakers relevantere advertenties te tonen en om ingesloten content van derden te tonen (bijvoorbeeld video's), vragen we je toestemming. Via ingesloten content kunnen derde partijen diensten leveren en verbeteren, bezoekersstatistieken bijhouden, gepersonaliseerde content tonen, gerichte advertenties tonen en gebruikersprofielen opbouwen. Hiervoor worden apparaatgegevens, IP-adres, geolocatie en surfgedrag vastgelegd.

Meer informatie vind je in ons cookiebeleid.

Sluiten

Toestemming beheren

Hieronder kun je per doeleinde of partij toestemming geven of intrekken. Meer informatie vind je in ons cookiebeleid.

Functioneel en analytisch

Deze cookies zijn noodzakelijk voor het functioneren van de website en het verbeteren van de website-ervaring. Klik op het informatie-icoon voor meer informatie. Meer details

janee

    Relevantere advertenties

    Dit beperkt het aantal keer dat dezelfde advertentie getoond wordt (frequency capping) en maakt het mogelijk om binnen Tweakers contextuele advertenties te tonen op basis van pagina's die je hebt bezocht. Meer details

    Tweakers genereert een willekeurige unieke code als identifier. Deze data wordt niet gedeeld met adverteerders of andere derde partijen en je kunt niet buiten Tweakers gevolgd worden. Indien je bent ingelogd, wordt deze identifier gekoppeld aan je account. Indien je niet bent ingelogd, wordt deze identifier gekoppeld aan je sessie die maximaal 4 maanden actief blijft. Je kunt deze toestemming te allen tijde intrekken.

    Ingesloten content van derden

    Deze cookies kunnen door derde partijen geplaatst worden via ingesloten content. Klik op het informatie-icoon voor meer informatie over de verwerkingsdoeleinden. Meer details

    janee