Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 88 reacties

Ook al heb je in elke hand een paar azen of een big slick, volgens onderzoekers van een Canadese universiteit is de kans nihil dat je ooit gaat winnen van hun computerprogramma in een potje Heads Up Limit Texas Hold 'Em-poker.

De onderzoekers van onder meer de Canadese universiteit van Alberta claimen in wetenschappelijk tijdschrift Science dat ze deze variant van Texas Hold 'Em, waarbij twee spelers tegen elkaar spelen, opgelost hebben. Nu is dat niet helemaal waar, want zo af en toe doet het programma een bet of juist een fold, maar concludeert het achteraf dat het beter iets anders had kunnen doen.

Opvallend is dat het programma met de naam Cepheus ook bluffen wiskundig aanpakt. Met dezelfde kaarten op hand en op tafel doet het programma niet altijd hetzelfde. Met een slechte hand doet het soms een bet, maar kiest het andere keren voor een fold.

Het is niet de eerste keer dat een computerprogramma beter wordt in een spelletje dan zelfs de beste menselijke spelers. Met schaken en dammen gebeurde dat ook al, maar met poker ligt dat anders. In dat spel zijn namelijk niet alle elementen zichtbaar, doordat zowel de kaarten van de tegenspeler als sommige kaarten op tafel bij begin van de hand niet te zien zijn. Daarom hebben de onderzoekers het programma ook gericht op een vorm van poker met slechts een enkele tegenspeler. Met meerdere tegenspelers zou het programma op zoek moeten naar complexere oplossingen.

De onderzoekers hebben de pokersoftware getraind door het tegen zichzelf te laten spelen en vervolgens die potjes te analyseren. Ze denken dat het programma ook nut kan hebben buiten poker, maar hoe dat er precies uit gaat zien, weten ze nog niet.

Er is nog een troost voor mensen die niet zo goed zijn in poker. Het programma heeft namelijk moeite met zwakkere spelers, omdat de strategie van het programma daarin te conservatief is om dik te kunnen winnen.

Dit is een artikel in de nieuwe .geek-categorie. In deze categorie brengen we onderwerpen die niet binnen het stramien van nieuwsberichten vallen, maar vanwege de hoge geek-factor wel leuk zijn om te brengen. De komende tijden kun je hier meer artikelen, video's, links enzovoorts verwachten.

Texas Hold 'Em

Deze hand is niet genoeg om dit geavanceerde computerprogramma te verslaan

Moderatie-faq Wijzig weergave

Reacties (88)

Even vooropstellen dat dit om LIMIT Hold'em gaat, waarbij de grootte van je inzet niet te varieren is. Hierdoor worden de opties een stuk versimpeld. De variant die nu populair is en veelal gespeeld wordt is No-Limit hold'em, waarbij je met elke bet in kan zetten hoeveel je wil. Er is momenteel nog geen bot die met deze variate goed overweg kan. Natuurlijk zijn er wel bots die winstgevend kunnen spelen tegen slechte spelers.

Er wordt overigens al jaren gewerkt aan bots die heads up limit holdem uitrekenen, waarbij regelmatig een bekende professionele speler uitgedaagd wordt door een bot om 10,000+ handen te spelen.
[door dezelfde groep zelfs: bron]

De online poker rooms hebben aardig wat analysesoftware draaien om te zien wat er op clientside gebeurt, en er komt ook regelmatig wat naar buiten.

EDIT: leuke quote uit het artikel trouwens: However, we also echo a response attributed to Turing in defense of his own work in games: “It would be disingenuous of us to disguise the fact that the principal motive which prompted the work was the sheer fun of the thing”

[Reactie gewijzigd door TwisterX op 9 januari 2015 10:46]

Even een aanrader als je een langer artikel wilt lezen wat hier wel allemaal meer op in gaat:
Instead, they worked on developing a program that could defeat top players at heads-up limit poker, "the simplest game of poker humans play," Bowling says. In 2008, they were successful. That program, called Polaris, lost to professional players Phil "The Unabomber" Laak and Ali Eslami a year prior, but when the researchers improved it, it won three out of six games and tied another.
[...]
After Polaris beat the top players, Bowling and his team had to make a decision about what to do next. Were they going to try to solve two-player limit Texas hold’em, a more complicated game? "Someone did a back of the envelope calculation and it came out that we would need four petabytes of disk space [1,000,000 gigabytes], just to write down the solution after we solved the game," Bowling says. "At the time, I said, 'well I guess we can’t solve it then, so let’s move on.'" But other researchers on his team insisted; buying petabyte disks was possible, after all.
Dat en meer: www.theverge.com/2015/1/8...-computer-program-cepheus
En als je een boek wil lezen hoe je wiskunde toe kan passen op poker is the Mathmatics of Poker door Bill Chen en Jarrod Ankenman geweldig!
http://www.amazon.com/The...r-Bill-Chen/dp/1886070253

Wel een beetje droge kost... }>

[Reactie gewijzigd door TwisterX op 9 januari 2015 16:58]

Ja ik was al vrij lang geleden benaderd verschillende bots te bouwen die dit kunnen. Ook eens een keertje een groepje gasten uit Las Vegas (maar betalen ho maar).

Probleem van die bots is dat niemand tegen zo'n bot wil spelen natuurlijk.

Pokeren gaat om geld simpelweg. Tegen een bot verdien je in the end nooit geld, dat is het kernprobleem.

Kijk maar eens naar backgammon ook - zelfs vrij knullige bots uit het verleden daar zijn echt totaal onverslaanbaar.
Wat ook belangrijk is om te vermelden is dat het hier gaat om Limit hold'em. Dit staat in het artikel maar er wordt verder niet echt op ingegaan. Limit houdt in dat elke bet die je doet van een bepaald bedrag moet zijn.

Dit is echter niet het meest populair op het moment. No Limit is veel populairder en het schijnt dat het nog heeeel lang gaat duren voor een computer daarin beter gaat zijn dan de mens omdat het aantal variabelen daar veel groter is. Het zal uiteraard een kwestie van tijd zijn voordat ook dat 'gekraakt' gaat worden.
Betekent dit dat je dus eigenlijk beter niet meer online kan gaan pokeren? Als een van je medespelers aan "tafel" dit programma op de achtergrond heeft meedraaien, dan kan je winnen wel op je buik schrijven...
Vraag is dan wel wat er gebeurt als er 2 of meer spelers ook het programma hebben draaien.
"We’re not saying that it’s guaranteed to win money on every single hand," says Michael Bowling, a computer scientist at The University of Alberta and a co-author of the study. "What we’re saying is that, in the long run, if you looked at all the hands that could happen and you averaged all of those, then the computer can’t be losing, at a losing rate — it has to be either breaking even or winning."
Daarnaast is het nuttig te begrijpen dat het systeem is gemaakt door veel tegen zichzelf te spelen
"We had this training phase where the program started off playing uniform random against itself,"
en
The training phase took 70 days, and a cluster of 200 computers, each armed with 32 GB of ram and 24 central processing units, Johanson says. At the end of those 70 days, Cepheus’ game was nearly perfect. "We could continue to train it, and it would continue to get better," Bowling says. "But we stopped at this point because we can’t tell it apart from being perfect." Even if the program spent a lifetime in training, he says, getting it any closer to perfect really wouldn’t have much value — "other than the academic novelty." In short, training Cepheus further wouldn’t change how successful the program is in any noticeable way.
Bron: http://www.theverge.com/2...-computer-program-cepheus
Als er 2 bots het perfecte spel spelen (wat er dus gebeurd als er 2 dezelfde bots tegen elkaar spelen) dan is het puur een kansspel :)

(bij headsup hold'em uiteraard)

[Reactie gewijzigd door fommes op 9 januari 2015 11:48]

Nee. Dan zou theoretisch geen van de twee winnen en het spel oneindig lang doorgaan.
Nee, want door het toevalselement is gegarandeerd dat er een serie handen komt die een speler al zijn geld laat verliezen. In oneindige tijd zal er bijvoorbeeld altijd een serie komen van laten we zeggen 100x AA voor een speler. En als dat niet genoeg om te winnen, komt er nog wel een serie van 1000x AA voorbij.

Let wel, het spel moet gespeeld met een eindige hoeveelheid geld, anders komt er inderdaad geen einde aan het spel. En als jij persoonlijk gaat pokeren met een oneindige hoeveelheid geld, dan win je ook gegarandeerd van iedereen met een eindige hoeveelheid geld. Een oneindige hoeveelheid geld is dus gewoon niet zo leuk spelen. ;)
Het programma kan nog maar tegen 1 andere speler;) maar ik snap je punt wel als het programma tegen elkaar moet.

Ik denk dan met wie telkens de beste hand heeft gekregen dat is dan nog als enige waar het verschil in kan zitten.
Nee, dat zal mee vallen. Hij is alleen getraind in heads-up hold'em poker.
Een tafel met 6 man geven teveel variabelen, en dan zijn de kansen jou op verlies een stuk kleiner.

Denk dat het enige wat die 'bot' doet is statistieken berekenen, en poker is nog altijd meer dan enkel statistieken, Ondanks bluff bets leert hij als iemand een bluff called, het niet altijd handig is om te bluffen ... Dus wat leert dat ding? zichzelf tegenspreken :)

[Reactie gewijzigd door Zilverdael80 op 9 januari 2015 10:35]

poker is nog altijd meer dan enkel statistieken,
Dat geld alleen als je kan communiceren met de andere spelers, ze kan zien en/of kan horen. Dan kun je op basis van gezichtsuitdrukking/stem etc. bepalen of ze bluffen. Maar uiteindelijk valt dat ook allemaal in statistieken vast te leggen.

Bij internetpoker waarbij je elkaar niet kan zien/horen/chatten kun je ook statistieken per speler vastleggen over hun pokergedrag en dan is het wel weer alleen statistieken geworden.
In de basis heb je gelijk: poker is een statistische game, zowel online als offline. Je tegenstander heeft altijd een bepaalde range aan mogelijke handen. Het is aan jou als speler om deze range beter in te schatten. Dit kan je doen door:
- Statistiek: Van de afgelopen 10x dat hij bette op de river en we een showdown hadden, had hij 7x een paar of beter, 2x een missed draw en 1x een totale bluff.
- Tells. Hij zit aan zijn neus te krabben, hij kijkt naar linksboven, het duurt 15 seconden voordat hij de bet maakt, etc.
- Metagame. Ik heb al 3x een bluf succesvol gecalled, hij handelt nu anders dan de afgelopen 50 handen. Er is een speler aan tafel komen zitten die erg slecht is, zijn handrange is nu ruimer geworden.

En zo zijn er nog meer variabelen.

Statistiek kan je als basis gebruiken om beslissingen te maken, maar het is nooit alleen genoeg. Je moet altijd een inschatting maken hoe relevant de statistiek is en dit is met internetpoker net zo aanwezig als met online poker.

[Reactie gewijzigd door TwisterX op 9 januari 2015 11:14]

Afgelopen jaren is online natuurlijk het aantal 'slechte spelers' dramatisch gereduceerd. Daar nu nog geld meer verdienen is heel lastig - afgezien van het gerommel van die servers zelf.

Je kunt zo'n bot overigens continue verbeteren. Spelen op de ene casino en de andere maakt ook veel uit.

Zo gebruiken veel nerds voor thuissituaties vaak een RNG om de kaarten te schudden. Kijk dat is geen goed idee. De spread is te perfect daar. Die is beter dan O ( n log n ) namelijk, terwijl dat niet zou moeten mogen (ja ook mersenne twister heeft dat probleem). De eerste paar online casino's die gebruikten nog speciale hardware om die getallen te genereren - dat is stuk beter (geen goedkope apparaatjes overigens om aan te schaffen) maar op gegeven moment is het altijd hetzelfde met die mafiosi, die willen MEER GELD verdienen (net als de bitcoin exchanges). Dat lukt niet op legale manier natuurlijk.

Dus op het moment dat je online gaat zijn er ineens 100 variabelen waar je ook rekening mee moet houden en kun je je softwareprogrammaatje maar blijven verbeteren.

Waarom dit het nieuws haalt weet ik niet - in elk geval aan mij wilde geen hond geld dokken voor superieure software daar. Kijk je mag ook niet legaal met zo'n programma online spelen en reken maar dat ze langs komen om te kijken hoe je 't "doet".

Wel is er geen haar op mijn hoofd dat er aantal zijn die op deze manier rommelen online. Als je gewoon kijkt naar wat profspelers die online speelden en eerst VET geld verdienden, terwijl die hooguit 1 of 2 foutjes per 1000 handjes maken - en dan toch feitelijk TEGENWOORDIG laag uurloon pakken (dat is hoe je 't uitrekent voor een prof - de verdiensten per uur).

Terwijl je weet dat er op de hele aardkloot niet zoveel goede spelers zijn die zo weinig fouten maken.

Dan snap je dat er heel veel aan de hand is in dat online pokeren.
Een aantal punten waar ik het niet mee eens ben:

- Het doorzien van bluffen betekent niet dat elk aspect van poker wiskundig statistiek is.
- Bluffen is niet het enige, onvoorspelbaarheid is ook erg belangrijk voor de topspelers (en dus ook voor deze computer, als hij claimed 'altijd' te winnen).
- Het is niet automatisch zo dat je in het echt beter kan zien dat iemand bluft. Je hebt mensen met goede pokerfaces, sommige zetten zonnebrillen op, maar ook spelers die gewoon met onbedekt gezicht manipulatie en reverse psychology toepassen (mijns inziens de meeste interessante spelers).

In de top zie je dat spelers af en toe 'gekke' dingen doen. Dit is een belangrijk aspect en hangt absoluut samen met bluffen. Het doel is onvoorspelbaarheid. Maar dit geldt evenzo online voor langere toernooien. Waarom is dat zo belangrijk?

Als een speler te voorspelbaar gaat spelen (en dus ook niet bluft) weet je eigenlijk aan de hand van zijn inzetgedrag ongeveer wat hij heeft, of tenminste, je kan de 'waarde' vrij goed inschatten van zijn hand. En als je dat weet, kun je ook met grotere zekerheid je kansberekening inzetten.

Andersom als je dus wel onvoorspelbaar speelt, kan de ander niet beredeneren wat jij hebt. En dit is net zo belangrijk als dat jij weet wat de ander heeft. En hierin zit denk ik de kracht van deze pokerbot, namelijk dat een persoon zijn inzetgedrag moeilijk kan doorgronden. Alleen dan kun je de statistiek zo inzetten om echt winst te maken, immers als je beide enkel statistisch bezig bent, en dit even goed doet zou je quite draaien.

Deze aspecten hebben ook tot gevolg dat als je elke hand statistisch optimaal speelt, je totale spel niet automatisch ook optimaal is.

[Reactie gewijzigd door A Lurker op 9 januari 2015 12:54]

De goede profs als je die uitrekent met software erbij, dan zie je dat ze de statistieken heel goed kennen. Die bluffen dus heel weinig als statistisch kans laag is dat ze zo'n hand hebben. Die volgen die statistieken intuitief geniaal. die Gekke dingen doen ze dus heel weinig. Als iets maar 10% kans heeft, dan doen sommigen dat als je het uitrekent ook echt maar in 10% van de gevallen. Echt geniaal hoor.

Dus software dat statistisch goed is, die is echt onverslaanbaar, alleen door nog betere software verslaanbaar. Wel kun je blijven tweaken aan software. Meer variabelen laten meewegen om de statistiek nog beter en verder achter de komma uit te rekenen en door te rekenen.

Een claim is dit niet. Het is natuurlijk al keihard bewezen in backgammon.
Dan moet je slechter worden, of echt onverwachte dingen doen, daar kan het programma slechter mee overweg.
Nee, nog niet, omdat dit programma alleen werkt in een twee-speler variant. Zolang er meer spelers zijn, zal je dus op dit moment nog geen last hebben van dit programma. Wellicht wel van andere programma's die ook een voordeel kunnen geven.

Online poker zou ik sowieso niet vertrouwen trouwens. Je hebt geen enkele manier om te controleren of alles wel eerlijk verloopt, het dealen zuiver gaat, en iedereen dezelfde informatie krijgt.
Er wordt enorm gerommeld online.

De feiten zijn keihard.
Dit soort 'rekensoftware' bestaat al vrij lange tijd, op basis van gegeven kaarten en kansberekeningen komen er een aantal scenario's uit waar programma aangeeft wat je beste opties zijn.
Goed lezen. Alleen Heads Up Texas Hold'em is gekraakt. Als je online met meer dan 2 spelers bent dan is er dus nog geen bot die beter speelt dan de beste mens. (Voor zover wij weten :) )
Uit het artikel:
deze variant van Texas Hold 'Em, waarbij twee spelers tegen elkaar spelen
Er is dus zeker geen sprake van "één van je medespelers". Daarnaast wordt deze variant nauwelijks online aangeboden; juist omdat het een 2-speler spel is. Dus nee, geen enkel risico als je online gaat spelen.
Betekent dit dat je dus eigenlijk beter niet meer online kan gaan pokeren?
Ja, maar dat was ook al zo voordat dit programma er was. Online casino's hebben nou niet de naam eerlijk te zijn.
Online pokeren is sowieso al geen goed idee...
Iemand heeft me wel eens uitgelegd hoe hij met zijn oplichtervriendjes online ging pokeren en dat ze de boel dan zo wisten te manipuleren dat ze met zijn 3en aan dezelfde tafel uitkwamen en zo de 4e persoon aan die tafel volledig uit konden kleden (door samen te werken).
Online poker is juist wel een goed idee, als je het spel ook maar een beetje studeert. Dat bewijzen de vele winnende spelers.
Tuurlijk ga je altijd valsspelers hebben, en ooit ga je zelf ook wel eens een valsspeler tegenkomen, maar op het einde van de rit ga je nog altijd een paar grootte-ordes meer geld winnen van slechte spelers, dan dat je gaat verliezen aan valsspelers. Bovendien mag je niet onderschatten hoe de grotere sites constant op zoek zijn naar valsspelers, hetzij via eigen algoritmes, hetzij na post-mortem onderzoek als er klachten komen van spelers.
Er zijn genoeg verhalen bekend van valsspelers of bots, die uiteindelijk wel ontmaskerd werden, hetzij door de site zelf, hetzij door de community.
Als je tegen een bot zou spelen wel, maar in een pokergame met alleen echte tegenstanders? Daar wordt 'het huis' niet beter van, hoor.
Als je niets van een onderwerp afweet, dan zwijg je beter. Zelfs op de laagste stakes kun je op lange termijn (>1j) al snel leuke bedragen winnen als je er maar voldoende tijd in steekt. Dat heeft niets te maken met geluk en al zeker niets met een piramide spel.
Toen ik ettelijke jaren geleden begon met een bescheiden deposit, dacht ik ook dat ik het over enkele maanden tijd wel kwijt zou zijn, en had ik ook het grootste wantrouwen in uitbaters en tegenspelers. Realiteit bleek dat de tafels vol zaten van uiterst slechte spelers die zelfs vaak nauwelijks benul hadden van de spelregels, laat staan van strategie. Die paar maand later had ik mijn inzet vertienvoudigd ipv kwijt gespeeld. Vandaag zal dat al iets moeilijker zijn, maar met wat basis strategie kennis kan je op de laagste stakes zonder twijfel al winnend spelen.

EDIT: dit is overigens een discussie waar menig pokerspeler echt moe van wordt, terwijl de gedediceerde poker-fora gewoon volzitten met spelers die op lange termijn al lang bewezen hebben dat er ondanks alles zeker winnend te pokeren valt.

[Reactie gewijzigd door Twixie op 9 januari 2015 13:01]

Op de lange termijn (zoals bij een toernooi) zal dit programma inderdaad (alle) spelers kunnen verslaan, maar dat geldt naar mijn mening niet voor een individuele hand (zoals een individuele cash game). Eerder is al (door statistische experts, zie onder meer http://www.kennislink.nl/...ker-geluk-of-behendigheid) aangetoond dat bij cash games geluk doorslaggevend is (of meer doorslaggevend dan bij toernooien). Bij een toernooi ligt dat wat anders (omdat door de opeenvolgende handende invloed van het kanselement afneemt, en meer tactiek toegepast kan worden).

De vraag is of een potje, zoals in de titel genoemd, een hand of een toernooi is. Ik moest zelf meteen aan een hand denken.

[Reactie gewijzigd door pietje63 op 9 januari 2015 10:27]

Met een 'potje' wordt zeker geen hand bedoeld, want daar speelt geluk nog steeds een doorslaggevende factor.
Maar zelfs in een toernooi heb je echt nog wel een goede kans om van dit programma te winnen. Natuurlijk, het programma is favoriet, maar het is gewoon een statistisch feit dat als je een kans p hebt om 1 handje te winnen, dat er dan ook een kans p^n is om n handjes op rij te winnen.
Kortom, hoe goed de computer ook is en hoe slecht jij ook bent (nou ja, als je tenminste maar niet iedere hand fold), er bestaat altijd een kans dat je een toernooi wint.

Daarbij komt nog iets anders. Dit programma speelt theoretisch perfect, wat betekent dat er geen enkele strategie is waarmee je op de lange duur van hem kan winnen.
Maar dat wil niet zeggen dat het ook tegen iedere tegenstander de meest optimale/ winstgevende strategie kan vinden. Daar spelen ook andere factoren een rol, zoals bv mensenkennis en het ontdekken van 'tells'.
Ik denk dat je heads-up tegen dit programma nog steeds een veel betere kans hebt om te winnen dan wanneer je tegen een top poker speler zou spelen.
Iedere hand wordt steeds opnieuw bekeken. Een potje poker is geen hand, maar totdat iemand alles verloren heeft of stopt. Als je het artikel leest, zou je tegen een redelijk/hoog niveau tegenstander stand-up altijd winnen. Wat vrij gevaarlijk is voor de online poker markt...

Zodra ze het ook naar een niveau weten te tillen waarbij het programma goede beslissingen kan maken op volle tafels, dan is het helemaal klaar. Het zijn vast wetenschappers, maar dan zet je gewoon je pokerbot 24/7 aan om geld binnen te harken.
zo'n programma is voor de goede schaakprogrammeurs niet zo lastig te bouwen. Dat is echt 6 maanden project voor me hoor.

Helaas wil niemand betalen voor zulke software.

Wel kun je natuurijk als software onderling speelt eindeloos tweaken.

Kijk het is de mafia. Die komen langs. Maken foto's van je huis als jij jaarsalaris verdiend hebt met 20k potjes. Bellen aan: "hallo, goedendag, ik heet Luizi Romana, ik wil u een gift certificaat aanbieden voor een gratis hapje in onze casino!". En dan zitten ze binnen. Als op dat moment jij nog een handje zit te spelen online, dan ben je dus de lul. Met wat pech ook hand of oog kwijt als het ze vet geld gekost heeft.

Dus het inzetten ILLEGAAL van software online is niet zo simpel, want zoveel figuren kunnen niet foutloos spelen.

Andersom kan het statistisch gewoon niet meer kloppen wat op de grotere en bekendere pokerservers ondertussen gebeurd.

Kijk van alle spelers worden statistieken bijgehouden. Die database kun je kopen overigens en je op abonneren.

het is voor zo'n casino simpel om een speler op te voeren die af en toe wat prijzen pakt, wat dus winst is voor het huis, terwijl die speler dan in andere toernooitjes het weer beetje laat afweten waardoor hij gemiddeld gesproken NIET OPVALT als speler.

Iemand die "af en toe geluk heeft". Dat lukt elke middelbare scholier al om te bouwen laat staan Luizi's collega.

Vandaar dat ze ook dat hele goede pokerprogramma niet wilden bestellen bij me. Oh ter zijde - dat kost stuk minder dan een jaarsalaris.

Het is veel simpeler om zo iets te bouwen dan je denkt. Maar de manier waarop de geldstroom werkt - dat werkt heel anders.
Een hand is onmogelijk om altijd te winnen, en daarom denk ik dat het om een toernooi gaat, of misschien is een potje totdat de ander geen chips meer heeft. Daarom heet het ook een potje en geen hand. Echter vind ik dan het commentaar onder de foto erg verwarrend
Deze hand is niet genoeg om dit geavanceerde computerprogramma te verslaan
Want met die hand kan je die computer juist WEL verslaan.
Zodra de computer namelijk fold, wat deze volgens het artikel kan, heb jij namelijk de hand gewonnen en dus de computer verslagen. Het potje is dan echter nog niet voorbij.

Ik ben wel benieuwd hoe deze altijd kan winnen van iedereen, gezien poker nog steeds erg afhangt van welke kaarten je krijgt en je als computer niet kan uitrekenen wat de volgende X-aantal handen zijn die je of je tegenstander krijgt, terwijl je dit bij schaken wel kan uitrekenen als computer zijnde. Daar bekijkt de computer per zet met hoeveel zetten en met hoeveel kans hij de koning schaakmat kan zetten en kiest dan die met de grootste kans. Dit is bij poker niet mogelijk en ik denk daarom ook dat het een beetje voorbarig is om te zeggen dat er niet te winnen valt van deze computer. Maargoed, ze zullen het wel allemaal goed getest hebben voordat ze het naar buiten brachten, haha!
Profspelers online spelen niet 1 handje. Die spelen er 1000.

Sommigen spelen op 10 bordjes tegelijk. Ken een geval van profspeler die 20 handjes tegelijk speelde op sommige momenten.
Ik heb helaas geen abonnement op de Science en kan het oorspronkelijke artikel dus niet lezen, maar, afgaande op de samenvatting van de auteurs, geloof ik niet dat het resultaat hier door de redactie correct is weergegeven.

Ten eerste, waarschijnlijkheden spelen een grote rol in Poker. Als ik consequent een betere hand krijg dan het programma en nooit fold, dan kan dat programma nog zo goed spelen, het zal toch niet winnen. Waarschijnlijk hebben de auteurs gewoon verwachtingswaarden of zo gebruikt.

Ten tweede, de auteurs schrijven dat ze het spel "essentially weakly solved" hebben. Laten we het woord "essentially", wat suggereert dat het ze het toch eigenlijk niet opgelost hebben, even wegdenken. Ook in spellen waar waarschijnlijkheid geen rol speelt, betekent "weakly solved" niet dat ze een programma hebben geschreven dat altijd wint. Het betekent dat ze een programma hebben geschreven dat *voor een bepaalde speler* altijd maximaal resultaat behaalt. Zo is bijvoorbeeld Vier op een rij opgelost, omdat *de eerste speler*, bij perfect spel, altijd wint. Als die perfecte speler de tweede speler is kan hij nog steeds verliezen. Aangezien de auteurs ook vermelden dat ze bewezen hebben dat de deler een behoorlijk voordeel heeft, neem ik aan dat dat hun resultaat het volgende is: ze hebben een programma ontwikkeld dat, als het de deler is, een in zekere zin maximale verwachtingswaarde realiseert. Maar nogmaals, ik kan helaas het artikel zelf niet lezen.
Uit het artikel:
Allis (26) gave three different definitions for solving a game. A game is said to be ultraweakly solved if, for the initial position(s), the game-theoretic value has been determined; weakly solved if, for the initial position(s), a strategy has been determined to obtain at least the game-theoretic value, for both players, under reasonable resources; and strongly solved if, for all legal positions, a strategy has been determined to obtain the game-theoretic value of the position, for both players, under reasonable resources. In an imperfect-information game, where the game-theoretic value of a position beyond the initial position is not unique, Allis’s notion of “strongly solved” is not well defined. Furthermore, imperfect-information games, because of stochasticity in the players’ strategies or the game itself, typically have game-theoretic values that are real-valued rather than discretely valued (such as “win,” “loss,” and “draw” in chess and checkers) and are only achieved in expectation over many playings of the game. As a result, game-theoretic values are often approximated, and so an additional consideration in solving a game is the degree of approximation in a solution. A natural level of approximation under which a game is essentially weakly solved is if a human lifetime of play is not sufficient to establish with statistical significance that the strategy is not an exact solution.
Maken ze hier geen onderscheid tussen gedeeltelijk (met héél veel mogelijke uitkomsten) en het volledig simuleren van de games? Iets wat in het artikel op kennislink http://www.kennislink.nl/...old-em-wat-zijn-je-kansen blijkbaar al veel eerder is gebeurd en zelfs met 3 spelers?

[Reactie gewijzigd door Masterijn op 9 januari 2015 13:51]

Ik snap niet echt waarom ze in je artikel zonodig alles willen simuleren om de kansen te berekenen. Het is namelijk ook wiskundig te berekenen wat de winkans van hand XX tegen een distributie handen van (pre-flop) 52-2 willekeurige handen is.

Je kan het zelfs ook aardig uit je hoofd uitrekenen binnen een paar seconden op 1-2% nauwkeurig, maar voor hand reviewing is er ook genoeg software waarbij je rekening kan houden met een selectie uit de mogelijke distributie van handen die je tegenstander had.
Dat wil ik je weleens wiskundig zien doen. In een 2 speler spel krijg je een 5 en 6 suited, wat is de exacte kans dat je gaat winnen?
Wil je dit wiskundig goed doen dan zal je voor iedere "gelijkwaardige eindsituatie" moeten bepalen hoe vaak deze voor zou kunnen komen. Dus de kans op 55-xxxxx ..., 66-xxxxx ..., waarbij xxxxxx de combinatie niet meer waarde maakt dan je pair. Dan mag je dat ook doen 555-xxxx, .. voor alle combinaties met een straatje, flush, royal flush etc.
Daar tegenover mag je dat ook doen voor de tegenstander, maar dan rekening houdende dat de 5 en 6 voor hem uit het spel zijn. Wat weer heel veel eindcombinaties uitsluit (hoe vaak dat dat voorkomt bij welke combinatiewaarde, moet je ook weten)
Dus voor het bepalen van de exacte kans moet je je berekening voor zoveel verschillende eindsituaties apart doen, dat dit niet meer niet geautomatiseerd te doen is. Het denkwerk dat er bij komt kijken is ook niet misselijk.
Bruteforce simuleren is dan echt eenvoudiger.
Het antwoord waarom je de kans exact zou willen weten, is niet omdat dit voor één hand veel verschil maakt, maar wel als je er miljoenen zou spelen.

[Reactie gewijzigd door Masterijn op 10 januari 2015 18:40]

Bedankt voor de quote. Daaruit blijkt inderdaad dat ze stochastische waardes gebruiken (en het dus onwaar is dat dit programma niet kan worden verslagen) en ten tweede blijkt er uit wat "essentially weakly solved" betekent.

Ze hebben dus een programma geschreven dat zo goed Poker speelt dat het in de praktijk onmogelijk is -- door middel van experimenten -- met statistische significantie aan te tonen dat er betere spelers bestaan. Daarvan maakt de Tweakersredactie dan: "Je kunt een potje Poker niet winnen van dit computerprogramma." :-)
Met als klein probleem dat ik toch wel iets kan pennen (software) wat van ze wint - want hun programma zal uitgaan van een goede spread van de RNG, terwijl in werkelijkheid er hardwarematige RNG's door sommige casino's ingezet worden. Je kunt blijven tweaken aan die software.

Maar sure - geen mens wint daarvan als je 1000 handjes speelt.
Limit holdem is ook niet echt een variant wat veel gespeeld wordt.
Mede omdat het bij mijn weten al een flinke tijd als 'solved' beschouwd wordt.
Ik zou best een keer een potje heads-up willen spelen tegen dat programma
Op de site moet je het uit kunnen proberen: http://poker-play.srv.ualberta.ca/

Al lijkt de site nu niet goed te werken.
Leuk :) Ik hou wel van dit soort CS-gerelateerde berichten.
Precies. Meer van dit soort achtergrond graag.
Door een volledige simulatie bijv. wat hier gedaan is: http://www.kennislink.nl/...old-em-wat-zijn-je-kansen kun je heel precies de kansen achterhalen. Dit is wat software op een computer altijd beter zal kunnen doen dan een mens. De gokstrategie van een computer is niet per definitie beter. Dus ik durf wel te stellen dat een computer uit miljoenen games meer winst kan halen, maar bij een beperkter aantal speelt "geluk" danwel het gokken de grootste rol. En iedere gokstrategie heeft een tegenhangende strategie die deze goed parreerd en ook een mens kan hierin wisselen.

[Reactie gewijzigd door Masterijn op 9 januari 2015 11:28]

Dat is een afschatting van de kansen die in de buurt komen van de werkelijkheid, maar nooit exact ok is voor het spel wat je nu speelt.

Er valt veel te tweaken aan die software. Kijk voor 990 van de 1000 kaarten die je uitspeelt zal betere software het niet anders doen, maar binnen die 10 andere kaarten KUNNEN er verschillen zitten in wat je uitspeelt.

Er zijn best wel wat parametersdie van casino tot casino verschillen.

ik zal een paar variabelen opnoemen maar er zijn er dozijnen:

a) zit je tegen een speler van het casino zelf te spelen? (eentje die dus altijd wint als ze willen), wat simpelweg betekent dat als je inschat dat dat het geval is, dan kun je je programmaatje niet zo vaak laten bluffen - of liever helemaal niet. Zo'n casinospeler zal in een toernooitje niet altijd de hoofdprijs willen winnen (want dan valt hun manipulatie te veel op), maar wel EEN prijs willen pakken (die ze dan lekker niet hoeven uit te keren).

b) die gasten in ualberta hebben de ballen verstand van RNG's - de RNG die online casino's inzetten verschilt van casino tot casino. Die informatie is bij eerlijke spelletjes van cruciaal belang voor de doorrekening van je kansen.

De simpelste manier is een RNG (random number generator) pakken die als goedbekend staat en die je zou willen inzetten. Dan laat je die simpelweg om de beurt een getalletje produceren van 1 tot 65536
Je streept op je kanskaart af als een getal wordt getrokken. Dan ga je kijken na hoeveel getalletjes getrokken te hebben ze allemaal op je kaartje zijn doorgestreept.

Je zult dan zien dat die amateurs in Ualberta RNG's gebruiken die altijd. Dus in 100% van de gevallen daar minder dan O (n log n) getalletjes voor nodig hebben. Dramatisch minder zelfs.

terwijl als je dat projecteert op de getallen die in echte casino's vallen projecteert, dan heb je nog fiks wat getalletjes staan hoor :)

IN LEKENTAAL: de ualberta amateurs zoals gewoonlijk niet in de buurt qua nivo van wat we hier in NL hebben, daar is bijvoorbeeld de kans dat als je al 2 azen in je handen hebt, dat een 3e aas tevoorschijn komt te klein. Het zit niet genoeg achter elkaar. Het is TE GOED geschud bij de uni amateurs.

Kortom er zijn continue factoren op grond waarvan je de berekeningen moet aanpassen. Klaar ben je daar nooit mee :)

[Reactie gewijzigd door hardwareaddict op 10 januari 2015 04:16]

Succesvolle bots voor Limit Holdem bestaan al veel langer. Maar dit is wel weer een overtuigend argument dat poker meer is dan alleen een kansspel.

Op dit item kan niet meer gereageerd worden.



Apple iOS 10 Google Pixel Apple iPhone 7 Sony PlayStation VR AMD Radeon RX 480 4GB Battlefield 1 Google Android Nougat Watch Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True