Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , 75 reacties
Submitter: annedeg

De Zuid-Koreaanse wereldkampioen Lee Sedol heeft in de vierde ronde toch nog Googles DeepMind-programma AlphaGo weten te verslaan in het Chinese bordspel go. De competitie kan Lee niet meer winnen, maar hij heeft wel aangetoond dat AlphaGo nog niet onverslaanbaar is.

De vierde match in de go-competitie van mens versus kunstmatige intelligentie eindigde in een overgave door AlphaGo na bijna vijf uur spelen en 180 zetten in totaal. Bij zet 78 wist Lee een offensief op te zetten waar AlphaGo niet op voorbereid leek te zijn en de daaropvolgende zet van de kunstmatige intelligentie, nummer 79, was volgens de commentatoren dan ook een fout. Op het moment dat AlphaGo de handdoek in de ring gooide, wat het doet wanneer het de kans op een overwinning lager inschat dan 20 procent, barstte het Koreaanse publiek in het Four Seasons Hotel in Seoul uit in een luid applaus.

In de nabeschouwing werd ervan gesproken dat Lee de spanning waar hij met name in de derde ronde onder leed niet meer voelde. Het draaide immers niet meer om de gehele competitie omdat AlphaGo al het merendeel van de best-of-five-reeks gewonnen heeft. Toch heeft de Zuid-Koreaan hiermee aangetoond dat kunstmatige intelligentie op het gebied van go spelen tegen menselijke tegenstanders nog niet volmaakt is. AlphaGo, dat draait op een array van 170 gpu's en 1200 cpu's, komt wel weer een stap dichter bij dat doel dankzij deze nederlaag. De deep neural networks van AlphaGo kunnen het verloop van deze wedstrijd analyseren en er weer lering uit trekken.

Het laatste van de vijf go-potjes wordt aanstaande dinsdag gespeeld. Het prijzengeld, een miljoen dollar, dat Google in de wacht heeft gesleept, gaat naar verschillende goede doelen. Het nieuwsbericht over de derde ronde van de go-competitie gaat ook gepaard met uitgebreide achtergrondinformatie over Googles kunstmatige intelligentie AlphaGo.

Moderatie-faq Wijzig weergave

Reacties (75)

Wait, what? 170 GPU's en 1200 CPU's 8)7. Is wel heel erg veel wat je nodig hebt om een zeer professionele speler te verslaan. Leuk voor Lee Sedol dat hij tóch nog 1 match heeft kunnen winnen, of misschien nog wel de laatste match :). Nu kan Google zijn systeem weer verbeteren.
Dat is echter niet zo veel als je kijkt naar het aantal neuronen en verbindingen in een menselijk brein, want dat zijn er veel meer. Echter, het aantal transistoren in al die rekenkernen (~ het aantal verbindingen) is wel weer gigantisch veel groter.

Het illustreert hoe efficiënt het brein is: met slechts ‘enkele’ verbindingen toch zo goed zijn in bepaalde taken. Als men hetzelfde probeert te doen met machines, zoals AlphaGo dat probeert, dan heb je zoveel meer verbindingen en energie nodig (en bovendien een mens die de zetten voor je uitvoert en invoert), dat het echt inefficïent te noemen is. Het is te vergelijken met de inefficiëntie van de allereerste verbrandingsmotor of stoommachine in vergelijking met de huidige elektromotoren.

Het is bijzonder knap dat men de Go-wereldkampioen kan verslaan, maar het is net als David (Lee Sedol) vs. honderden Goliaths (AlphaGo met z'n rekenvermogen, een ‘domme’kracht): met zoveel overmacht kun je zelfs een enkele verfijnde speler verslaan.

Het is ook tekenend voor wat men allemaal nog gaat optimaliseren en verbeteren, want wat AlphaGo nu kan, kan jouw smartphone/smarthome/smartcar/smart*** over 5 à 15 jaar.
Dat is en beetje appels met peren vergelijken, het brein werkt totaal anders als een computer. Maar we kunnen het proberen.

Het aantal neuronen in een menselijk brein is rond de 86 miljard en die hebben allemaal 100'en tot 1000'en synapsen en een schatting van het aantal synapsen zit op 150.000 miljard.

http://www.dana.org/News/Details.aspx?id=43512

Een moderne high-end GPU zit op zo'n 8 miljard transistoren, die hebben allemaal maar 3 aansluitingen. Een moderne CPU zo'n 5 miljard (18 core) 1200*5 + 170* 8 = 7.360 miljard transistoren en zo'n 22.080 miljard verbindingen.

https://en.wikipedia.org/wiki/Transistor_count

Ze zijn helaas niet met elkaar vergelijkbaar omdat ze totaal anders functioneren.

De Google computer gebruikt ze allemaal om dit spel te spelen terwijl dit bij Lee Sedol waarschijnlijk maar een klein gedeelte van z'n brein zal zijn. De computer gebruikt diverse technieken waaronder brute force een stuk vooruit gaan in het spel iets wat een mens niet kan in die korte tijd. De google hardware is ook niet gemaakt om te functioneren als een menselijk brein, daar wordt wel aan gewerkt:

nieuws: IBM presenteert processor die werkt als een brein
Verder dient te worden opgemerkt dat vooral het trainen van de neurale netwerken enorm veel compute power vraagt. Het vervolgen gebruiken van die neurale netwerken veel minder. Het artikel in Nature laat wat metingen zien dat de sterkte waarop gespeeld wordt niet erg afneemt als je alphago met minder cpu's en gpu's laat spelen. Voor deze match hebben ze natuurlijk alle zeilen bijgezet, Lee Sedol is echt enorm sterk. Maar met een extra jaartje oefenen (ja alphago oefent) kan het waarschijnlijk sterker spelen met de helft van de resources, omdat dan de neurale netwerken die stellingen beoordelen en kandidaat zetten wegen weer zoveel beter zijn (geleerd hebben van het oefenen).
Verder dient te worden opgemerkt dat vooral het trainen van de neurale netwerken enorm veel compute power vraagt. Het vervolgen gebruiken van die neurale netwerken veel minder
Een beetje net zoals onze breinen :)

Denk dat meneer Lee ook heel veel meer energie heeft gestoken in het leren van Go dan hij verbruikt heeft tijdens dat ene potje.
Analogieën breken altijd ergens, maar dit vond ik wel een heel aardige. :)
Het is juist omdat dat men een peer inzet om met een appel te vergelijken, dat ik mijn reactie schreef. Echter, het lukt aardig om met een peer die appel te benaderen, al zit ie totaal anders in elkaar. Het is een totaal andere insteek, maar het werkt erg goed. Je hebt gelijk dat ik een niet opgaande vergelijking maakte tussen neuronen en transistoren, maar het zijn beiden wel maten die gebruikt worden om te kwantificeren (niet kwalificeren) wat de rekenkracht is. Ik maakte een vergelijking die puur op hoeveelheid verbindingen sloeg.

Eenzelfde niet opgaande vergelijking geldt voor een CPU van 10 jaar geleden en een van nu. Als je meerdere van die oude CPU's neemt, zodat je toch evenveel transistoren of verbindingen hebt, dan heb je niet per se een even goed systeem als die ene moderne CPU. Het maakt namelijk uit wat je ermee doet of je kwalitatief dezelfde resultaten behaalt. De moderne CPU zit met de modernere architectuur veel efficiënter in elkaar en zal dus met dezelfde resources meer kunnen doen.

En ook dit is weer een te simpele vergelijking, maar je moet wat, want: we hebben het over AlphaGo versus de beste mens in het spel Go. Dat kun je nou eenmaal niet makkelijk vergelijken.

Deze vijf wedstrijden zijn een kwalitatieve maat: wedstrijden in het spelletje winnen. Daarin blijkt AlphaGo beter. Kwantitatief gezien is AlphaGo lastiger te vergelijken met een mens.
Hoeveel transistoren zitten er dan in al die rekenkernen? Ik heb zo mijn twijfels of dat meer is dan er neuronen zijn in hersens.
Wait, what? 170 GPU's en 1200 CPU's 8)7. Is wel heel erg veel wat je nodig hebt om een zeer professionele speler te verslaan.
Niet "what", maar "watt" :p
Ik kan het plaatje helaas niet terugvinden, maar ik heb ergens een overzichtje langs zien komen in de trant van "aantal jaar geleden begonnen go te leren" (25 vs 2 of zo), "aantal wereldkampionschappen" (3 vs 0, als ik me goed herinner) en helemaal onderaan "energieverbruik" (20 watt vs 6400 watt dacht ik).
Dat wordt de volgende stap: menselijke intelligentie evenaren met dezelfde "TDP". ;)
De deep neural networks van AlphaGo kunnen het verloop van deze wedstrijd analyseren en er weer lering uit trekken.
Ik had elders op het net gelezen dat AlphaGo niet leert van de afgelopen wedstrijden tegen Lee Sedol voor de potjes die het nog tegen hem moet spelen. Dat zou ook niet zoveel zin hebben omdat die enkele wedstrijden waarschijnlijk geen nieuwe strategieën op zouden leveren, aangezien AlphaGo 'geleerd' heeft door duizenden/miljoenen andere wedstrijden te analyseren.

Om dat wel mogelijk te maken zouden de recente wedstrijden veel zwaarder mee moeten wegen in het leerproces, waardoor Lee de AI weer op het verkeerde been kan zetten? :P
Ik had elders op het net gelezen dat AlphaGo niet leert van de afgelopen wedstrijden tegen Lee Sedol voor de potjes die het nog tegen hem moet spelen.
Dat klopt. De commentatoren hebben iemand van het DeepMind team die vraag gesteld en het antwoord was inderdaad dat ze al een tijd (ik dacht een paar weken?) voor het evenement een "freeze" gedaan hebben (onder andere om die versie grondig te kunnen testen).
Ik had het gevoel dat ze op het punt stonden om zich af te vragen "Als Lee Sedol een partij wint, kan ie dan de volgende keer (dat ie met dezelfde kleur speelt) nogmaals winnen door simpelweg exact dezelfde zetten te doen?", maar helaas hebben ze die mogelijkheid niet genoemd. Ik vermoed dat dat niet zou werken (één van de componenten is een Monte Carlo Search en daar zit inherent een randomiser in; elke keer dat de optimale zet en de één-na-beste zet vlak bij elkaar liggen qua winkans heb je een kans dat het spelverloop verandert), maar het zou interessant zijn om te horen wat iemand van DeepMind erover te zeggen heeft.
De vierde wedstrijd volgde dezelfde opening als de tweede wedstrijd. Ik weet niet wie als eerste afweek. Binnen de vierde wedstrijd was er ook heel wat symmetrie te vinden. Ergens werden er een stuk of 8(?) zetten eigenlijk helemaal herhaald, maar dan aan de andere kant van het bord.
De deep neural networks van AlphaGo kunnen het verloop van deze wedstrijd analyseren en er weer lering uit trekken.

De computer is zo slim dat hij deze ronde expres heeft verloren.Het concludeerde dat het (a) .al gewonnen had,de totale wedstrijd en (b) ,het meeste voordeel had om de mens te laten winnen om zodoende zijn gedrag te bestuderen en toe te voegen aan zijn eigen strategie bank.De algoritmes in deze setup zijn als het ware 1 grote A.I .De -hedendaagse-schaakcomputers werken ook zo ongeveer.


ik geloof niet dat ze zo`n computer in elkaar zetten die vervolgens niets leert.Ze zeggen dat het niet zo is ,maar ik ,persoonlijk, geloof dat niet.Zelfs kleine schaakcomputer van tegenwoordig hebben een systeem ,dat als je dezelfde match speelt ,waarin je gewonnen hebt ,hij een totaal andere keuze maakt.Enzo als je verliest.Het zal proberen eerst dezelfde zetten te doen waarmee het won,maar als dan een onverwacht move word gedaan past het zich daarop aan.Nu is zo`n schaak pc meestal niet online,en voorgeprogrammeerd en klein in kracht en geheugen &,O.S,maar deze ,go computer kan wel degelijk over internet en cloud beschikken en is tig meer geavanceerd.

Dat ze zeggen dat het niet zo is,geloof ik niet .Is het evil ,om als Google de grootste te willen zijn?.Nee,De ethiek gaat van ,normaal,naar overvloed,naar macht,naar machtswisseling(overnames) .Dit MOET zo gaan om de groei en het voortbestaan te garanderen.Dat is bij elke levens vorm zo.

.

[Reactie gewijzigd door tweaker1971 op 14 maart 2016 13:56]

De deep neural networks van AlphaGo kunnen het verloop van deze wedstrijd analyseren en er weer lering uit trekken.
Ja. Maar dat staat "tussen de wedstrijden" uit; de AlphaGo die bij de eerste wedstrijd aantreedt heeft exact dezelfde configuratie (zelfde neurale netwerken) als de AlphaGo die aan de laatste wedstrijd begint.

Of ze zouden kunnen regelen dat ie tussen (of zelfs tijdens) de wedstrijden leert? Ik vermoed van niet (één extra spel zou een verwaarloosbare invloed moeten hebben op de configuratie van het neurale netwerk), maar heb er niet genoeg verstand van om het met zekerheid te zeggen.
De schaakcomputers werken ook zo.
Schaakcomputers (voornaamste methode: alle zetten brute forcen) en AlphaGo (meerdere neurale netwerken, slim aan elkaar gekoppeld) hebben nagenoeg niets met elkaar te maken.
En ja -1 mod dit maar ,maakt niet uit.Ik geloof dat het zo werkt en zal mijn reactie laten staan ,voor het nageslacht om te bewijzen dat ik gelijk heb.Voel je vrij mij van tegendeel te bewijzen,graag zelfs ,dan kan ik leren :) .
Je reactie laten staan bewijst alleen maar dat je er op het moment van posten zo over dacht; het zegt niks over je gelijk of ongelijk. Hoe lang moet ik "2 + 2 = 5" laten staan voordat het opeens uit zichzelf waar wordt...!?
Ga naar YouTube en zoek op "evolution vs creationism" voor video's van "debatten" waarbij beide kanten alleen maar hun eigen overtuiging verkondigen en op geen enkele manier openstaan voor het standpunt van de andere partij. Hoewel het lastig is om het zeker te weten geeft de toon van je post me de indruk dat een discussie met jou over dit onderwerp ongeveer even nuttig zou zijn; je wekt de indruk dat je je hoe dan ook niet zal laten overtuigen.
Thanx Rob :)

dit was 2003 en dit is 2016 :
Alfa-beta snoeien
Minimax algoritme
Killer heuristische
Iteratieve verdieping diepte-eerst zoeken
Null-move heuristische
Late Move Verlagingen
Veel schaken motoren maken gebruik van nadenken om hun kracht te verhogen.
https://translate.google....omputer_chess&prev=search

En dan heb je ook nog de software zoals komodo 9.3.

Maar ik sta wel open voor discussie ,en geef ook graag mijn ongelijk toe ;) .omdat ik ook niet wil leven met foute aannames .

Het gene wat de AlphaGo pc en schaakpcs doet over1komen is dat het allebij over een spel gaat,maar ik vind ook dat de Alpha Go meer op een netwerk van ons brein lijkt ,dan een schaakcomputer op dat gedeelte doet.Maar anders om lijkt de schaakpc van heden tendage ook weer meer op een ander gedeelte,het analytisch verstand .

en i.d.d de toon is erg vasthoudend ,i.p.v open-minded .Ik was gefrustreerd |:( .

n.b ik weet natuurlijk ook niet zeker wat Google wel en niet , real time gedaan heeft,maar het lijkt mij enigzins logies dat ze er ieder geval in de toekomst iets met de info/data zal doen.

010011011000110001101001100010001100010100101and seek them like hidden treasure

.

[Reactie gewijzigd door tweaker1971 op 14 maart 2016 13:57]

The Verge heeft hier toevallig net een artikel over, waarbij één van de ontwikkelaars van de IBM schaakcomputers geïnterviewd wordt. Brute-forcen is belangrijk, maar er komt ook een zekere mate van AI bij kijken:

http://www.theverge.com/2...lphago-deepmind-interview
Ik irriteer me aan de bedrijven en media die de term "kunstmatige intelligentie" op alles plakken.
AlphaGo is een systeem met software waarin de regels en voorwaarden en spelwereld staat beschreven. Een enorme rekenkracht en geheugen erbij. Klaar.

Het volgt gewoon zijn programmatuur. Niet om af te doen van de prestatie, maar hier is geen sprake van intelligentie.
Maar wat is intelligentie volgens jou dan?

Als ik kijk naar ons mensen, lijkt het mij een basisstructuur die reageert op de omgeving volgens regels die in die structuur passen. De regels kunnen daarmee ook veranderen.

Volgens mij is dat ook wat dit systeem doet. Het leert zichzelf beter te worden.
Het grote verschil met mensen is dat de basisstructuur heel specifiek is en veel minder sensoren kent.
Exact, in tegenstelling tot Deep Blue doet AlphaGo meer dan eindeloos zetten doorrekenen, het vorige nieuwsbericht geeft hier meer informatie over. Edit: voorbeeld in Nature-artikel van hoe AlphaGo een beweging analyseerde in een wedstrijd tegen Fan Hui.

Persoonlijk vond ik MarI/O - Machine Learning for Video Games een heel toegankelijk voorbeeld van machine learning.

[Reactie gewijzigd door Rafe op 13 maart 2016 17:20]

Maar wat is intelligentie volgens jou dan?
Dit is inderdaad de crux - omdat mensen de definities niet weten of omdat de definities uitgehold is, plakt men (tegenwoordig?) maar wat raak met termen.
Dat is dus de grap, het leert van zichzelf, intelligentie is niet meer dan heel veel rekenkracht.
En als de makers van Deepmind zelf zeggen dat het geen AGI is maar het eerste stap in de goede richting om over 20-30 jaar AGI werkend te hebben geloven we dan de 150 experts op het gebied of de media?
Vele duizenden professoren zijn ook niet "GI"; die zijn echt wel "SI". Vraag ze over hun vakgebied en ze kunnen je urenlang bezig houden. Vraag ze over de huidige stand van zaken op het gebied van politiek of economie en ze vallen compleet stil (tenzij dat hun vakgebied is, natuurlijk).

Dus zó vreemd is dat nu ook weer niet. Het grote verschil is echter, dat ASI in dit geval uiteindelijk leidt tot AGI. Terwijl mensen beperkt zijn in hun breincapaciteit. GI komt maar zeer zelden voort uit SI. Simpelweg omdat mensen er de tijd niet voor hebben/vrijmaken om zich generaal te oriënteren...
Elke mens op aarde is GI. Je definite van SI bestaat helemaal niet.
Begin maar op een simpele wiki pagina https://en.wikipedia.org/...cial_general_intelligence
Als je dat snapt zoek dan op google naar Deepmind voor verdere diepgang in wat AGI werkelijk is voordat je gewoon dingen gaat verzinnen.
Sorry, you're right.
Ik doelde op NI vs GI.
Niet SI. Veel professoren die ik ken zijn erg Narrow Intelligence-minded.
Ik denk dat bij levende wezens is intelligentie het vervolg van instinct en emotie, intellectie ontstaat om zelfbehoud, bescherming van anderen, zelfontplooiing, de wil naar meer, etc.
Kunstmatige intelligentie komt zeker langzaam aan meer in de buurt, het leert nu uit zichzelf, maar moet het eerst nog komen tot hetzelf kan kiezen wat het wil leren en een eigen ego hebben.
Stel je hebt een zwarte doos, computer als je wil, en die laat je een boek van het Nederlands naar het Chinees vertalen. Stel die doos kan het boek perfect vertalen zonder een fout, heb je dan intelligentie? Of heb je intelligentie als die doos ook weet wat hij heeft vertaald, het verhaal begrijpt en snapt waar het over gaat? Of heb je pas intelligentie als die doos zich beseft dat ie een boek van het Chinees naar het Nederlands heeft vertaald en wat dat inhoudt en er misschien ook een eigen mening over heeft?

Er zijn vele verschillende definities te noemen van intelligentie en voor mij persoonlijk is iets pas intelligent als het iig aan al die bovengenoemde voorwaarden voldoet. (Het hoeft niet eens letterlijk een boek te kunnen vertalen) Wat veel mensen kunstmatige intelligentie noemen is iets waar ik wel van onder de indruk ben maar wat voor mij niet onder intelligentie valt zoals ik intelligentie interpreteer.

[Reactie gewijzigd door warcow op 13 maart 2016 23:04]

een persoon die vanuit het nederlands een boek naar het chinees vertaald zal als intelligent worden beschouwd. Nu is het apart dat er voor een machine een andere definitie wordt gemaakt.

Beter omschreven: waarom is iemand die gigantische hoeveelheden data kan onthouden intelligent, maar een pc bv. niet. We hanteren dubbele standaarden basically :)
Veel data kunnen onthouden heeft helemaal niks met intelligentie te maken imho. Je begrijpt mijn punt ook niet helemaal, een boek vertalen van chinees naar nederlands maakt een persoon niet intelligent. Goed geleerd != intelligent, de potentie om te leren is denk ik wel een onderdeel van intelligentie.

Maar goed, er zijn meerdere definities van intelligentie aan te houden. Ik zal niet zeggen dat jouw definitie fout is maar geef gewoon aan hoe ik het persoonlijk zie.
sterker nog, ik kom niet zo snel op een definitie van wat intelligentie is hoor. Ik was slechts aan het schieten op jouw stellingen ;P

Het onthouden van veel data lijkt me persoonlijk trouwens wel een vorm van intelligentie, met name als je tussen al die data in je hoofd relaties kunt leggen, basically: patronen zien, herkennen en gebruiken in zekere zin.

Maar goed, as stated durf ik niet te zeggen wat het dan wel is, ik kom in essentie niet veel verder dan het aanstippen van wat dingen die mogelijk laten zien dat iets of iemand intelligent is.
Het opvallende is nou net dat in de AlphaGo software niet de regels en voorwaarden van de spelwereld beschreven staan. Die heeft het programma geleerd, ze zijn er niet van tevoren ingezet.
De regels en voorwaarden van het spel staan er natuurlijk wel in. Anders kan ie geen potje spelen!
De regels heeft AlphaGo zichzelf aangeleerd: supervised learning oa dmv analyseren van wedstrijden gespeeld door mensen (dit is het policy network). Zie ook het verslag van Tweakers van de derde wedstrijd met daar in een presentatie van de AlphaGo bij de UvA.

Zie ook deze uitleg op youtube van dezelfde software alleen met dit keer wordt getrained met een Atari 2600. :P
https://www.youtube.com/watch?v=Ih8EfvOzBOY
De regels heeft AlphaGo zichzelf aangeleerd
De regels heeft AlphaGo niet geleerd, maar gekregen.
Iemand heeft in de software gezet dat er een speler met wit en een speler met zwart speelt, dat je om en om steentjes op een raster van 19x19 legt en dat de bedoeling is dat je zoveel mogelijk territorium veroverd door het omsingelen van je tegenstander.

Het is niet zo dat ze AlphaGo hebben aangezet met als opdracht 'ga Go spelen' en dat hij vervolgens zelf de regels erbij heeft 'geleerd'.

Spelstrategie heeft hij zichzelf wel aangeleerd (waardevolle posities op het bord, selecteren van moves, etc.).
Je bent vergeten de rest van zijn post te lezen.

Ze hebben juist NIETS van spelregels meegegeven.
AlphaGo heeft duizenden wedstrijden Go "gekeken" en van daar uit de spelregels opgepakt.

Het is goed mogelijk dat AlphaGo naast zijn database gebruik ook een stuk van zijn code zelf herschrijft.
Je bent vergeten de rest van zijn post te lezen.
Ik hoeft z'n post niet te lezen, ik heb de paper gelezen.
Ze hebben juist NIETS van spelregels meegegeven.
AlphaGo heeft duizenden wedstrijden Go "gekeken" en van daar uit de spelregels opgepakt.
Nee, ze hebben de spelregels meegegeven.
Kijk hier bijv. maar eens naar de input van het neural network, hier is duidelijk de speelwijze van de game in vastgelegd.

EDIT2: om iets duidelijker te zijn, het enforcen van wat legale en wat illegale moves zijn, is gewoon vastgelegd in code. Vooral in match 4 was het interessant, omdat in de code is vastgelegd dat wanneer de winkans <20% komt, er 'resigned' wordt.

AlphaGo maakt dus geen AI keuze om te resignen, maar zijn winkans komt <20% en de code zal vervolgens opgeven (ouderwetse If-Then).
Het is goed mogelijk dat AlphaGo naast zijn database gebruik ook een stuk van zijn code zelf herschrijft.
Nee. Gewoon nee. Anders link graag.
EDIT: sterker nog, de code van deze release (R18) zat zal weken voor de matches in 'freeze'.

[Reactie gewijzigd door JackBol op 14 maart 2016 09:10]

Ik ben uitgegaan van de uitleg op dag 1.
Hieruit begreep ik dat AlphaGo zelf achter de regels is gekomen.
Net als dat vele mensen de spelregels van een Sudoku zouden kunnen snappen als ze 100 verschillende sudoku oplossingen zien.
Hier zat juist een groot gedeelte van mijn verbazing voor AlphaGo en zijn ontwikkelaars.

AlphaGo zit inderdaad al een tijdje in een freeze periode waar hij geen nieuwe dingen zal leren.
Maar als het puur en alleen database gebruikt dan is het in principe gewoon kans berekening op hele grote schaal.
Ja er zal een hele grote database aan te pas moeten komen, maar dat zou het probleem niet moeten zijn als je ziet wat er allemaal in de pc zit.
Ik zou je willen +1 maar dat kan dus niet.

Echter is Go geen kansberekening. Binnen Go is perfecte informatie, veel valt dus te voorspellen. Daarom zijn er zoveel forced moves en word er veel geresigned ipv tot aan de winst gespeeld.

Het probleem met Go is echter dat een volledige bordberekening 10^761 moves bevat. Aangezien er maar 10^88 atomen in het universum zitten, is het dus onmogelijk om Go te brute-forcen.
Wat AlphaGo dus doet is het merendeel van de informatie weggooien (prunen) voordat het begint met rekenen (de monte carlo tree search).
De kracht van AlphaGo is dus te leren welke informatie relevant is voor een zet. En dit stukje word juist getrained met het reinforced learning.
[edit] nevermind, had de rest nog niet goed gelezen.

[Reactie gewijzigd door Dorstlesser op 14 maart 2016 11:24]

Dank je wel. Het romantisch beeld dat GoPlex pur sang neuraal was is nu wel een beetje weg. Vaak hebben die mensen die de AI netwerken configureren het over een Secret Sauce (R), ik realiseer me nu wel dat de ingredienten imperatief zijn. ;)
Denk je echt dat het zo makkelijk is?

Als je er beter in verdiept zal je komen te leren dat Go enorm moeilijk is voor een computer om te spelen. Er is lange termijn denken nodig in Go dat niet op te lossen is door brute force X zetten vooruit te kijken door het enorme aantal posities dat mogelijk is.

De oplossing van het Deepmind team gebruikt deels een Monte-Carlo tree search, wat neerkomt op de traditionele strategie van heel veel mogelijkheden afgaan. Maar dat wordt wel gecombineerd met neurale netwerken die inschattingen maken van wat de beste zetten zijn, en hoe het bord er voor staat.

Die neurale netwerken kunnen zeer zeker als 'intelligent' worden beschouwd omdat ze eigenlijk menselijke intuitie reproduceren. Daarnaast zijn deze niet voorgeprogrammeerd door een mens, maar getrained door ze te fitten op vele andere spellen, en daarna door AlphaGo tegen zichzelf te laten spelen. De neurale netwerken zijn nog niet zo inzichtvol als een mens zelf, maar die handicap wordt opgelost door de MC-tree search. Desalniettemin is de strategie die ze gebruiken een sterk voorbeeld van de kracht van artificial neural networks en deep learning.
Lees je eens in in DeepMind, als er iets de term "kunstmatige intelligentie" verdient, is dit toch wel een van de grootste kanshebbers.
Jij volgt ook gewoon je programmatuur. Ben jij dan ook niet intelligent? De rest van de wereld kan er niets aan doen dat jouw definitie van K.I. niet klopt.

Zeg dat trouwens ook maar tegen alle opleidingen kunstmatige intelligentie die gegeven worden aan alle universiteiten in Nederland en in de rest van de wereld, waar ze deze materie als lesstof geven. Ik weet zeker dat zij bij elkaar meer expertise hebben dan jij over het onderwerp, het is compleet gerechtvaardigd om dit kunstmatige intelligentie te noemen.
Ik denk dat je het woord kunstmatig er bij vergeet. Het is kunstmatig, na bootsend.
Ik erger me aan mensen die 'ik irriteer me' zeggen.

Maar ontopic, definieer wat een kunstmatige intelligentie is? Waar ligt de grens? Zelfbewustzijn? En wat als dat zelfbewustzijn geprogrammeerd is? Ik durf niet zomaar te stellen dat dit geen kunstmatige intelligentie is.
Waarom zou AlphaGo het opgeven als die de kans om te winnen op minder dan 20% schat? Want een van de voordelen van een computer ten opzichte van een mens is dat een computer niet vermoeit kan raken en daardoor dus geen fouten zal maken. Zeker als één potje vijf uur kan duren.
Om het eerlijk te houden tegenover zijn menselijke tegenstanders zal dat er in zijn geprogrammeerd, het is een test van speelkunsten, niet uithoudingsvermogen.

Ook voor de mensen die de match bekijken zal het anders niet leuk meer zijn om te kijken, als het maar eindeloos gerekt wordt.

Daarnaast betekent niet vermoeid raken niet dat er geen fouten worden gemaakt, anders zou hij al helemaal niet in de positie komen van een lage winstkans, lees het artikel nog maar eens, iets over zet 79.
In de Go-wereld wordt het als onbeleefd gezien om door te spelen als je verloren staat.
Waarom zou AlphaGo het opgeven als die de kans om te winnen op minder dan 20% schat?
Omdat het grootste deel van de complexiteit (het overgrote deel van de zetten waar je een fout kunt maken) in de eerste helft van het spel zit. Kijk de video van de wedstrijden maar eens terug: beide spelers hebben twee uur bedenktijd, als die op is hebben ze nog 60 seconden per zet... en ook echt letterlijk geen seconde meer. Vooral bij deze vierde partij was het erg duidelijk, Lee Sedol was al halverwege het aantal zetten door zijn tijd heen; de tweede helft van de partij heeft ie elke zet binnen 60 seconden moeten doen. AlphaGo kan wel doorspelen tot het bittere einde, maar Sedol (en, wat dat betreft, elke andere prof), doet dat eindspel op de automatische piloot, zonder fouten. Kijk ook maar eens hoe goed die commentator een groot aantal van de zetten in het eindspel exact voorspelt; dat laat wel zien hoe duidelijk de beste zet is (voor degenen die er echt verstand van hebben).

Bovendien zijn er nog twee practische overwegingen:
  • Als je wilt laten zien dat je het hele spel net zo goed beheerst als een menselijke tegenstander, dan moet je ook laten zien dat je kunt vaststellen wanneer je verloren hebt.
  • Wat schiet je (zeker als je de best-of-five al binnen hebt) nog op met een extra overwinning waarvan de hele wereld het erover eens is dat je die enkel te danken hebt aan het onnodig uren lang rekken van een verloren partij, waarna de menselijke tegenstander uiteindelijk zo gaar was dat ie dan uiteindelijk toch een fout maakte... Dan is de glans er een beetje vanaf, toch?
Voor de duidelijkheid: ik heb geen verstand van go; ik ken nauwelijks de regels en heb in mijn hele leven nog geen vijf potjes gespeeld. Het bovenstaande over waar de complexiteit zit is gebaseerd op wat ik bij deze wedstrijden heb gezien en van de commentatoren gehoord.

[Reactie gewijzigd door robvanwijk op 13 maart 2016 18:20]

Win kans onder de 20% en vervolgens de statement maken dat een computer geen fout zal maken. Hoe is die winkans dan zo laag geworden?
Hij zegt niet dat de computer geen fouten kan maken, maar dat deze geen fouten maakt door vermoeidheid, i.t.t. de mens. Dat lijkt me toch een redelijke aanname? Het feit dat de winkans zo laag is geworden is omdat het begin van het spel vele mate complexer is dan het einde. Als de machine het daar verprutst heeft (waarschijnlijk doordat het neurale deel te weinig goede input heeft kunnen geven en het brute force deel niet ver genoeg vooruit kan kijken), dan is het spelletje gespeeld en kun je alleen nog hopen op een fout van de tegenstander. Gezien het niveau van dhr. Sedol is het dan netjes om op te geven bij een winkans lager dan 20%, aangezien een overwinning alleen nog voort zal komen uit het verschil in uithoudingsvermogen van de machine t.o.v. zijn menselijke tegenstander.
Op het moment dat AlphaGo de handdoek in de ring gooide [..] barstte het Koreaanse publiek in het Four Seasons Hotel in Seoul uit in een luid applaus.
Echt heel apart hoe snel de opinie omslaat van "Wat een grootheidswaanzin van Google; die worden kansloos 5-0 ingemaakt" naar "Wow, hij heeft er toch nog één overwinning uit kunnen slepen tegen deze 'onverslaanbare' tegenstander; hulde, staande ovatie!" :+
In de nabeschouwing werd ervan gesproken dat Lee de spanning waar hij met name in de derde ronde onder leed niet meer voelde.
Bij de persconferentie achteraf was het een verschil van dag en nacht: de spanning was er duidelijk helemaal vanaf! Ik weet niet of het eraan lag dat het nu "toch niet meer uitmaakt" of omdat ie een partij gewonnen heeft, maar hij kwam veel opgewekter over en hij had duidelijk echt zin in de laatste wedstrijd.
Het mooie is ook dat het DeepMind team het prima vindt dat ze een keertje verliezen; niet alleen uit solidariteit met hun mede-mens, ook vanuit wetenschappelijk oogpunt omdat ze van een verlies veel meer kunnen leren dan van een overwinning. De persconferentie deed mij denken aan de oorspronkelijk Olympische Gedachte (die bij de moderne Olympische Spelen ver te zoeken is...) "meedoen is belangrijker dan winnen": ze doen allebei hun uiterste best om te winnen, maar uiteindelijk is het belangrijkste dat dit een enorm interessant experiment is.
Off topic: de oorspronkelijke Olympische gedachte is natuurlijk: "alleen de eerste plaats telt, als mijn tegenstander het niet overleeft, is dat ook prima." ;) Meedoen is belangrijker dan winnen is maar relatief kort waar geweest.

Hoeveel ik ook van technologie en vooruitgang houd, had ik toch gehoopt dat de mens nog zou winnen. Deze uitslag voelt toch een beetje als een nederlaag voor de mens (ook al is die computer natuurlijk ook door mensen gebouwd).
Hoeveel ik ook van technologie en vooruitgang houd, had ik toch gehoopt dat de mens nog zou winnen.
Als je je er beter door voelt, het was op een flink aantal manieren geen eerlijke strijd:

Een heel team dat ergens een paar jaar aan werkt is al snel vele tientallen manjaren werk. Lee Sedol heeft zijn vaardigheden in (als ik me goed herinner) een jaar of vijfentwintig bij elkaar getraind.

Ik kan niet vinden in welke configuratie AlphaGo precies tegen Lee Sedol speelt, maar zo te zien met honderden of duizenden CPUs en GPUs. Laten we zeggen minstens één server rack; dat is honderden keren het volume en energieverbruik van een setje menselijke hersenen.

En misschien wel het belangrijkst van allemaal: een bepaald onderdeel van AlphaGo (het "policy network") is getraind op talloze potjes go gespeeld door bekwame mensen; de AI is zo goed omdat ie de kunst van "ons" heeft af kunnen kijken.

Dit doet uiteraard niets af aan de geweldige prestatie van DeepMind! Ik wil alleen maar zeggen dat AI op een aantal belangrijke punten nog niet in de buurt komt van menselijke intelligentie.
Toen Deep Blue in 1996 voor het eerst won met schaken was Go nog net zo onbereikbaar als Star Trek's teleportatie; 20 jaar later is het realiteit. Geeft toch aan hoe snel de rekenkracht en mathematische ontwikkelingen (van neural netwerks, heuristics, algoritmes en parallel processing) gegaan zijn. Je nieuwe game-videokaart heeft al evenveel rekenkracht als de 15M dollar aan SGI hardware die gebruikt werd om Jurassic Park 1 (de film) te renderen ...

De hoeveelheid beschikbare rekenkracht anno 2016 is vrijwel ongelimiteerd en relatief goedkoop; ben benieuwd waar we over 20 jaar staan met Quantum Computing en nano-technologie aan de horizon ...
Vreemde move is op 3:40:37, de commentatoren begrijpen er ook weinig van.
3:35:27 is eigenlijk de eerste vreemde move, die erna is nog vreemder
Ik vind vooral Sedol een immense eindbaas
Respect Voor deze zuid koreaan ! :D echt heel knap om van een computer te winnen.

Op dit item kan niet meer gereageerd worden.



Nintendo Switch Google Pixel Sony PlayStation VR Samsung Galaxy S8 Apple iPhone 7 Dishonored 2 Google Android 7.x Watch_Dogs 2

© 1998 - 2016 de Persgroep Online Services B.V. Tweakers vormt samen met o.a. Autotrack en Carsom.nl de Persgroep Online Services B.V. Hosting door True