Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Je kunt ook een cookievrije versie van de website bezoeken met minder functionaliteit. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , reacties: 38, views: 12.103 •

Aan de TU Delft worden diverse onderzoeksprojecten op het gebied van robotica uitgevoerd. Een van die projecten is onderzoek naar lopen bij robots. Een eenvoudige oplossing voor het laten lopen van een humanoïde, tweebenige robot zou het simpelweg programmeren van de benodigde loopalgoritmes zijn, maar dat zou de inzetbaarheid van dergelijke robots te zeer beperken. Er valt immers niet te programmeren voor elke variabele, zoals verschillen in ondergrond of het al dan niet dragen van een last en daarmee gepaard gaande veranderingen in de gewichtsverdeling. Een robot die zelf leert lopen en dat loopgedrag kan aanpassen aan verschillende omstandigheden, is daarom veelzijdiger.

Dat is precies wat Leo moet doen. Leo is een project van Erik Schuitema en de robot leert lopen door middel van machine learning, of preciezer: reinforcement learning. Na een simulatie van lopen in een computer wordt het algoritme dat Leo zichzelf heeft geleerd in de echte wereld getest en verbeterd. Mocht het programma de robot toch laten vallen, dan kan Leo zichzelf oprichten; een servo in de arm zorgt daarvoor. In elk van de twee 'benen' zitten nog eens drie servo's, een voor elk gewricht. Leo loopt zelfstandig, maar zit vast aan een arm voor voeding en zijwaartse stabilisatie. Alle benodigde berekeningen om het lopen mogelijk te maken worden uitgevoerd door de on-board-computer, een op 1,2GHz geklokte VIA Eden-processor, met 1GB werkgeheugen. Eriks collega Wouter Caarls gebruikt Leo nu voor een vervolgonderzoek naar verschillende leeralgoritmen.

Een andere 'looprobot', die tijdens de demonstratie aan de TU Delft niet te zien was, is Phides. Deze robot is groter en krachtiger dan Leo en vooral bedoeld voor onderzoek naar rennen. De robot moet op termijn helpen bij de ontwikkeling van protheses voor zowel gehandicapten als mensen die met technische hulpmiddelen verder, sneller en beter willen rennen. Anders dan Leo is Phides niet gebouwd voor machine learning.

Reacties (38)

Het probleem is dat hoe complexer het gedrag is dat je wilt leren, hoe meer trials je nodig hebt. In simulatie is dat niet zo'n probleem, maar de echte wereld gaat niet sneller dan real-time. Bovendien heb je op een echte robot allerlei extra problemen, zoals control delay, backlash, oneffenheden, etc.

Om in zo'n situatie toch nog iets interessants te leren moet je voorkennis toevoegen in de vorm van min of meer geparametriseerde controllers. Als je dan niet oppast wordt het uiteindelijke gedrag daardoor teveel beperkt. LEO laat zien het voor deze taak zonder voorkennis ook gaat, terwijl dat eigenlijk niet verwacht werd.
Deze robot is juist op dit vlak anders. De gebruikte logica (reinforcement learning) is zeer generiek en het aantal parameters enorm (enkele miljoenen).

In het bijbehorende proefschrift kun je lezen dat deze robot zonder (of met zeer beperkte) voorkennis, met random geinitialiseerde parameters, helemaal zelf kan leren lopen vanaf nul, zonder vooraf geprogrammeerde oplossing of oplossingsvorm.

In dit filmpje kun je zien hoe het leerproces eruit ziet op de echte robot.

[Reactie gewijzigd door keez- op 28 januari 2013 22:57]

Ik vind de zin robots leren zelf lopen bedrieglijk. De robots leren namelijk niet ze kunnen zich slechts automatisch finetunen. Dit is geen leren dit is ook puur programmatische logica waar de robot niet buiten kan.
Dat is bij jou niet anders natuurlijk. Wij mensen leren door in onze hersenen (en door onze ouders) beloond te worden voor goed gedrag. Lopen leer je letterlijk met vallen en opstaan. Vallen doet pijn, dus als je een paar stappen zet zonder te vallen, onthouden je hersenen maar wat graag hoe ze de benen hebben aangestuurd. Dat is er door miljoenen jaren evolutie ingehamerd. Nu sta je niet meer stil bij hoe je je voeten neerzet, hoe je je benen buigt en wat er gebeurt als het tapijt niet mooi vlak is.

Deze robot "leert" zelf alle parameters die nodig zijn om stabiel te lopen. Natuurlijk zijn de functies door een mens ingeprogrammeerd, maar zoals ik al eerder zei: zo komt een baby ook op de wereld: vol informatie die later pas relevant zal zijn.
Nou kan men in de wereld van wetenschap en taal nog veel discussieerden wat leren is en waaronder we het kunnen verdelen. Een robot die zogenaamd leert volgt slechts een voorgeprogrammeerd script wat slechts enkele variabelen in zich zelf automatisch kan aanpassen. Hierdoor kan het zichzelf finetunen maar daarbij zal het ook blijven.
Maar jij bent net zo beperkt. Waar de graden van vrijheid bij deze robot wellicht deels door software worden beperkt, worden ze bij jou door spierkracht, bewegingsvrijheid van je gewrichten e.d. beperkt. En als je drie van deze robots neerzet, zullen ze verschillende paden volgen met alle bijbehorende fouten om te komen tot een lopende robot. Ook dat is bij mensen niet anders.
Leren draagt ook bij aan het aanpassen van bestaande kennis, gedrag, vaardigheden of waarden. Daarmee zou je kunnen stellen dat een robot zelf kan leren. Gedeeltelijk maar want hij kan nog steeds niet zelf leren lopen. Zichzelf bijstellen zou mij een betere titel zijn het kan namelijk al lopen hij stelt alleen de waarden van de logica die zijn makers het hebben gegeven.

Het idee dat een machine kan leren bestaat al langer en is al vaker op deze wijze bewezen. Ik vind dit dan ook niet zo bijzonder. Natuurlijk wel respect voor de kundige mensen die dit soort projecten kunnen waarmaken. Ik hoop over een paar jaar de doorbraak op kunstmatige intelligentie mee te maken. Echter denk ik dat hiervoor meer biologisch onderzoek nodig is dan robotisch onderzoek.
Als je het heel elementair bekijkt moeten we in staat zijn om een machine hetzelfde leerproces te geven als een mens. Onze hersenen zijn ook maar cellen met zeer voorspelbare chemische reacties erin.

Op dit item kan niet meer gereageerd worden.



Populair:Apple iPhone 6Samsung Galaxy Note 4Apple iPad Air 2FIFA 15Motorola Nexus 6Call of Duty: Advanced WarfareApple WatchWorld of Warcraft: Warlords of Draenor, PC (Windows)Microsoft Xbox One 500GBTablets

© 1998 - 2014 Tweakers.net B.V. Tweakers is onderdeel van De Persgroep en partner van Computable, Autotrack en Carsom.nl Hosting door True

Beste nieuwssite en prijsvergelijker van het jaar 2013