Cookies op Tweakers

Tweakers maakt gebruik van cookies, onder andere om de website te analyseren, het gebruiksgemak te vergroten en advertenties te tonen. Door gebruik te maken van deze website, of door op 'Ga verder' te klikken, geef je toestemming voor het gebruik van cookies. Je kunt ook een cookievrije versie van de website bezoeken met minder functionaliteit. Wil je meer informatie over cookies en hoe ze worden gebruikt, bekijk dan ons cookiebeleid.

Meer informatie

Door , , reacties: 38, views: 12.034 •

Aan de TU Delft worden diverse onderzoeksprojecten op het gebied van robotica uitgevoerd. Een van die projecten is onderzoek naar lopen bij robots. Een eenvoudige oplossing voor het laten lopen van een humanoïde, tweebenige robot zou het simpelweg programmeren van de benodigde loopalgoritmes zijn, maar dat zou de inzetbaarheid van dergelijke robots te zeer beperken. Er valt immers niet te programmeren voor elke variabele, zoals verschillen in ondergrond of het al dan niet dragen van een last en daarmee gepaard gaande veranderingen in de gewichtsverdeling. Een robot die zelf leert lopen en dat loopgedrag kan aanpassen aan verschillende omstandigheden, is daarom veelzijdiger.

Dat is precies wat Leo moet doen. Leo is een project van Erik Schuitema en de robot leert lopen door middel van machine learning, of preciezer: reinforcement learning. Na een simulatie van lopen in een computer wordt het algoritme dat Leo zichzelf heeft geleerd in de echte wereld getest en verbeterd. Mocht het programma de robot toch laten vallen, dan kan Leo zichzelf oprichten; een servo in de arm zorgt daarvoor. In elk van de twee 'benen' zitten nog eens drie servo's, een voor elk gewricht. Leo loopt zelfstandig, maar zit vast aan een arm voor voeding en zijwaartse stabilisatie. Alle benodigde berekeningen om het lopen mogelijk te maken worden uitgevoerd door de on-board-computer, een op 1,2GHz geklokte VIA Eden-processor, met 1GB werkgeheugen. Eriks collega Wouter Caarls gebruikt Leo nu voor een vervolgonderzoek naar verschillende leeralgoritmen.

Een andere 'looprobot', die tijdens de demonstratie aan de TU Delft niet te zien was, is Phides. Deze robot is groter en krachtiger dan Leo en vooral bedoeld voor onderzoek naar rennen. De robot moet op termijn helpen bij de ontwikkeling van protheses voor zowel gehandicapten als mensen die met technische hulpmiddelen verder, sneller en beter willen rennen. Anders dan Leo is Phides niet gebouwd voor machine learning.

Reacties (38)

Nice hoor, jammer dat ik niet ~10jaar geleden wist dat ze bij TU Delft robotica trajecten hadden (als ze die toen uberhaupt al hadden)

Zit tegenwoordig zelf thuis robots te bouwen, ook met dynamixels :D (wel goedkopere versie hehe, maar zijn idd echt meesterlijke servos, waar ie wat mij betreft te weinig over zegt, wat ze zo goed maakt is dat je de positie kan uitlezen, ze een ingebouwde failsafe hebben, en ze als daisy chain werken)
Hehe leuk. Ik heb nog een stage gedaan in dat lab en toen was Leo ook al in ontwikkeling :D
Leuk om hier op tweakers eens een artikel te zien over Leo.
hobby servotjes worden toch vaak met pwm aangestuurd? :)

ik vind het aanleren maar erg relatief. de robot maakt een database vol met waardes, wanneer tie een waarde overschrijd, weet het script dat er een val-actie kan komen. Erg gaaf om het te zien hoe dit zo snel vooruit gaat! :9
Superschattig om te zien :) Daarnaast is deze manier van complexe bewegingen ontwikkelen, net zoals mensen en dieren het leren. Door vallen en opstaan worden succesvolle acties beter 'onthouden' en daarna vaker toegepast. Ik ben de link kwijt, maar er was ooit een zelflerend A.I. programma/spel ontwikkelt, waarmee je AI robotjes kon leren navigeren en schieten op vijanden. Je kon met schuiven prioriteiten en/of doelen instellen, waarna je de robotjes specifiek kon trainen door trial and error.

Ik snap niet echt waarom in het filmpje wordt gezegd dat 'men' vroeger dacht dat complexe bewegingen op deze manier niet ontwikkeld konden worden. Lijkt mij toch iets heel triviaals dat dit zo werkt, net als in de natuur immers. Daarnaast in software dus al een paar jaar geleden bewezen dat het werkt.

Leuke techniek om erg complexe robotsystemen te kunnen ontwikkelen. Op den duur waarschijnlijk complexer dan de beste programmeur ooit kan programmeren ...
Het is natuurlijk de bedoeling dat het na een paar keer niet meer valt. Dan is er een 'zelf-geleerde' tegenaktie en die zat nog niet in het 'script'.
Zo'n spel waar je het over hebt is aan de UvA een onderdeel van het lesprogramma master A.I. voor het vak Advanced Topics in Autonomous Agents - hier moesten we leeralgorithmes maken (meestal reinforcement learning methodes) waarmee mini-agents (virtuele robotjes) leren navigeren, schieten, samenwerken, verdedigen, en op den duur gezamenlijke strategieŽn ontwikkelen om "capture the flag" te spelen.

Dat alles op basis van de een open-source package ontwikkeld aan de UvA:

http://staff.science.uva.nl/~jellekok/software/
Tja, achteraf gezien lijkt alles logisch... Dit is een terugkerend thema in de wetenschap en in de AI uiteraard ook. Een aantal decennia geleden werkte iedereen met uitgebreide symbolische systemen die na uren rekenen een centimeter vooruit bewogen en dan weer opnieuw begonnen met rekenen (ik chargeer een beetje) en werd je raar aangekeken als neurale netwerken gebruikte, nu is het bijna andersom.

Wat ik me wel afvraag is hoezeer de arm effect zal hebben op het leeralgorithme. Wordt er nu niet geoptimaliseerd zonder de stabiliteit in de gaten te houden, waardoor de robot alleen met ondersteuning goed kan lopen?
Idd, wat betreft software. Kan mij een documentaire herinneren waarin ze mbv software wilde achterhalen hoe dinosauriŽrs vroeger over de aardbodem liepen. In het programma hadden ze een model die een aantal stappen zette, de 1ste keer valt het model, tweede keer ook, ....... duizendste keer ook e.t.c.. totdat het model wel volledig een traject kan belopen. Dit was volgens mij +- 5 jaar terug dat ik dat zag.
B'VO Leeghwater

Ontopic: Er waren meerdere projecten die tentoongesteld moesten worden, maar helaas waren sommige nog niet klaar of deden het gewoonweg niet meer.

Verder was dit het symposium voor de opening van de Robotics Instituut aan de TU Delft. Dit instituut zal samen met andere instellingen werken aan het verbeteren van het robotica techniek! Super mooi!

[Reactie gewijzigd door Ortixx op 28 januari 2013 17:51]

Er wordt nu inderdaad geoptimaliseerd voor deze situatie met ondersteuning. Maar ook voor bijvoorbeeld het type ondergrond. Voordeel van de arm is dat de situatie makkelijker is, er minder mogelijkheden tot vallen zijn, er dus minder geprobeerd hoeft te worden en het leerproces sneller gaat. Het principe hierachter kan natuurlijk uitgebreid worden voor een complexere situatie nodig om geheel vrij te lopen.
Ik denk dat de decennia lange ontwikkeling van de Asimo toch wel wijst op een overtuiging dat praktisch alles moest worden aangeleerd door het toevoegen van programmatuur.

Ik zou eerst ook de opmerking maken dat het zo jammer is dat in dit wereldje het wiel zo vaak opnieuw moet worden uitgevonden. Echter het een computer autonoom bewegingen (of andere acties) lijkt me de toekomst te zijn in dit vakgebied.
Het zijn "3Mxels" geen dynamixels. Ze hebben ze intern ontworpen maar doen redelijk hetzelfde.
Gepaste muziek trouwens: Thomas Newman - Typing Bot (Wall-E soundtrack) :P
In het geval van lopen zit de complexiteit erin dat je tijdens het lopen niet in evenwicht bent. Je kunt als je normaal aan het lopen bent niet instantaan stoppen, omdat je dan omvalt. Deze manier van 'instabiel' lopen is veel sneller en efficienter (qua energieverbruik) dan 'stabiel' lopen wat veel humanoid robots nog doen.
Ik kan me voorstellen dat een dergelijke pas moeilijk is om zelf aan te leren voor een robot. En dat ze daarom vroeger dachten dat het met reinforcement learning niet gaat werken. Als de complexiteit van de leerlogica groter is dan van het uiteindelijke resutaat schiet je je doel natuurlijk voorbij.
Hmm zien er wel uit als RX-28's? maar is natuurlijk alsnog mogelijk dat ze de tandwielen/motor hebben aangepast.
In 3D dynamica worden veel problemen die in 2D nog lineair zijn niet-lineair. Dit is heel veel complexer om te regelen en wordt grotendeels opgelost door het traject te beperken tot een boloppervlak. Inderdaad zal de robot, als je hem helemaal los laat lopen heel waarschijnlijk direct omvallen en niet op kunnen staan. De robot is trouwens ook asymmetrisch gebouwd, met slechts ťťn gewone arm.
Los daarvan is de arm natuurlijk erg praktisch, omdat de robot zo veel minder ruimte nodig heeft en makkelijk van elektriciteit kan worden voorzien.
Een van de andere robots waar ze mee bezig zijn in het robotics-lab op 3ME van de TU-Delft
is een 'ren' robot op hetzelfde principe met 2 vrijheidsgraden, om behalve lopen ook het rennen (en hinkelen, huppelen en vallen) te 'leren'. Extra moeilijkheidsgraad hierin is de input: Leo loopt en heeft een continu input van zijn voetsensoren of deze op de grond staan (en dus ook de hoogte en hoek).
een robot die rent laat de grond ook los waardoor deze ook kan duiken (vallen) en input mist.
genaamd Phenix. http://www.youtube.com/watch?v=MHqkC1vS7qA

Een van de robots die meerdere vrijheidsgraden heeft en zeer stabiel staat is een robot die wordt ontwikkeld voor de Robo-cup wedstrijden in Humanoid League.

Meer informatie:
http://www.dbl.tudelft.nl/ *delft biorobotics lab*

Veel van deze technologie vindt behalve in de robotica ook zijn weg terug naar proteses voor mindervaliden en zelfs atleten.


*Leeghwater / slurf*
volgens mij zegt hij ook in het filmpje dat het (door iedereen verkrijgbare) dynamixels zijn.
Niet in de video getoond: 4 servo's aangestuurd door een Perl-script die op gepaste tijden op de toetsen Q,W, O en P duwen.
Hoewel er in het lab zeker veel "3Mxels" gebruikt worden zitten er in LEO inderdaad gewone RX-28s.

Op dit item kan niet meer gereageerd worden.



Populair: Samsung Smartphones Processors Sony Microsoft Games Apple Consoles Politiek en recht Smartwatches

© 1998 - 2014 Tweakers.net B.V. Tweakers is onderdeel van De Persgroep en partner van Computable, Autotrack en Carsom.nl Hosting door True

Beste nieuwssite en prijsvergelijker van het jaar 2013