Onderzoekers van de Universiteit van Californië - Berkeley hebben een robot ontwikkeld die zelf leert hoe hij bepaalde taken moet voltooien. Dat kan dankzij een nieuw 'deep-learning'-algoritme, dat gebruikmaakt van gesimuleerde neurale netwerken.
De onderzoekers schreven twee papers over het project, die ze volgende week woensdag en donderdag zullen presenteren op de International Conference on Robotics and Automation in Seattle. Het voordeel van een robot die gebruikmaakt van 'deep learning' is dat hij niet voor iedere taak opnieuw hoeft te worden geprogrammeerd. In plaats daarvan zorgt de software ervoor dat de robot taken kan leren. Die manier van functioneren moet robots geschikter maken voor gebruik in onvoorspelbare omgevingen. Nu worden robots nog vooral gebruikt in gecontroleerde omgevingen waarin objecten altijd op dezelfde plaats staan, omdat ze zich niet automatisch kunnen aanpassen aan veranderingen in de omgeving.
De onderzoekers werkten met een Personal Robot 2, bijgenaamd Brett of Berkeley Robot for the Elimination of Tedious Tasks. De PR2 is ontwikkeld door Willow Garage, een Californische robotbouwer. Het 133 tot 165cm lange apparaat bestaat uit een uitschuifbare torso met twee grijparmen. In het 'hoofd' zitten onder andere een Microsoft Kinect en een laserscanner. Het 'brein' van het apparaat wordt gevormd door twee quadcore-Intel Xeon-processors met 24GB werkgeheugen.
Het deep-learning-algoritme dat de onderzoekers ontwikkelden, maakt gebruik van convolutional neural networks met 92.000 parameters. Dergelijke algoritmen maken gebruik van gesimuleerde neuronen die elk een klein stukje van de ruwe data verwerken. Doordat de neuronen elkaar deels overlappen, kunnen ze ook grotere patronen herkennen in de data. Convolutional neural networks worden al toegepast in onder andere spraak- en beeldherkenning.
Het algoritme gebruikt camerabeelden en de positie van de scharnierpunten in de armen om realtime-feedback te geven op de voortgang van de taak in de vorm van een score. Bewegingen die de robot dichter bij de uitvoering van de taak brengen, scoren daarbij hoger dan andere bewegingen. Op die manier leert de robot de beste manier om een taak uit te voeren.
De onderzoekers lieten Brett een aantal motorische taken uitvoeren, zoals het schroeven van een dop op een flesje of het op elkaar stapelen van legoblokken. Door het algoritme kon de robot dergelijke taken in ongeveer tien minuten leren, wanneer de onderzoekers hem van tevoren de coördinaten gaven van de verschillende objecten in de omgeving. Wanneer Brett de objecten in de scène zelf moest herkennen, kostte het hem ongeveer drie uur om een taak aan te leren.
De onderzoekers zijn optimistisch over het potentieel van een robot die met deep learning taken aanleert. Ze verwachten dat dergelijke technieken robots op een termijn van vijf tot tien jaar in staat stellen om complexere taken uit te voeren.