Efficient deep reinforcement learning in robotic motion planning
Promotie: | Mw. S. (Sha) Luo |
Wanneer: | 12 maart 2024 |
Aanvang: | 11:00 |
Promotor: | prof. dr. L.R.B. (Lambert) Schomaker |
Copromotor: | S.H. (Hamidreza) Mohades Kasaei, PhD |
Waar: | Academiegebouw RUG |
Faculteit: | Science and Engineering |

De beste leermethodes voor robots
Het plannen en besturen van robotbewegingen vergt het oplossen van vele problemen: onevenwichtige gegevensdistributie, simultane optimalisatie van meerdere doelen, hoge dimensionaliteit van het probleem en de 'Sim2Real'-kloof, d.w.z. de verschillen tussen de gesimuleerde en de fysieke wereld. In plaats van het programmeren van specifieke algoritmes om dit soort situaties te navigeren, wordt vandaag de dag veel gebruik gemaakt van machineleren, en in het bijzonder reinforcement learning (RL). Daarbij leert de robot met spreekwoordelijk vallen en opstaan, en wordt beloond voor gepaste acties en gestraft voor het maken van fouten.
In haar promotieonderzoek bestudeerde Sha Luo hoe ‘curriculum learning’, leren met planning, imitatieleren en een hiërarchische opzet van het leerproces kunnen helpen om de trainingsefficiëntie en robuustheid in de besturing van robotbewegingen middels RL te verbeteren. Ze ontdekte dat deze methoden allemaal een positieve rol speelden bij het verbeteren van de efficiëntie van de taakexploratie en de taakuitvoering. Het gebruik van een ondersteunend mechanisme dat de kans op positieve ervaringen gedurende taak-exploratie vergroot, draagt het meest bij aan verbeterde prestaties.
Sha Luo voerde haar promotieonderzoek uit bij het Bernoulli Institute for Mathematics, Computer Science and Artificial Intelligence, afdeling Kunstmatige Intelligentie, met financiering van het Chinese Scholarship Council. Ze vervolgt haar loopbaan als Data Scientist bij Knab.