Seminar Reinforcement Learning / Oberseminar Adaptive Robotersteuerung

Seminar im Sommersemester 2011. Uwe Dick, Prof. Tobias Scheffer.


Termine

Die Veranstaltungen umfassen jeweils 2 SWS (3 LP). Die Seminare finden als Blockveranstaltung statt.


Inhalte

Das Seminar beschäftigt sich mit Anwendungen und Theorie von Reinforcement Learning.

Reinforcement Learning ist das Teilgebiet des maschinellen Lernens, das sich mit dem Lernen optimaler Sequenzen von Entscheidungen beschäftigt. Er begegnet dabei zwei Problemen:
Erstens bekommt er nicht notwendigerweise nach jeder getaetigten Bewegung ein aussagekraeftiges Feedback von seiner Umwelt, ob ihn diese Bewegung seinem Ziel naeher gebracht hat. Oftmals erfolgt die Bewertung erst am Ende der vollstaendigen Folge von Bewegungen in Form einer Rueckmeldung ueber Tor oder nicht Tor, ausgedrueckt in einem Reward von +1 (Tor) oder -1 (kein Tor). Dieses Problem wird als Temporal Credit Assignment Problem bezeichnet.
Zweitens fehlt dem Agenten zu Beginn des Lernen meist ein vollstaendiges Modell seiner Welt. D.h. er kann nicht voraussagen, welchen Effekt seine Aktionen auf die Umwelt und ihn selber haben werden.

Dieses Seminar wird sich sowohl mit Anwendungengebieten beschaeftigen in denen Reinforcement Learning Methoden erfolgreich angewendet wurden, als auch mit aktuellen theoretischen Erkenntnissen. Im Oberseminar Adaptive Robotersteuerung wird der Fokus dabei auf Anwendungen aus dem Bereich der eigenstaendigen Steuerung von Robotern liegen.


Themen

Siehe Folien zur Einführungsveranstaltung am 13.04.


-->