Seminar Reinforcement Learning / Oberseminar Adaptive Robotersteuerung
Seminar im Sommersemester 2011. Uwe Dick, Prof. Tobias Scheffer.
Termine
Die Veranstaltungen umfassen jeweils 2 SWS (3 LP). Die Seminare finden als Blockveranstaltung statt.
- Vorbesprechung und Themenvergabe fuer beide Veranstaltungen am 13.04.2010 um 16:00 Uhr in Raum 3.04.0.02 (Folien)
- Einführungsveranstaltung: Wissenschaftliches Arbeiten: Online als Vorlesungsvideo
- Voraussichtliche Termine Blockseminar: Donnerstag 30. Juni und Freitag 1. Juli jeweils 10:00 bis ca. 13:30. Raum: Geb. 4, EG, Raum 0.22.
Inhalte
Das Seminar beschäftigt sich mit Anwendungen und Theorie von Reinforcement Learning.
Reinforcement Learning ist das Teilgebiet des maschinellen Lernens, das sich
mit dem Lernen optimaler Sequenzen von Entscheidungen beschäftigt.
Er begegnet dabei zwei Problemen:
Erstens bekommt er nicht notwendigerweise nach jeder getaetigten Bewegung ein
aussagekraeftiges Feedback von seiner Umwelt, ob ihn diese
Bewegung seinem Ziel naeher gebracht hat. Oftmals erfolgt die Bewertung erst am
Ende der vollstaendigen Folge von Bewegungen
in Form einer Rueckmeldung ueber Tor oder nicht Tor, ausgedrueckt in einem
Reward von +1 (Tor) oder -1 (kein Tor). Dieses Problem wird als Temporal Credit
Assignment Problem bezeichnet.
Zweitens fehlt dem Agenten zu Beginn des Lernen meist ein vollstaendiges Modell
seiner Welt. D.h. er kann nicht voraussagen, welchen Effekt seine Aktionen
auf die Umwelt und ihn selber haben werden.
Dieses Seminar wird sich sowohl mit Anwendungengebieten beschaeftigen in denen Reinforcement Learning Methoden erfolgreich angewendet wurden, als auch mit aktuellen theoretischen Erkenntnissen. Im Oberseminar Adaptive Robotersteuerung wird der Fokus dabei auf Anwendungen aus dem Bereich der eigenstaendigen Steuerung von Robotern liegen.
Themen
Siehe Folien zur Einführungsveranstaltung am 13.04.