Seminar Reinforcement Learning / Oberseminar Adaptive Robotersteuerung

Seminar im Sommersemester 2011. Uwe Dick, Prof. Tobias Scheffer.

Termine

Die Veranstaltungen umfassen jeweils 2 SWS (3 LP). Die Seminare finden als Blockveranstaltung statt.

Vorbesprechung und Themenvergabe fuer beide Veranstaltungen am 13.04.2010 um 16:00 Uhr in Raum 3.04.0.02 (Folien)

Einführungsveranstaltung: Wissenschaftliches Arbeiten: Online als Vorlesungsvideo

Voraussichtliche Termine Blockseminar: Donnerstag 30. Juni und Freitag 1. Juli jeweils 10:00 bis ca. 13:30. Raum: Geb. 4, EG, Raum 0.22.

Inhalte

Das Seminar beschäftigt sich mit Anwendungen und Theorie von Reinforcement Learning.

Reinforcement Learning ist das Teilgebiet des maschinellen Lernens, das sich mit dem Lernen optimaler Sequenzen von Entscheidungen beschäftigt. Er begegnet dabei zwei Problemen:
Erstens bekommt er nicht notwendigerweise nach jeder getaetigten Bewegung ein aussagekraeftiges Feedback von seiner Umwelt, ob ihn diese Bewegung seinem Ziel naeher gebracht hat. Oftmals erfolgt die Bewertung erst am Ende der vollstaendigen Folge von Bewegungen in Form einer Rueckmeldung ueber Tor oder nicht Tor, ausgedrueckt in einem Reward von +1 (Tor) oder -1 (kein Tor). Dieses Problem wird als Temporal Credit Assignment Problem bezeichnet.
Zweitens fehlt dem Agenten zu Beginn des Lernen meist ein vollstaendiges Modell seiner Welt. D.h. er kann nicht voraussagen, welchen Effekt seine Aktionen auf die Umwelt und ihn selber haben werden.

Dieses Seminar wird sich sowohl mit Anwendungengebieten beschaeftigen in denen Reinforcement Learning Methoden erfolgreich angewendet wurden, als auch mit aktuellen theoretischen Erkenntnissen. Im Oberseminar Adaptive Robotersteuerung wird der Fokus dabei auf Anwendungen aus dem Bereich der eigenstaendigen Steuerung von Robotern liegen.

Themen

Siehe Folien zur Einführungsveranstaltung am 13.04.