Seminar Information Retrieval
Seminar im Wintersemester 2008. Prof. Tobias Scheffer.
Termine
Die Veranstaltung umfasst 2 SWS (3 LP). Das Seminar findet als Blockseminar statt, die Termine werden zu Beginn des Semesters abgesprochen.
- Donnerstag, 9-11, 03.06.S15. (Vorbesprechung und Themenvergabe am 23.10.)
Inhalte
Information Retrieval beschäftigt sich mit der Suche nach und dem Zugriff auf Informationen. Web-Suchmaschinen und digitale Bibliotheken bilden inhaltliche Schwerpunkte. Neben den technischen Inhalten bildet das Erlernen eines guten Vortragsstils einen Schwerpunkt des Seminars.
Tipps zur Ausarbeitung und Vortragspräsentation
Folien der EinführungsvorlesungVorraussichtliche Themen
| Thema | Literatur |
| Textrepraesentation (stopwords, stemming, vector space model, tf-idf), Retrieval mit Kosinus-Ähnlichkeit, Evaluation (Precision/Recall, ROC-Analyse) |
|
| Indexerstellung, Suchstrategien Das wichtigste Merkmal von Textdatenbanken ist die schnelle Textsuche. Dieses Thema behandelt die Erstellung performanter Suchindizes für statische Textdatenbanken und Suchstrategien in dynamischen Texten. |
|
| Retrieval mit Probabilistischen Modellen |
|
| Webseitenranking für
Internetsuchanfragen (Pagerank, HITS, Salsa, Topic-Rank) |
|
| Lernen aus Clickstreams, Rank-SVM, Relevance Feedback | |
| Email-Spam-Filterung auf Text-Ebene |
|
| Collaborative Prediction, Recommendation Systems |
|
| Textklassifikation (Rocchio, Support Vector Machines) Dieses Thema behandelt die automatische Klassifikation von Texten. z.B. Filterung von Emails |
|
| Aktives Lernen |
|
Literatur
[1] Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.[2] Ricardo Baeza-Yates, Berthier Ribeiro-Neto, Modern Information Retrieval, Addison Wesley, 1999.