Seminar Information Retrieval
Seminar im Wintersemester 2008. Prof. Tobias Scheffer.
Termine
Die Veranstaltung umfasst 2 SWS (3 LP). Das Seminar findet als Blockseminar statt, die Termine werden zu Beginn des Semesters abgesprochen.
- Donnerstag, 9-11, 03.06.S15. (Vorbesprechung und Themenvergabe am 23.10.)
Inhalte
Information Retrieval beschäftigt sich mit der Suche nach und dem Zugriff auf Informationen. Web-Suchmaschinen und digitale Bibliotheken bilden inhaltliche Schwerpunkte. Neben den technischen Inhalten bildet das Erlernen eines guten Vortragsstils einen Schwerpunkt des Seminars.
Tipps zur Ausarbeitung und Vortragspräsentation
Folien der EinführungsvorlesungVorraussichtliche Themen
Thema | Literatur |
Textrepraesentation (stopwords, stemming, vector space model, tf-idf), Retrieval mit Kosinus-Ähnlichkeit, Evaluation (Precision/Recall, ROC-Analyse) |
|
Indexerstellung, Suchstrategien Das wichtigste Merkmal von Textdatenbanken ist die schnelle Textsuche. Dieses Thema behandelt die Erstellung performanter Suchindizes für statische Textdatenbanken und Suchstrategien in dynamischen Texten. |
|
Retrieval mit Probabilistischen Modellen |
|
Webseitenranking für
Internetsuchanfragen (Pagerank, HITS, Salsa, Topic-Rank) |
|
Lernen aus Clickstreams, Rank-SVM, Relevance Feedback | |
Email-Spam-Filterung auf Text-Ebene |
|
Collaborative Prediction, Recommendation Systems |
|
Textklassifikation (Rocchio, Support Vector Machines) Dieses Thema behandelt die automatische Klassifikation von Texten. z.B. Filterung von Emails |
|
Aktives Lernen |
|
Literatur
[1] Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.[2] Ricardo Baeza-Yates, Berthier Ribeiro-Neto, Modern Information Retrieval, Addison Wesley, 1999.