Seminar im Hauptstudium

Im Wintersemester 2003/2004 findet am Lehrstuhl für Informatik VI ein

Seminar "Data Mining and Learning from Data"

statt.

At the moment, the seminar is scheduled between Monday, January 19, 2004 and Friday, January 23, 2004.

This means the following:


schedule:

mon jan 19 13.30-15 topic 1
mon jan 19 15-16.30 topic 2
mon jan 19 16.30-18 topic 3a
wed jan 21 14-15.30 topic 3b
wed jan 21 15.30-17 topic 4
wed jan 21 17-18.30 topic 5
thu jan 22 9-10.30 topic 6
thu jan 22 10.30-12 topic 7
thu jan 22 13-14.30 topic 9
thu jan 22 14.30-16 topic 10


Die Anmeldung zu den Seminaren erfolgt dieses Jahr zentral. Genaueres wird rechtzeitig auf den Webseiten der Fachgruppe Informatik bekanntgegeben.

Das Seminar findet als Blockveranstaltung gegen Ende der Vorlesungszeit, vermutlich Ende Januar 2004 statt. Die genauen Termine werden im Laufe des Semesters bekanntgegeben.

Inhalt: Das Seminar wird einen Überblick über Themen aus dem Bereich Data Mining geben, insbesondere im Kontext Machine Learning und Mustererkennung. (siehe auch Vortragsthemen und Literatur)

Voraussetzungen:

Zuordnung: praktische Informatik, Vertiefung



Vortragsthemen, jeweilige Literatur und Betreuer und Teilnehmer:

1. Introduction (Vortragender: Stefan Hirschmeier, Betreuer: Klaus Macherey)

2. Preprocessing, Visualization, and Exploration (Vortragender: Jonathan Diehl; Betreuer: Daniel Keysers)

3.a + 3.b Data Analysis, Uncertainty, and Statistical Modeling
(Vortragender: Alexander Reinhard; Betreuer: Maja Popovic und Vortragender: Thorsten Holz; Betreuer: Daniel Keysers)

4. Score Functions (Vortragender: Carsten Fuhs; Betreuer: Nicola Ueffing)

5. Decision Trees (Vortragender: Sebastian Max; Betreuer: Tibor Szilassy)

6. Neural Networks, Support Vector Machines, and ... (Vortragender: Halil Gülez; Betreuer: Shahram Khadivi)

7. Rule Learning (Vortragender: Ralph O. Delfs; Betreuer: Max Bisani)

8. Descriptive Models and Cluster Analysis (Vortragender: Chengzhi Xue; Betreuer: Oliver Bender)

9. Search and Optimization (Vortragende: Jin Sun; Betreuer: Richard Zens)

10. Retrieval by Content (Vortragende: Heike Haegert; Betreuer: Wolfgang Macherey)


Literatur:

D. Hand, H. Manila, P. Smyth: Principles of Data Mining. MIT Press, Cambridge, MA, 2001.

J. Han, M. Kamber: Data Mining: Concepts and Techniques. Academic Press, San Diego, CA, 2001.

T. Hastie, R. Tibshirani, J. Friedman: The Elements of Statistical Learning. Springer, New York, 2001.

I.H. Witten, E. Frank: Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kauffman, San Francisco, CA, 2000.

R.O. Duda, P.E. Hart, D.G. Stork: Pattern Classification. 2nd edition. Wiley, New York, 2001.

P. Norvig, S. Russell: Artificial intelligence: A modern approach. 2nd edition. Prentice Hall, Upper Saddle River, NJ, 2003.

A. Moore: Statistical Data Mining Tutorials


Ablauf und Termine:


Informationen zur Ausarbeitung und zum Vortrag:


Es wird empfohlen, sowohl die ca. 20-seitige Ausarbeitung als auch die Folien für den Seminarvortrag (45 Minuten reine Redezeit + 15 Minuten Diskussion) in LaTeX zu erstellen. Weiter unten finden sich Dokumentvorlagen für die Ausarbeitung und den Vortrag sowie mehrere  LaTeX Dokumentationen, die im WWW verfügbar sind. In jedem Fall sollen die Folien und die Ausarbeitung im pdf-Format elektronisch eingereicht werden.

Rückfragen in Bezug auf alle organisatorischen Punkte bitte an:

Dipl.-Inform. Daniel Keysers
RWTH Aachen
Lehrstuhl für Informatik VI
Ahornstr. 55
52056 Aachen

Raum 6125a
Telefon: 0241 / 80 21 610
E-Mail: keysers@cs.rwth-aachen.de