Im Wintersemester 2003/2004 findet
am Lehrstuhl für Informatik VI ein
Seminar "Data Mining and Learning from Data"
statt.
At the moment, the seminar is scheduled between
Monday, January 19, 2004 and
Friday, January 23, 2004.
This means the following:
-
final final versions: feb 20
-
final versions: feb 6
-
talks: jan 19 - jan 22
-
test talks: jan 5 - jan 9
-
slides ready: sufficiently early before the test-talk
-
texts ready: dec 1 - dec 5
-
overview of texts ready: nov 17 - nov 21
schedule:
mon jan 19 13.30-15
|
topic 1
|
mon jan 19 15-16.30
|
topic 2
|
mon jan 19 16.30-18
|
topic 3a
|
wed jan 21 14-15.30
|
topic 3b
|
wed jan 21 15.30-17
|
topic 4
|
wed jan 21 17-18.30
|
topic 5
|
thu jan 22 9-10.30
|
topic 6
|
thu jan 22 10.30-12
|
topic 7
|
thu jan 22 13-14.30
|
topic 9
|
thu jan 22 14.30-16
|
topic 10
|
Die Anmeldung zu den Seminaren erfolgt dieses Jahr zentral. Genaueres
wird rechtzeitig auf den Webseiten der Fachgruppe Informatik bekanntgegeben.
Das Seminar findet als Blockveranstaltung gegen Ende der Vorlesungszeit,
vermutlich Ende Januar 2004 statt. Die genauen Termine werden im Laufe des
Semesters bekanntgegeben.
Inhalt: Das Seminar wird einen Überblick über Themen aus dem
Bereich Data Mining geben, insbesondere im
Kontext Machine Learning und
Mustererkennung. (siehe auch Vortragsthemen und Literatur)
Voraussetzungen:
- Vordiplom
- Besuch der Vorlesung "Mustererkennung und neuronale Netze"
Zuordnung: praktische Informatik, Vertiefung
Vortragsthemen, jeweilige Literatur und
Betreuer und Teilnehmer:
1. Introduction (Vortragender: Stefan Hirschmeier, Betreuer: Klaus Macherey)
- Hand: Ch. 1+2, 162-164, (141-161); Witten: Ch. 1; Han:
Ch. 1, 10; Hastie: Ch. 1, 437-439
2. Preprocessing, Visualization, and Exploration
(Vortragender: Jonathan Diehl; Betreuer:
Daniel Keysers)
- Hand: Ch. 3; Witten 229-250, 325-328; Han: Ch. 3;
Hastie 485-503
3.a + 3.b Data Analysis, Uncertainty, and Statistical Modeling
(Vortragender: Alexander Reinhard; Betreuer: Maja Popovic und
Vortragender: Thorsten Holz; Betreuer: Daniel Keysers)
- Hand: Ch. 4, Ch. 6, Ch. 10+11
4. Score Functions (Vortragender: Carsten Fuhs; Betreuer: Nicola Ueffing)
- Hand: Ch. 7; Witten: Ch. 5; Han: 322-326
5. Decision Trees (Vortragender: Sebastian Max; Betreuer: Tibor Szilassy)
- Hand: 141-153; Witten 89-97, 157-170, 201-210; Han: 279-296; Duda: 394-413
6. Neural Networks, Support Vector Machines, and
... (Vortragender: Halil Gülez; Betreuer: Shahram Khadivi)
- Hand: 153-157; Witten 188-201, 250-264; Han: (296-302), 303-319
7. Rule Learning (Vortragender: Ralph O. Delfs; Betreuer: Max Bisani)
- Hand: 157-160, Ch. 13; Witten: 77-82, 97-111, 170-188; Han: Ch. 6; Hastie: 439-453
8. Descriptive Models and Cluster Analysis (Vortragender:
Chengzhi Xue; Betreuer: Oliver Bender)
- Hand: Ch. 9; Witten: 210-227; Han: Ch. 8; Hastie 453-480
9. Search and Optimization (Vortragende: Jin Sun; Betreuer: Richard Zens)
10. Retrieval by Content (Vortragende: Heike Haegert; Betreuer: Wolfgang Macherey)
- Hand 160-162, Ch. 14; Witten 331-336 + X
Literatur:
D. Hand, H. Manila, P. Smyth:
Principles of Data Mining.
MIT Press, Cambridge, MA, 2001.
J. Han, M. Kamber:
Data Mining: Concepts and Techniques.
Academic Press, San Diego, CA, 2001.
T. Hastie, R. Tibshirani, J. Friedman:
The Elements of Statistical Learning.
Springer, New York, 2001.
I.H. Witten, E. Frank:
Data Mining: Practical Machine Learning Tools and Techniques
with Java Implementations.
Morgan Kauffman, San Francisco, CA, 2000.
R.O. Duda, P.E. Hart, D.G. Stork:
Pattern Classification. 2nd edition.
Wiley, New York,
2001.
P. Norvig, S. Russell:
Artificial intelligence: A modern approach. 2nd edition.
Prentice Hall, Upper Saddle River, NJ,
2003.
A. Moore: Statistical Data Mining Tutorials
Ablauf und Termine:
- Gliederungen: Abgabe bis spätestens
6 Wochen vor dem Probevortragstermin im Sekretariat des Lehrstuhls Informatik
VI oder bei dem Betreuer/der Betreuerin.
- Ausarbeitungen: Abgabe bis spätestens 1 Monat
vor dem Probevortragstermin im Sekretariat des Lehrstuhls Informatik VI
oder bei dem Betreuer/der Betreuerin.
- Vortragsfolien: Abgabe bis spätestens 1 Woche
vor dem Probevortragstermin im Sekretariat des Lehrstuhls Informatik VI
oder bei dem Betreuer/der Betreuerin.
- Probevorträge: siehe Themen, mindestens 2 Wochen
vor dem Vortragstermin.
- Seminarvorträge: Der Vortragsblock findet vermutlich
Ende Januar 2004 statt. Die genaue Einteilung wird unter den einzelnen
Themen bekanntgegeben.
- Endgültige (ggfls. korrigierte) Ausarbeitungen und Vortragsfolien:
Abgabe bis spätestens 2 Wochen nach dem Vortragstermin im Sekretariat
des Lehrstuhls Informatik VI oder bei dem Betreuer/der Betreuerin.
- Anwesenheitspflicht: Voraussetzung für die Vergabe
eines Leistungsnachweises ist die Anwesenheit aller Seminarteilnehmer und
-teilnehmerinnen zu allen Vortragsterminen.
Informationen zur Ausarbeitung und zum Vortrag:
Es wird empfohlen, sowohl die ca. 20-seitige Ausarbeitung als auch die Folien für
den Seminarvortrag (45 Minuten reine Redezeit + 15 Minuten Diskussion) in
LaTeX zu erstellen. Weiter unten finden sich Dokumentvorlagen für die
Ausarbeitung und den Vortrag sowie mehrere LaTeX Dokumentationen, die
im WWW verfügbar sind. In jedem Fall sollen die Folien und die
Ausarbeitung im pdf-Format elektronisch eingereicht werden.
- Online LaTeX-Dokumentationen:
- Einige Regeln für Folien und Ausarbeitung:
- Beachten Sie Bezüge zu anderen Themen
im Seminar und kommunizieren Sie untereinander!
- Es wird erwartet, dass Sie sich weitere Literatur
zu Ihrem Thema eigenständig besorgen. Fragen zur Literaturrecherche
werden Ihnen in der Bibliothek der Fachgruppe Informatik gern beantwortet.
Die Möglichkeit zur Recherche besteht natürlich auch in der Lehrstuhlbibliothek
am Lehrstuhl für Informatik VI.
- Tabellen haben immer eine Überschrift.
- Grafiken haben immer eine Unterschrift.
- Falls Sie keine adäquate Übersetzung für
englische Fachausdrücke finden, benutzen Sie diese unverändert.
- Ausarbeitungen und Folien können auch in Englisch angefertigt
werden (gute Übung!).
- Zitieren Sie alle von Ihnen verwendete Literatur.
- Die Form der Zitate soll wie in der Vorlage
für die Ausarbeitung vorgegeben aussehen.
- Verwenden Sie Beispiele, um das Gesagte anschaulich zu erläutern.
- Beispiele sollten so komplex wie nötig und so einfach
wie möglich sein.
- Ihre Folien sollen Sie als Vortragenden nicht ersetzen, sondern:
- wesentliche Zusammenhänge aufzeigen;
- eine Gedächtnisstütze für den Zuhörer
(und für Sie als Vortragenden) sein;
- dem Zuhörer die Orientierung in Ihrem Vortrag erleichtern;
- Keine ausformulierten Sätze, sondern statt dessen prägnante
Stichworte enthalten;
- Illustrationen einsetzen, wo immer Sie sinnvoll sind - ein
Bild kann tausend Worte ersetzen!
- Abkürzungen bei erster Nennung in der folgenden
Form definieren: z.B. "[...] an der Rheinisch-Westfälischen Technischen
Hochschule (RWTH) gibt es [...]"
- Prüfen Sie, dass Sie in Ihrem Thema bleiben! Dazu sollten
Sie sich auch der Bezüge zu den anderen Themen im Seminar bewusst
sein! Ggfls. auch Querverweise auf andere Vorträge/Ausarbeitungen
dieses Seminars vornehmen.
Rückfragen in Bezug auf alle organisatorischen Punkte bitte
an:
Dipl.-Inform. Daniel Keysers
RWTH Aachen
Lehrstuhl für Informatik VI
Ahornstr. 55
52056 Aachen
Raum 6125a
Telefon: 0241 / 80 21 610
E-Mail: keysers@cs.rwth-aachen.de