Statistische Objekterkennung in Bildern
Daniel
Keysers
In dieser Arbeitsgruppe sollen aus
der statistischen Mustererkennung stammende Algorithmen auf die
Bildverarbeitung übertragen werden. Dabei ist das Ziel die effiziente
und zuverlässige Klassifikation von Bilddaten.
Zu diesem Zweck werden die betrachteten
Beobachtungen als das Resultat einer unbekannten Verteilung betrachtet,
deren Parameter in einer Trainingsphase zu schätzen sind. In
den implementierten Klassifikatoren werden die Beobachtungen
als Realisierungen eines stochastischen Modells (z.B.
vereinfachend
als gaußverteilt) angesehen und die Parameter dieser Verteilung
(z.B. mittels
des Expectation-Maximization-Algorithmus) geschätzt. Die so gewonnenen
Modelle werden dann bei der Erkennung verwendet, um mit Hilfe der Bayes'schen
Entscheidungsregel die Klasse zu bestimmen, der eine Beobachtung mit maximaler
Wahrscheinlichkeit angehört. Da die Merkmalsvektoren im Bereich der
Bildverarbeitung häufig sehr hochdimensional sind, können diese in
einem Vorverarbeitungsschritt (beispielsweise mittels einer Linearen
Diskriminanzanalyse) dimensionsreduziert werden. Dadurch werden einerseits
Schätzfehler in der Trainingsphase minimiert, andererseits leistet
die LDA die bezüglich der Klassentrennbarkeit der Daten optimale lineare
Projektion in einen niederdimensionalen Merkmalsraum.
Die gewonnenen Erkenntnisse zur Klassifikation von einzelnen Objekten
sollen außerdem zur Erkennung von Objekten in komplexeren
Szenen eingesetzt werden. Dazu wird die Bayes'sche
Entscheidungsregel geeignet zur Klassifikation mehrerer Objekte unter
Berücksichtigung von variablem Hintergrund erweitert. Der dabei
entstehende Suchraum muss mit geeigneten Methoden begrenzt werden.
Die entstehenden Verfahren sollen unter anderem zum objekt-basierten
Image Retrieval eingesetzt werden.
Beispiele für OCR-Daten
(NIST)
Beispiele für Aufnahmen
roter Blutkörperchen
Momentan werden am i6 die Themen
Handschrifterkennung
(Handwritten OCR) als auch die Klassifikation roter Blutzellen
(in
Zusammenarbeit mit dem Institut für Physiologie des Universitätsklinikums)
bearbeitet.
Eine weitere benutzte Datensammlung ist die des
IRMA-Projektes, bestehend aus medizinischen Röntgenbildern.
Zur schnellen Evaluierung neuer Algorithmen steht darüberhinaus
eine synthetische Bilddatenbank (die Chair-Image-Database des Max-Planck-Instituts)
zur Verfügung. Ausserdem werden die Daten der Columbia University Image
Object Library verwendet.
Besondere Beachtung findet momentan die
Berücksichtigung von Invarianzen in den statistischen Modellen. Dies
geschieht etwa durch Verwendung der von Simard vorgeschlagenen Tangentendistanz
und durch die Verwendung des sogenannten Image Distortion Modells.
Auch im Zuge dieses Projektes sind ständig
Diplom-/ und Studienarbeiten sowie Hiwitätigkeiten zu
vergeben. Interessenten wenden sich bitte an:
Dipl.-Inform. Daniel Keysers
Lehrstuhl für Informatik VI
Ahornstrasse 55
52056 Aachen
Tel.: 0241-8021610
keysers@informatik.rwth-aachen.de
Einige Publikationen:
D. Keysers, W. Macherey, J. Dahmen, and H. Ney.
Learning of Variability for Invariant Statistical Pattern Recognition.
In ECML
2001, 12th European Conference on Machine Learning.
Freiburg, Germany, pages 263-275, Volume 2167 of Lecture Notes in Computer Science, Springer, September 2001. (abstract, .ps.gz,
.ps,
.pdf)
J. Dahmen, D. Keysers, and H. Ney.
Combined Classification
of Handwritten Digits using the 'Virtual Test Sample Method'.
MCS
2001, 2nd International Workshop on Multiple Classifier Systems. Cambridge, UK, pages 109-118, Volume LNCS 2096 of Lecture Notes in Computer Science, Springer, July 2001. (abstract, .ps)
J. Dahmen, D. Keysers, H. Ney, and M. O. Güld. Statistical
Image Object Recognition using Mixture Densities.
Mathematics
and Image Analysis Conference, Paris, France, September 2000. Published
in Journal of Mathematical Imaging and Vision, Volume 14, Number
3, pages 285-296, May 2001. Kluwer
D. Keysers, J. Dahmen, T. Theiner, H. Ney,
"Experiments with an Extended Tangent Distance".
15th International Conference on Pattern Recognition, pp. 38-42,
Barcelona, Spain, September 2000.
J. Dahmen, D. Keysers, M. Güld, H. Ney,
"Invariant Image Object Recognition using Mixture Densities",
15th International Conference on Pattern Recognition, pp. 614-617,
Barcelona, Spain, September 2000.
D. Keysers, J. Dahmen, H. Ney,
"A Probabilistic View on Tangent Distance",
22. DAGM Symposium
Mustererkennung, pp. 107-114, Kiel, Germany, September 2000.
J. Dahmen, D. Keysers, Michael Pitz, H. Ney,
"Structured Covariance Matrices for Image Object Recognition",
22. DAGM Symposium
Mustererkennung, pp. 99-106, Kiel, Germany, September 2000.
J. Dahmen, T. Theiner, D. Keysers, H. Ney, T. Lehmann, and B. Wein.
"Classification of Radiographs in the `Image Retrieval in
Medical Applications' System (IRMA)",

6th International RIAO Conference on
Content-Based Multimedia Information Access, Paris, France, pages 551-566, April 2000.
J. Dahmen, K. Beulen, M. Güld, H. Ney,
"A Mixture Density Based Approach to Object Recognition for Image
Retrieval",
6th International RIAO Conference on Content-Based Multimedia Information Access,
pp. 1632-1647, Paris, France, April 2000.
D. Keysers.
"Invariante Objekterkennung (in German)",
Informatiktage 2000 der Gesellschaft für Informatik,
Bad Schussenried, Germany, October 2000,
in press.
J. Dahmen, J. Hektor, R. Perrey,
"Automatic Classification of Red Blood Cells using Gaussian Mixture
Densities",
Bildverarbeitung für die Medizin 2000,
pp. 331-335, Munich, Germany, March 2000.
J. Dahmen, R. Schlüter, H. Ney.
"Discriminative Training of Gaussian Mixtures for Image Object
Recognition",
21. DAGM Symposium Mustererkennung,
W. Förstner, J. Buhmann, A. Faber, P. Faber (eds.), pp. 205-212, Bonn, Germany, September 1999.
J. Dahmen, K. Beulen, H. Ney.
"Objektklassifikation mit Mischverteilungen",
20. DAGM Symposium Mustererkennung 1998, P. Levi,
R.-J. Ahlers, F. May, M. Schanz (eds.), pp.167-174, Stuttgart, Germany, September 1998.
|