Forschung - Statistische Objekterkennung



Statistische Objekterkennung in Bildern

Daniel Keysers



In dieser Arbeitsgruppe sollen aus der statistischen Mustererkennung stammende Algorithmen auf die Bildverarbeitung übertragen werden. Dabei ist das Ziel die effiziente und zuverlässige Klassifikation von Bilddaten.

Zu diesem Zweck werden die betrachteten Beobachtungen als das Resultat einer unbekannten Verteilung betrachtet, deren Parameter in einer Trainingsphase zu schätzen sind. In den implementierten Klassifikatoren werden die Beobachtungen als Realisierungen eines stochastischen Modells (z.B. vereinfachend als gaußverteilt) angesehen und die Parameter dieser Verteilung (z.B. mittels des Expectation-Maximization-Algorithmus) geschätzt. Die so gewonnenen Modelle werden dann bei der Erkennung verwendet, um mit Hilfe der Bayes'schen Entscheidungsregel die Klasse zu bestimmen, der eine Beobachtung mit maximaler Wahrscheinlichkeit angehört. Da die Merkmalsvektoren im Bereich der Bildverarbeitung häufig sehr hochdimensional sind, können diese in einem Vorverarbeitungsschritt (beispielsweise mittels einer Linearen Diskriminanzanalyse) dimensionsreduziert werden. Dadurch werden einerseits Schätzfehler in der Trainingsphase minimiert, andererseits leistet die LDA die bezüglich der Klassentrennbarkeit der Daten optimale lineare Projektion in einen niederdimensionalen Merkmalsraum.

Die gewonnenen Erkenntnisse zur Klassifikation von einzelnen Objekten sollen außerdem zur Erkennung von Objekten in komplexeren Szenen eingesetzt werden. Dazu wird die Bayes'sche Entscheidungsregel geeignet zur Klassifikation mehrerer Objekte unter Berücksichtigung von variablem Hintergrund erweitert. Der dabei entstehende Suchraum muss mit geeigneten Methoden begrenzt werden. Die entstehenden Verfahren sollen unter anderem zum objekt-basierten Image Retrieval eingesetzt werden.
 
 

 
Beispiele für OCR-Daten (NIST)

  
Beispiele für Aufnahmen roter Blutkörperchen



Momentan werden am i6 die Themen Handschrifterkennung (Handwritten OCR) als auch die Klassifikation roter Blutzellen (in Zusammenarbeit mit dem Institut für Physiologie des Universitätsklinikums) bearbeitet. Eine weitere benutzte Datensammlung ist die des IRMA-Projektes, bestehend aus medizinischen Röntgenbildern. Zur schnellen Evaluierung neuer Algorithmen steht darüberhinaus eine synthetische Bilddatenbank (die Chair-Image-Database des Max-Planck-Instituts) zur Verfügung. Ausserdem werden die Daten der Columbia University Image Object Library verwendet.

Besondere Beachtung findet momentan die Berücksichtigung von Invarianzen in den statistischen Modellen. Dies geschieht etwa durch Verwendung der von Simard vorgeschlagenen Tangentendistanz und durch die Verwendung des sogenannten Image Distortion Modells.
 

Auch im Zuge dieses Projektes sind ständig Diplom-/ und Studienarbeiten sowie Hiwitätigkeiten zu vergeben. Interessenten wenden sich bitte an: 

Dipl.-Inform. Daniel Keysers
Lehrstuhl für Informatik VI
Ahornstrasse 55
52056 Aachen
Tel.: 0241-8021610
keysers@informatik.rwth-aachen.de
 

Einige Publikationen:

D. Keysers, W. Macherey, J. Dahmen, and H. Ney. Learning of Variability for Invariant Statistical Pattern Recognition. In ECML 2001, 12th European Conference on Machine Learning. Freiburg, Germany, pages 263-275, Volume 2167 of Lecture Notes in Computer Science, Springer, September 2001. (abstract, .ps.gz, .ps, .pdf)

J. Dahmen, D. Keysers, and H. Ney. Combined Classification of Handwritten Digits using the 'Virtual Test Sample Method'. MCS 2001, 2nd International Workshop on Multiple Classifier Systems. Cambridge, UK, pages 109-118, Volume LNCS 2096 of Lecture Notes in Computer Science, Springer, July 2001. (abstract, .ps)

J. Dahmen, D. Keysers, H. Ney, and M. O. Güld. Statistical Image Object Recognition using Mixture Densities. Mathematics and Image Analysis Conference, Paris, France, September 2000. Published in Journal of Mathematical Imaging and Vision, Volume 14, Number 3, pages 285-296, May 2001. Kluwer

D. Keysers, J. Dahmen, T. Theiner, H. Ney, "Experiments with an Extended Tangent Distance".PostScript downloaden
15th International Conference on Pattern Recognition, pp. 38-42, Barcelona, Spain, September 2000.

J. Dahmen, D. Keysers, M. Güld, H. Ney, "Invariant Image Object Recognition using Mixture Densities",PostScript downloaden
15th International Conference on Pattern Recognition, pp. 614-617, Barcelona, Spain, September 2000.

D. Keysers, J. Dahmen, H. Ney, "A Probabilistic View on Tangent Distance",PostScript downloaden
22. DAGM Symposium Mustererkennung, pp. 107-114, Kiel, Germany, September 2000.

J. Dahmen, D. Keysers, Michael Pitz, H. Ney, "Structured Covariance Matrices for Image Object Recognition",PostScript downloaden
22. DAGM Symposium Mustererkennung, pp. 99-106, Kiel, Germany, September 2000.

J. Dahmen, T. Theiner, D. Keysers, H. Ney, T. Lehmann, and B. Wein. "Classification of Radiographs in the `Image Retrieval in Medical Applications' System (IRMA)", PostScript downloaden
6th International RIAO Conference on Content-Based Multimedia Information Access, Paris, France, pages 551-566, April 2000.

J. Dahmen, K. Beulen, M. Güld, H. Ney, "A Mixture Density Based Approach to Object Recognition for Image Retrieval", PostScript downloaden
6th International RIAO Conference on Content-Based Multimedia Information Access, pp. 1632-1647, Paris, France, April 2000.

D. Keysers. "Invariante Objekterkennung (in German)", PostScript downloaden
Informatiktage 2000 der Gesellschaft für Informatik, Bad Schussenried, Germany, October 2000, in press.

J. Dahmen, J. Hektor, R. Perrey, "Automatic Classification of Red Blood Cells using Gaussian Mixture Densities", PostScript downloaden
Bildverarbeitung für die Medizin 2000, pp. 331-335, Munich, Germany, March 2000.

J. Dahmen, R. Schlüter, H. Ney. "Discriminative Training of Gaussian Mixtures for Image Object Recognition", PostScript downloaden
21. DAGM Symposium Mustererkennung, W. Förstner, J. Buhmann, A. Faber, P. Faber (eds.), pp. 205-212, Bonn, Germany, September 1999.

J. Dahmen, K. Beulen, H. Ney. "Objektklassifikation mit Mischverteilungen", PostScript downloaden
20. DAGM Symposium Mustererkennung 1998, P. Levi, R.-J. Ahlers, F. May, M. Schanz (eds.), pp.167-174, Stuttgart, Germany, September 1998.
 

Forschung Last modified: Wed Nov 14 12:08:40 CET 2001