Im folgenden wird das Clustern von kontextabhängigen Phonemmodellen mit Hilfe von Entscheidungsbäumen (CART) beschrieben. Die mit Hilfe dieses Verfahrens gewonnenen Klassen werden als Tied-State-Modelle für Training und Erkennung eingesetzt. Da die Zahl der Tied-State-Modelle geringer als die Zahl der ursprünglichen Modelle ist, sind beim Trainieren weniger Parameter zu schätzen, so daß die Tied-State-Modelle besser geschätzt werden können.