Cost-Files
Weka hat extra files in denen die Kosten stehen.
man kann hier (http://www.cs.waikato.ac.nz/~ml/weka/doc_gui/weka/classifiers/CostMatrix.html) lesen:
-
The element at position i,j in the matrix is the penalty for classifying an instance of class j as class i.
also könnte man wohl folgendes File für DMC 2005 nehmen:
% Rows Columns 2 2 % Matrix elements -15.0 -13.0 25.0 -2.0
Score ausrechnen
gibts bei weka->classify->more options->cost sensitive evaluation der negative loss ist dann der score
Loss-Function für Classifier
classifiers->meta->cost sensitive classifier
Das ganze von der Kommandozeile
java -Xmx512m -cp /pfad/zu/weka/weka.jar weka.classifiers.meta.CostSensitiveClassifier -C /pfad/zur costfile/costfile.0diag -S 1 -W weka.classifiers.bayes.NaiveBayes -x 5 -m /pfad/zur costfile/costfile -t dataset.arff -- -K
Wir wissen nicht warum, aber der CostSensitiveClassifier hat komische Beschränkungen für die Costfile, auf jeden Fall geht es mit einer modifizierten Version, bei der Zeilenweise je soviel addiert wurde, dass die Hauptdiagonale 0 wurde (in Google gefunden). Dieses File sieht so aus:
% Rows Columns 2 2 % Matrix elements 0.0 2.0 27.0 0.0Der Zusatz "-- -K" am Ende schaltet Kernel Densities im Naive Bayes Classifier an. Weglassen schaltet ihn aus.