Weka und Loss-Functions


Wer Weka nutzt braucht nicht auf Loss-Functions zu verzichten und kann auch den Score damit ausrechnen

Cost-Files

Weka hat extra files in denen die Kosten stehen.

man kann hier (http://www.cs.waikato.ac.nz/~ml/weka/doc_gui/weka/classifiers/CostMatrix.html) lesen:

also könnte man wohl folgendes File für DMC 2005 nehmen:

% Rows  Columns
2       2
% Matrix elements
-15.0   -13.0   
25.0    -2.0    

Score ausrechnen

gibts bei weka->classify->more options->cost sensitive evaluation der negative loss ist dann der score

Loss-Function für Classifier

classifiers->meta->cost sensitive classifier

Das ganze von der Kommandozeile

java -Xmx512m -cp /pfad/zu/weka/weka.jar weka.classifiers.meta.CostSensitiveClassifier -C /pfad/zur costfile/costfile.0diag -S 1 -W weka.classifiers.bayes.NaiveBayes -x 5 -m /pfad/zur costfile/costfile -t dataset.arff -- -K

Wir wissen nicht warum, aber der CostSensitiveClassifier hat komische Beschränkungen für die Costfile, auf jeden Fall geht es mit einer modifizierten Version, bei der Zeilenweise je soviel addiert wurde, dass die Hauptdiagonale 0 wurde (in Google gefunden). Dieses File sieht so aus:

% Rows  Columns
2       2
% Matrix elements
0.0   2.0   
27.0    0.0
Der Zusatz "-- -K" am Ende schaltet Kernel Densities im Naive Bayes Classifier an. Weglassen schaltet ihn aus.

Offline DMC Log & Layout: Arnd Ißler, http://arndissler.net/