DMC 2000


tobw,buck

weka

Hier einige Ergebnisse mit den 2000er-Daten, die mit Weka entstanden sind. Das File im arff-Format können wir gerne mailen. Damals wussten wir noch nix von Score also gibts nur Error-Rates. Die Daten sind unverarbeitet und sogar noch mit ID versehen.

20-fach crossvalidation, jeweils standard-parameter soweit nicht anders angegeben

andre

(alle Ergebnisse mit 5-fach Crossvalidation)

- Normalisierung aller Wert auf [0, 1]

- Fehlende Werte für ein Feature werden auf den Mittelwert aller vorhandenen Werte des Features gesetzt

helgar, arnd

- alle Ergebnisse mit Leaving One Out - Normalisierung auf [0,1]

(1 = 100%)

Vorverarbeitung: fehlende Werte durch Durchschnitt ersetzt:

average to binary: Rechne den Durchschnitt aus, und konvertiere zu 0 oder 1 nach einer bestimmten Schwelle

weighted average by index to binary: Rechne den Durchschnitt aus, in dem die k nachbarn gewichtet werden je nach dem ob sie der 1., 2. ... n. nachbar ist, dann nach einer schwelle zu 0 oder 1 runden

weighted average to binary: gewichteter Durchschitt danach wie nah dieser Nachbar an der Query-Zeile war, danach mit Schwelle auf 0 oder 1 runden

Vorverarbeitung: fehlende Werte durch nächsten Nachbarn ersetzt:


Offline DMC Log & Layout: Arnd Ißler, http://arndissler.net/