Ho usato RandomForest per un problema di regressione. Ho usato importance(rf,type=1)
per ottenere% IncMSE per le variabili e uno di loro ha% IncMSE negativo. Questo significa che questa variabile è dannosa per il modello? Ho cercato Internet per ottenere delle risposte, ma non ne ho trovato una chiara. Ho anche trovato qualcosa di strano nella sintesi del modello (allegata sotto), sembra che un solo albero è stato utilizzato anche se ho definito ntrees
come 800.Che cosa significa negativo% IncMSE nel pacchetto RandomForest?
modello:
rf<-randomForest(var1~va2+var3+..+var35,data=d7depo,ntree=800,keep.forest=FALSE, importance=TRUE)
summary(rf)
Length Class Mode
call 6 -none- call
type 1 -none- character
predicted 26917 -none- numeric
mse 800 -none- numeric
rsq 800 -none- numeric
oob.times 26917 -none- numeric
importance 70 -none- numeric
importanceSD 35 -none- numeric
localImportance 0 -none- NULL
proximity 0 -none- NULL
ntree 1 -none- numeric
mtry 1 -none- numeric
forest 0 -none- NULL
coefs 0 -none- NULL
y 26917 -none- numeric
test 0 -none- NULL
inbag 0 -none- NULL
terms 3 terms call
Grazie mille LyzandeR per la tua risposta dettagliata e chiara, Saluti, Ron – mql4beginner
Felice di aver aiutato Ron :). Se vuoi approfondire puoi dare un'occhiata [qui] (http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm). Questo è dello stesso Breiman (l'inventore delle foreste casuali) e spiega esattamente come lavorano in un inglese semplice senza (un sacco di) formule matematiche. Questo è esattamente il riferimento al pacchetto rf utilizzato per l'implementazione. – LyzandeR
Grazie, lo verificherò .. – mql4beginner