2015-07-07 21 views
7

Credo che il metodo "rf" (randomForest) in caret imposta il numero predefinito di alberi a 500. Sfortunatamente, questo fa sì che la complessità del tempo aumenti in modo incontrollato per dataset più grandi. C'è un modo rapido per ridurre il numero di alberi senza creare un metodo personalizzato? So che l'unico parametro sintonizzabile per rf è mtry.Come si può ridurre il parametro predefinito ntree = 500 passato a RF dal caret?

Giusto per chiarire: non sto cercando di sintonizzarmi sul numero di alberi. Voglio semplicemente aggiustarlo ad un valore più basso in modo da poter eseguire rf in un ragionevole lasso di tempo.

risposta

11

È possibile specificare il parametro ntree quando si chiama il treno in questo modo:

rf <- train(X, y, method="rf", preProcess=c("center","scale"), ntree=100, trControl=fitControl) 
0

Un suggerimento sarebbe utilizzare la libreria randomForest. Ho sempre trovato che uno più semplice da usare rispetto a quello in caret, e ha un parametro per impostare il numero di alberi.

+0

concordato, ma sto cercando di utilizzare metodi Caret come ho costruito un flusso di lavoro metodo di ensemble che sfrutta l'interfaccia unificata quel segno di omissione fornisce. –

+0

Perché non puoi semplicemente modificare il codice allora :) –

+1

Ah, vedo i suggerimenti migliori sopra .... –