2016-03-30 40 views
5

So che il seme è impostato in generale è usato in modo che possiamo riprodurre lo stesso risultato. Ma, in realtà, cosa fa il seeding nella parte casuale della foresta. Cambia gli argomenti della funzione randomForest() in R come nTree o sampSize.Cosa fa il seme nella foresta casuale?

Sto usando ogni volta diverse sementi per il mio modello di foresta casuale, ma voglio sapere come i semi differenti influenzano un modello di foresta casuale.

+1

[Vedi qui per informazioni sui semi in R.] (http://stackoverflow.com/questions/13605271/reasons-for-using-the-set-seed-function) Dal 'randomForest' produce alberi casuali, l'impostazione del seme garantirà lo stesso risultato. Per l'uso normale, non fare nulla con il seme, sarà 'casuale' di default. – Axeman

+0

Semi diversi non cambieranno 'nTree' o' sampSize' ma possono modificare leggermente il risultato del modello, in modo più drammatico quando parametri come 'ntree' sono impostati su valori bassi. – Axeman

+1

@Axeman considera di aggiungere una risposta con una spiegazione –

risposta

2

Gli alberi crescono dai semi e così fanno le foreste ;-) (SCNR)

Ci sono diversi modi di costruire una foresta casuale, però, tutto in comune è che più alberi sono costruiti. Per migliorare l'accuratezza della classificazione su un singolo albero decisionale, i singoli alberi in una foresta casuale devono differire, come si avrebbe nTree volte lo stesso albero. Questa differenza si ottiene introducendo casualità nella generazione degli alberi. La casualità è influenzata dal seme e ciò che è più importante del seme è che l'uso dello stesso seme dovrebbe sempre generare lo stesso risultato.

In che modo la casualità influenza la struttura dell'albero? Ci sono molti modi. - crea l'albero per un sottoinsieme casuale. Questo è per ogni singolo albero della foresta viene disegnato un sottoinsieme di esempi di addestramento e quindi viene creato un albero per questo sottoinsieme - in ogni punto di decisione nell'albero, l'attributo di decisione viene selezionato in modo casuale.

Spesso questi due elementi sono combinati.

http://link.springer.com/article/10.1023%2FA%3A1010933404324#page-1