2015-04-05 74 views
14

SfondoGBM :: interact.gbm vs. Dismo :: gbm.interactions

Il manuale di riferimento per le gbm package stati funzione interact.gbm calcola H-statistica di Friedman per valutare la forza delle interazioni variabili. la statistica H è nella scala di [0-1].

Il manuale di riferimento per dismo package non fa riferimento a nessuna documentazione su come la funzione gbm.interactions rileva e modella le interazioni. Invece fornisce un elenco di procedure generali utilizzate per rilevare e modellare le interazioni. La vignetta dismo "Alberi di regressione potenziati per la modellazione ecologica" afferma che il pacchetto dismo estende le funzioni nel pacchetto gbm.

Domanda

Come si dismo::gbm.interactions effettivamente rilevare e le interazioni modello?

Perché

Chiedo questa domanda perché gbm.interactions nei dismo package produce risultati> 1, che il manuale di gbm package di riferimento dice che non è possibile.

Ho controllato il tar.gz per ciascuno dei pacchetti per vedere se il codice sorgente era simile. È abbastanza diverso da non riuscire a determinare se questi due pacchetti utilizzano lo stesso metodo per rilevare e modellare le interazioni.

risposta

3

Per riassumere, la differenza tra i due approcci si riduce a come viene stimata la "funzione di dipendenza parziale" dei due predittori.

Il pacchetto dismo si basa sul codice originariamente indicato in Elith et al., 2008 e è possibile trovare la fonte originale nel materiale supplementare. Il documento descrive molto brevemente la procedura. Fondamentalmente le previsioni del modello sono ottenute su una griglia di due predittori, impostando tutti gli altri predittori ai loro mezzi. Le previsioni del modello vengono quindi regredite sulla griglia. Gli errori quadratici medi di questo modello vengono quindi moltiplicati per 1000. Questa statistica indica le partenze delle previsioni del modello da una combinazione lineare dei predittori, che indica una possibile interazione.

Dal pacchetto dismo, è inoltre possibile ottenere il codice sorgente pertinente per gbm.interactions. Il test interazione si riduce alle seguenti comandi (copiati direttamente dalla sorgente):

interaction.test.model <- lm(prediction ~ as.factor(pred.frame[,1]) + as.factor(pred.frame[,2])) 

interaction.flag <- round(mean(resid(interaction.test.model)^2) * 1000,2) 

pred.frame contiene una griglia dei due predittori in questione, e prediction è la previsione dal modello adattato originale gbm dove tutti ma due predittori in considerazione sono fissati ai loro mezzi.

Questo è diverso rispetto alla statistica H di Friedman (Friedman & Popescue, 2005), che è stimata tramite la formula (44) per qualsiasi coppia di predittori. Questo è essenzialmente il distacco dall'additività per due predittori con una media di oltre i valori delle altre variabili, NON l'impostazione delle altre variabili. È espresso come una percentuale della varianza totale della funzione di dipendenza parziale delle due variabili (o delle previsioni implicite del modello), quindi sarà sempre tra 0-1.