2013-02-19 15 views
9

Esiste una funzione singola, simile a "runif", "rnorm" e simili che produce previsioni simulate per un modello lineare? Posso codificarlo da solo, ma il codice è brutto e presumo che questo sia qualcosa che qualcuno ha già fatto.Esiste una funzione o un pacchetto che simulerà le previsioni per un oggetto restituito da lm()?

slope = 1.5 
intercept = 0 
x = as.numeric(1:10) 
e = rnorm(10, mean=0, sd = 1) 
y = slope * x + intercept + e 
fit = lm(y ~ x, data = df) 
newX = data.frame(x = as.numeric(11:15)) 

Quello che mi interessa è una funzione che sembra la linea di seguito:

sims = rlm(1000, fit, newX) 

Tale funzione sarebbe tornato 1000 simulazioni di valori y, in base alle nuove variabili x.

+1

L'ultima riga nel Q mi ha confuso. 'x' è fisso; intendi simulare 'y' (la risposta) per i nuovi dati' x'? –

+0

Scusa, Gavin, hai ragione. Intendevo dire che le risposte sarebbero state simulate. Questo è stato modificato. – PirateGrunt

+2

OK, quindi si potrebbe guardare a '? Simulate' ma funziona solo con' x' corrente. Ma potreste alterarlo ('simulate.lm()') per chiamare 'predicict()' sull'oggetto del modello con 'newdata = newX' invece della chiamata corrente a' fitted() 'e quindi permettergli di procedere come con il codice normale. Supponendo che i "pesi" non siano stati usati in quanto complicherebbe le cose ... –

risposta

8

Mostrando che il suggerimento di Gavin Simpson di modificare stats:::simulate.lm è valido.

## Modify stats:::simulate.lm by inserting some tracing code immediately 
## following the line that reads "ftd <- fitted(object)" 
trace(what = stats:::simulate.lm, 
     tracer = quote(ftd <- list(...)[["XX"]]), 
     at = list(5)) 

## Prepare the data and 'fit' object 
df <- data.frame(x=x<-1:10, y=1.5*x + rnorm(length(x))) 
fit <- lm(y ~ x, data = df) 
newX <- 8:1 

## Pass in new x-values via the argument 'XX' 
simulate(fit, nsim = 4, XX = newX) 
#  sim_1 sim_2  sim_3 sim_4 
# 1 8.047710 8.647585 7.9798728 8.400672 
# 2 6.398029 7.714972 7.9713929 7.813381 
# 3 5.469346 5.626544 4.8691962 5.282176 
# 4 4.689371 4.310656 4.2029540 5.257732 
# 5 4.628518 4.467887 3.6893648 4.018744 
# 6 2.724857 4.280262 2.8902676 4.347371 
# 7 1.532617 2.400321 2.4991168 3.357327 
# 8 1.300993 1.379705 0.1740421 1.549881 

che funziona, ma questo è un pulitore (e probabilmente migliore) approccio:

## A function for simulating at new x-values 
simulateX <- function(object, nsim=1, seed=NULL, X, ...) { 
    object$fitted.values <- X 
    simulate(object=object, nsim=nsim, seed=seed, ...) 
} 

## Prepare a fit object and some new x-values 
df <- data.frame(x=x<-1:10, y=1.5*x + rnorm(length(x))) 
fit <- lm(y ~ x, data = df)  
newX <- 8:1 

## Try it out 
simulateX(fit, nsim = 4, X = newX) 
#  sim_1 sim_2  sim_3  sim_4 
# 1 8.828988 6.890874 7.397280 8.1605794 
# 2 6.162839 8.174032 3.612395 7.7999466 
# 3 5.861858 6.351116 3.448205 4.3721326 
# 4 5.298132 4.448778 2.006416 5.7637724 
# 5 7.260219 4.015543 3.063622 4.2845775 
# 6 3.107047 4.859839 6.202650 -1.0956775 
# 7 1.501132 1.086691 -1.273628 0.4926548 
# 8 1.197866 1.573567 2.137449 0.9694006 
+0

È fantastico. La seconda soluzione è bella e pulita. Il primo usa alcune tecniche di debug che non ho ancora imparato. Eccellente. Grazie. – PirateGrunt

+0

@PirateGrunt - Sono contento che tu abbia apprezzato l'esempio 'trace()': è un vero strumento powertool per lo sviluppo di R e l'esplorazione del codice. Se la userai molto, potresti apprezzare [le risposte a questa domanda] (http://stackoverflow.com/questions/11319161/what-is-a-fast-way-to-set-debugging-code-at -a-data-line-in-a-function), che rendono molto più facile trovare il valore di 'at =' corrispondente al punto di inserimento del codice desiderato. (Spesso uso 'print.func()' dalla risposta di Michael Hoffman. Provalo, ad esempio, con 'print.func (stats ::: simulate.lm)'). Godere! –