2013-01-20 34 views
7

Sto tentando di prevedere i valori adattati sui dati contenenti NA s e in base a un modello generato da plm. Ecco alcuni esempi di codice:Come trattare con NA in una regressione dei dati del pannello?

require(plm) 
test.data <- data.frame(id=c(1,1,2,2,3), time=c(1,2,1,2,1), 
    y=c(1,3,5,10,8), x=c(1, NA, 3,4,5)) 
model <- plm(y ~ x, data=test.data, index=c("id", "time"), 
     model="pooling", na.action=na.exclude) 
yhat <- predict(model, test.data, na.action=na.pass) 
test.data$yhat <- yhat 

Quando eseguo l'ultima linea ottengo un errore che indica che la sostituzione ha 4 righe, mentre i dati ha 5 righe.

mi hanno alcuna idea di come ottenere prevedere restituire un vettore di lunghezza 5 ...

Se invece di correre un plm ho eseguito un lm (come nella riga sottostante) ottengo il risultato atteso.

model <- lm(y ~ x, data=test.data, na.action=na.exclude) 

risposta

8

penso che questo è qualcosa che predict.plmdovrebbe da gestire per voi - sembra come una svista da parte il pacchetto di autori - ma è possibile utilizzare per implementare ?napredict per te stesso:

pp <- predict(model, test.data) 
na.stuff <- attr(model$model,"na.action") 
(yhat <- napredict(na.stuff,pp)) 
## [1] 1.371429  NA 5.485714 7.542857 9.600000