Voglio valutare un modello di rischio esponenziale con un predittore in R. Per qualche motivo, ottengo coefficienti con segni opposti quando lo stimolo usando un glm poisson con il log di offset t e quando uso solo la funzione di sopravvivenza del pacchetto di sopravvivenza. Sono sicuro che la spiegazione è perfettamente ovvia ma non riesco a capirlo.Direzioni opposte dei coefficienti del modello di rischio esponenziale (con survreg e glit poisson)
Esempio
t <- c(89,74,23,74,53,3,177,44,28,43,25,24,31,111,57,20,19,137,45,48,9,17,4,59,7,26,180,56,36,51,6,71,23,6,13,28,16,180,16,25,6,25,4,5,32,94,106,1,69,63,31)
d <- c(0,1,1,0,1,1,0,1,1,0,1,1,1,1,0,0,1,0,1,1,1,0,1,0,1,1,0,0,1,1,1,1,1,1,1,1,1,0,1,1,1,1,1,1,1,0,1,1,1,1,1)
p <- c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,0,1,1,1)
df <- data.frame(d,t,p)
# exponential hazards model using poisson with offest log(t)
summary(glm(d ~ offset(log(t)) + p, data = df, family = "poisson"))
Produce:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -5.3868 0.7070 -7.619 2.56e-14 ***
p 1.3932 0.7264 1.918 0.0551 .
Rispetto
# exponential hazards model using survreg exponential
require(survival)
summary(survreg(Surv(t,d) ~ p, data = df, dist = "exponential"))
Produce:
Value Std. Error z p
(Intercept) 5.39 0.707 7.62 2.58e-14
p -1.39 0.726 -1.92 5.51e-02
Perché i coefficienti sono in direzioni opposte e come interpreterei i risultati come stanno? Grazie!
Ok, quindi sto iniziando a leggere l'idea leggendo [questo] (http://www.math.ku.dk/~richard/courses/regression2014/survival.html). Mentre il modello di Poisson stima i pericoli, il modello di sopravvivenza è un modello di tempo di fallimento accelerato. Dato che sto usando un modello esponenziale e non un Weibull, i coefficienti sono esattamente gli stessi solo in direzioni opposte. Comunque sto ancora cancellando l'interpretazione. – fmerhout
Questo è facile. Le variabili di risposta nei due modelli sono diverse. Per Poisson, stai modellando il conteggio/stato degli eventi (solo da 0-1), quindi il coef è come 'rischio' o 'rischio', mentre nel 'modello di sopravvivenza' il tempo del modello, quindi il coef è come 'sopravvivenza' (log time ratio), che è correlato negativamente al "rischio". Più alto è il rischio/pericolo, più breve è il tempo di sopravvivenza. – Eric