2016-06-09 20 views
6

ho un seguenti dati di sopravvivenzaConfrontando la sopravvivenza in punti temporali specifici

library(survival) 
data(pbc) 

#model to be plotted and analyzed, convert time to years 
fit <- survfit(Surv(time/365.25, status) ~ edema, data = pbc) 

#visualize overall survival Kaplan-Meier curve 
plot(fit) 

Ecco come la curva di Kaplan-Meier risultante assomiglia

enter image description here

sto ulteriormente calcolando sopravvivenza a 1, 2, 3 anni in questo modo:

>  summary(fit,times=c(1,2,3)) 

Call: survfit(formula = Surv(time/365.25, status) ~ edema, data = pbc) 

232 observations deleted due to missingness 
       edema=0 
time n.risk n.event survival std.err lower 95% CI upper 95% CI 
    1 126  12 0.913 0.0240  0.867  0.961 
    2 112  12 0.825 0.0325  0.764  0.891 
    3  80  26 0.627 0.0420  0.550  0.714 

       edema=0.5 
time n.risk n.event survival std.err lower 95% CI upper 95% CI 
    1  22  7 0.759 0.0795  0.618  0.932 
    2  17  5 0.586 0.0915  0.432  0.796 
    3  11  4 0.448 0.0923  0.299  0.671 

       edema=1 
time n.risk n.event survival std.err lower 95% CI upper 95% CI 
    1  8  11 0.421 0.1133  0.2485  0.713 
    2  5  3 0.263 0.1010  0.1240  0.558 
    3  3  2 0.158 0.0837  0.0559  0.446 

Come è possibile vedere, l'output risultante mostra intervalli di confidenza al 95% tra diversi livelli di edema ma nessun valore p effettivo. Se gli intervalli di confidenza si sovrappongono o no, ho ancora una buona idea se la sopravvivenza in questi momenti sia significativamente diversa o meno, ma mi piacerebbe avere valori p esatti. Come lo posso fare?

+0

non credo che si dovrebbe e soprattutto non dovrebbe essere chiedere l'uso di un metodo esatto. I valori P sarebbero più appropriati per i test globali delle differenze tra le curve. –

+0

@ 42 ci sono situazioni in cui la sopravvivenza del punto è importante e la letteratura ne ha molti esempi. Certamente, il valore P per la differenza complessiva è molto importante, ma ce l'ho già. – Oposum

+0

Hai visto le note delle lezioni disponibili qui: ftp: //biostat.wisc.edu/pub/chappell/641/notes.week7and8and9/comparison.pdf? Come descritto nel documento collegato, ci sono molti modi per farlo. – joemienko

risposta

3

La tua domanda è 'sono tassi di sopravvivenza x-anno diversi per le diverse categorie di edema'.

Ad esempio, se sei interessato a tassi di sopravvivenza a 3 anni; devi solo concentrarti su quella parte della curva (i primi 3 anni di follow-up), come mostrato nella figura. Il tempo di follow-up per i pazienti che sono ancora vivi dopo 3 anni è impostato su 3 anni (cioè, tempo massimo di follow-up in questa analisi): pbc$time[pbc$time > 3*365.25] <- 3*365.25.

Calcolare un test di log-rank utilizzando coxph nel pacchetto 'survival' (lo stesso pacchetto che si sta già utilizzando nell'analisi) per questo set di dati fornirà il valore P che indica se la sopravvivenza a tre anni è diversa tra i tre gruppi (molto significativo in questo esempio). È inoltre possibile utilizzare lo stesso modello per generare valori P e hazard ratio per l'associazione di edema con sopravvivenza causa-specifica.

KM curves for maximum follow-up of 3y

+0

grazie, è una soluzione e non necessariamente una "sopravvivenza" del tempo, ma comunque utile. – Oposum