ho un seguenti dati di sopravvivenzaConfrontando la sopravvivenza in punti temporali specifici
library(survival)
data(pbc)
#model to be plotted and analyzed, convert time to years
fit <- survfit(Surv(time/365.25, status) ~ edema, data = pbc)
#visualize overall survival Kaplan-Meier curve
plot(fit)
Ecco come la curva di Kaplan-Meier risultante assomiglia
sto ulteriormente calcolando sopravvivenza a 1, 2, 3 anni in questo modo:
> summary(fit,times=c(1,2,3))
Call: survfit(formula = Surv(time/365.25, status) ~ edema, data = pbc)
232 observations deleted due to missingness
edema=0
time n.risk n.event survival std.err lower 95% CI upper 95% CI
1 126 12 0.913 0.0240 0.867 0.961
2 112 12 0.825 0.0325 0.764 0.891
3 80 26 0.627 0.0420 0.550 0.714
edema=0.5
time n.risk n.event survival std.err lower 95% CI upper 95% CI
1 22 7 0.759 0.0795 0.618 0.932
2 17 5 0.586 0.0915 0.432 0.796
3 11 4 0.448 0.0923 0.299 0.671
edema=1
time n.risk n.event survival std.err lower 95% CI upper 95% CI
1 8 11 0.421 0.1133 0.2485 0.713
2 5 3 0.263 0.1010 0.1240 0.558
3 3 2 0.158 0.0837 0.0559 0.446
Come è possibile vedere, l'output risultante mostra intervalli di confidenza al 95% tra diversi livelli di edema
ma nessun valore p effettivo. Se gli intervalli di confidenza si sovrappongono o no, ho ancora una buona idea se la sopravvivenza in questi momenti sia significativamente diversa o meno, ma mi piacerebbe avere valori p esatti. Come lo posso fare?
non credo che si dovrebbe e soprattutto non dovrebbe essere chiedere l'uso di un metodo esatto. I valori P sarebbero più appropriati per i test globali delle differenze tra le curve. –
@ 42 ci sono situazioni in cui la sopravvivenza del punto è importante e la letteratura ne ha molti esempi. Certamente, il valore P per la differenza complessiva è molto importante, ma ce l'ho già. – Oposum
Hai visto le note delle lezioni disponibili qui: ftp: //biostat.wisc.edu/pub/chappell/641/notes.week7and8and9/comparison.pdf? Come descritto nel documento collegato, ci sono molti modi per farlo. – joemienko