Applicare t-test su molte colonne in un dataframe diviso per il fattore

Ho un dataframe con una colonna fattore con due livelli e molte colonne numeriche. Voglio dividere il dataframe dalla colonna factor e fare t-test sulle coppie di colori.Applicare t-test su molte colonne in un dataframe diviso per il fattore

Utilizzando l'esempio dataset Puromicina voglio il risultato di guardare qualcosa di simile:

Variable Treated Untreated p-value Test-statistic CI of difference**** 
Conc  0.3450 0.2763   XXX  T   XX - XX 
Rate  141.58 110.7272  xxx  T   XX - XX

Credo che sto cercando una soluzione che utilizza PLYR che possono un'uscita i risultati di cui sopra in un bel dataframe.

(L'Puromicina contiene solo due variabili numeriche, ma la soluzione che sto cercando potrebbe lavorare su una dataframe con molte variabili numeriche)

UPDATE - cercherò di chiarire cosa intendo.

Vorrei andare dai dati che assomigliano a questo:

Grouping variable var1 var2 var3 var4 var5 
1   3 5 7 3 7 
1   3 7 5 9 6 
1   5 2 6 7 6 
1   9 5 7 0 8 
1   2 4 5 7 8 
1   2 3 1 6 4 
2   4 2 7 6 5 
2   0 8 3 7 5 
2   1 2 3 5 9 
2   1 5 3 8 0 
2   2 6 9 0 7 
2   3 6 7 8 8 
2   10 6 3 8 0

Per un dataframe risultato che simile a questa:

"Mean in group 1" "Mean in group 2" "P-value of difference" "N" 

var1   ##   ##   ##   ##  
var2   ##   ##   ##   ## 
var3   ##   ##   ##   ## 
var4   ##   ##   ##   ## 
var5   ##   ##   ##   ##

Forse è qualcosa con mapply Cerco perché voglio suddividere il mio dataframe in dataframe1 e dataframe2 con un fattore a due livelli e applicare una funzione (t-test) alle prime parti di dataframe1 e dataframe2, e poi un t-test sulle seconde parti di dataframe1 e dataframe2, e poi un t-test per il thi parti di dataframe1 e dataframe2 e così via su tutte le coppie di colonne generate dalla divisione per fattore.

fonte

2012-12-09 Rasmus Larsen

Grazie per l'aiuto modifica. –

Cosa hai provato con plyr? – agstudy

Non ricordo cosa ho provato in plyr, solo che non ho potuto farlo. Ho letto l'articolo plyr dal software J stat, ma gli esempi usati erano troppo complicati per capirlo. –

Forse questo produce il risultato che stai cercando:

df <- read.table(text="Group var1 var2 var3 var4 var5 
1   3 5 7 3 7 
1   3 7 5 9 6 
1   5 2 6 7 6 
1   9 5 7 0 8 
1   2 4 5 7 8 
1   2 3 1 6 4 
2   4 2 7 6 5 
2   0 8 3 7 5 
2   1 2 3 5 9 
2   1 5 3 8 0 
2   2 6 9 0 7 
2   3 6 7 8 8 
2   10 6 3 8 0", header = TRUE) 


t(sapply(df[-1], function(x) 
    unlist(t.test(x~df$Group)[c("estimate","p.value","statistic","conf.int")])))

Il risultato:

 estimate.mean in group 1 estimate.mean in group 2 p.value statistic.t conf.int1 conf.int2 
var1     4.000000     3.000000 0.5635410 0.5955919 -2.696975 4.696975 
var2     4.333333     5.000000 0.5592911 -0.6022411 -3.104788 1.771454 
var3     5.166667     5.000000 0.9028444 0.1249164 -2.770103 3.103436 
var4     5.333333     6.000000 0.7067827 -0.3869530 -4.497927 3.164593 
var5     6.500000     4.857143 0.3053172 1.0925986 -1.803808 5.089522

fonte

2012-12-10 13:48:46

Esattamente quello di cui avevo bisogno, grazie! –

Forse si può trovare questo utile

res <- sapply(split(Puromycin[,-3], Puromycin$state), t.test)[c(1:3,5),] 
conf.level <- sapply(sapply(split(Puromycin[,-3], Puromycin$state), t.test)[4, ], '[', 1:2) 
res <- rbind(res, conf.level.lower=conf.level[1,], conf.level.upper=conf.level[2,]) 
res 
       treated untreated 
statistic  4.297025 4.206221  
parameter  23   21   
p.value   0.00026856 0.0003968191 
estimate   70.96417 55.50182  
conf.level.lower 36.80086 28.06095  
conf.level.upper 105.1275 82.94268

fonte

2012-12-09 20:27:36

Grazie ma ho bisogno che l'output sia come negli esempi che ho dato. Questo perché ho bisogno di farlo su molte variabili numeriche, e ho bisogno che siano presentate in fila. –

Applicare t-test su molte colonne in un dataframe diviso per il fattore

risposta

Problemi correlati