Ho un dataframe con una colonna fattore con due livelli e molte colonne numeriche. Voglio dividere il dataframe dalla colonna factor e fare t-test sulle coppie di colori.Applicare t-test su molte colonne in un dataframe diviso per il fattore
Utilizzando l'esempio dataset Puromicina voglio il risultato di guardare qualcosa di simile:
Variable Treated Untreated p-value Test-statistic CI of difference****
Conc 0.3450 0.2763 XXX T XX - XX
Rate 141.58 110.7272 xxx T XX - XX
Credo che sto cercando una soluzione che utilizza PLYR che possono un'uscita i risultati di cui sopra in un bel dataframe.
(L'Puromicina contiene solo due variabili numeriche, ma la soluzione che sto cercando potrebbe lavorare su una dataframe con molte variabili numeriche)
UPDATE - cercherò di chiarire cosa intendo.
Vorrei andare dai dati che assomigliano a questo:
Grouping variable var1 var2 var3 var4 var5
1 3 5 7 3 7
1 3 7 5 9 6
1 5 2 6 7 6
1 9 5 7 0 8
1 2 4 5 7 8
1 2 3 1 6 4
2 4 2 7 6 5
2 0 8 3 7 5
2 1 2 3 5 9
2 1 5 3 8 0
2 2 6 9 0 7
2 3 6 7 8 8
2 10 6 3 8 0
Per un dataframe risultato che simile a questa:
"Mean in group 1" "Mean in group 2" "P-value of difference" "N"
var1 ## ## ## ##
var2 ## ## ## ##
var3 ## ## ## ##
var4 ## ## ## ##
var5 ## ## ## ##
Forse è qualcosa con mapply Cerco perché voglio suddividere il mio dataframe in dataframe1 e dataframe2 con un fattore a due livelli e applicare una funzione (t-test) alle prime parti di dataframe1 e dataframe2, e poi un t-test sulle seconde parti di dataframe1 e dataframe2, e poi un t-test per il thi parti di dataframe1 e dataframe2 e così via su tutte le coppie di colonne generate dalla divisione per fattore.
Grazie per l'aiuto modifica. –
Cosa hai provato con plyr? – agstudy
Non ricordo cosa ho provato in plyr, solo che non ho potuto farlo. Ho letto l'articolo plyr dal software J stat, ma gli esempi usati erano troppo complicati per capirlo. –