Ho un frame di dati che ha gruppi univoche definite da 3 variabili carattereriassumere tutte le colonne numerici dei frame di dati, per gruppo, R
catvars <- c("DATE", "COUNTRY_FULL_NAME", "TENOR")
il resto del frame di dati consiste di 20 variabili numeriche (condensazione a 3 nell'esempio qui sotto)
numvars <- c("X1", "Y1, "Z1")
sto cercando di creare un nuovo frame di dati con la media per ogni variabile numerica calcola dal gruppo
per una singola variabile, I può usare ddply dal pacchetto plyr:
DFsum <- ddply(DF, catvars, summarize, X1mean = mean(X, na.rm=TRUE))
Ma non riesco a capire come modificare questo comando ddply per includere tutte le variabili numeriche. Eventuali suggerimenti? Grazie
grazie mille - ha funzionato. c'è un modo per specificare le variabili numeriche che voglio includere? – ec0n0micus
@ ec0n0micus Vedi '? Colwise' e l'argomento' .cols'; ma in questo modo dovrai specificare le colonne manualmente o scrivere la tua funzione per testare ciascuna per l'inclusione. – joran