Hadley mi ha attivato il pacchetto plyr e mi ritrovo ad usarlo tutto il tempo per eseguire "raggruppa per" una sorta di roba. Ma mi trovo a dover rinominare sempre le colonne risultanti dal momento che di default a V1, V2, eccrinominare la colonna di output con il pacchetto plyr in R
Ecco un esempio:
mydata<-data.frame(matrix(rnorm(144, mean=2, sd=2),72,2),c(rep("A",24),rep("B",24),rep("C",24)))
colnames(mydata) <- c("x_value", "acres", "state")
groupAcres <- ddply(mydata, c("state"), function(df)c(sum(df$acres)))
colnames(groupAcres) <- c("state","stateAcres")
C'è un modo per rendere ddply nominare la colonna risultante per me così Posso omettere quell'ultima riga?
JD- Quella prima riga di codice non viene eseguito, dovrebbe essere RNorm (..., 72 , 2), ad es .: mydata <-data.frame (matrice (rnorm (144, mean = 2, sd = 2), 72,2), c (rep ("A", 24), rep ("B ", 24), rep (" C ", 24))) ' – medriscoll
buona cattura! Ho modificato il mio esempio. Grazie! –