Ho bisogno di riepilogare un frame di dati con alcune variabili, ignorando gli altri. Questo a volte viene definito come collasso. Per esempio. se ho una dataframe come questo:Come posso comprimere un dataframe con alcune variabili, prendendo la media su altri
Widget Type Energy
egg 1 20
egg 2 30
jap 3 50
jap 1 60
poi crollare da Widget, con energia la variabile dipendente, Energia ~ Widget, produrrebbe
Widget Energy
egg 25
jap 55
In Excel la funzionalità più vicina potrebbe essere "tabelle pivot" e ho capito come farlo in python (http://alexholcombe.wordpress.com/2009/01/26/summarizing-data-by-combinations-of-variables-with-python/), ed ecco un esempio con R che usa la libreria doBy per fare qualcosa di molto correlato (http://www.mail-archive.com/[email protected]/msg02643.html), ma c'è un modo semplice per fare quanto sopra? E ancora meglio c'è qualcosa incorporato nella libreria ggplot2 per creare grafici che collassano su alcune variabili?
'by' si rivela utile anche di tanto in tanto. –
true. anche 'ave' –
per un esempio usando' ddply' dal pacchetto 'plyr' dai un'occhiata a questa domanda correlata: http://stackoverflow.com/questions/2473659/r-what-are-the-best-functions- to-deal-with-concatenating-and-averaging-values-in – mropa