Quando interagisco con i dati, trovo che la funzione select() della libreria dplyr è un ottimo modo per organizzare le colonne del mio frame di dati.dplyr :: select - Include tutte le altre colonne alla fine del nuovo data frame (o iniziale o centrale)
Un ottimo uso, se mi capita di lavorare con un df che ha molte colonne, mi trovo spesso a mettere due variabili l'una accanto all'altra per un facile confronto. Quando faccio questo, ho quindi bisogno di allegare tutte le altre colonne prima o dopo. Ho trovato la funzione matches(".")
un modo super conveniente per farlo.
Ad esempio:
library(nycflights13)
library(dplyr)
# just have the five columns:
select(flights, carrier, tailnum, year, month, day)
# new order for all column:
select(flights, carrier, tailnum, year, month, day, matches("."))
# matches(".") attached all other columns to end of new data frame
La questione - Sono curioso di sapere se c'è un modo migliore per fare questo? Migliore nel senso di essere più flessibile.
Ad esempio di un problema: c'è un modo per includere "tutte le altre" colonne all'inizio o al centro del nuovo data.frame? (Si noti che select(flights, matches("."), year, month, day,)
non produce risultato desiderato, dal momento che matches(".")
allegato tutte le colonne e year, month, day
vengono ignorati perché sono ripetizioni di nomi colonne esistenti.)