Come ci si aspetterebbe da un DSL finalizzato alla analisi dei dati, R gestisce i dati mancanti/incompleti molto bene, per esempio:Gestione di dati mancanti/incompleti in R: c'è una funzione per mascherare ma non rimuovere NA?
Molte funzioni di ricerca hanno un na.rm flag che se impostato su TRUE , rimuovere le AN:
>>> v = mean(c(5, NA, 6, 12, NA, 87, 9, NA, 43, 67), na.rm=T)
>>> v
(5, 6, 12, 87, 9, 43, 67)
Ma se si vuole trattare con AN prima la chiamata di funzione, è necessario fare qualcosa di simile:
per rimuovere ogni 'NA' da un vettore:
vx = vx[!is.na(a)]
per rimuovere ogni 'NA' da un vettore e sostituirlo w/a '0':
ifelse(is.na(vx), 0, vx)
per rimuovere tutta ogni riga che contiene 'NA' da un frame di dati:
dfx = dfx[complete.cases(dfx),]
Tutte queste funzioni permanentemente rimuovere 'NA' o righe con un 'NA' in esse.
A volte questo non è esattamente ciò che si desidera, tuttavia è possibile effettuare una copia del frame dei dati "NA" eliminata per il passaggio successivo nel flusso di lavoro, ma nei passaggi successivi si desidera spesso ripristinare tali righe (ad esempio , per calcolare una statistica basata su colonne per una colonna che ha righe mancanti causate da una chiamata precedente a 'casi completi', ma quella colonna non ha valori 'NA' in essa contenuti.
di essere il più chiaro possibile su ciò che sto cercando: python/NumPy ha una classe, mascherato serie, con una maschera metodo , che consente di nascondere --ma non remove-- NA durante una chiamata di funzione. Esiste una funzione analoga in R?
Il tuo link allo zoo è rotto. [Qui] (http://cran.r-project.org/web/packages/zoo/zoo.pdf) è un link alla documentazione più recente che ho trovato (.pdf warning), e [Here] (http://cran.r-project.org/web/packages/zoo/index.html) è un link a quello che penso sia l'ultimo riepilogo dello zoo. – deadstump
Il plurale errato 's' in URL così come 'package = ...', non 'packages = ...'. Ora risolto, grazie. –