Ho alcuni file di dati delimitati molto grandi e Voglio elaborare solo determinate colonne in R senza prendere tempo e memoria per creare un data.frame
per il intero file.Modi per leggere solo selezionare colonne da un file in R? (Un mezzo felice tra `read.table` e` scan`?)
Le uniche opzioni che conosco sono read.table
che è molto dispendioso quando voglio solo un paio di colonne o scan
che sembra livello troppo basso per quello che voglio.
Esiste un'opzione migliore, con R pura o forse chiamando altri script di shell per eseguire l'estrazione di colonne e quindi utilizzare scan o read.table sull'output? (Il che porta alla domanda su come chiamare uno script di shell e catturarne l'output in R?).
Un insieme di risposte utili qui. Ognuno di loro sarebbe utile per un determinato contesto. Quello accettato era semplicemente il più vicino al mio caso reale e includeva uno snippet di codice. (Avrei potuto semplicemente aver scelto Dirk ma sembra che abbia già molta reputazione ;-)) –
La migliore risposta è nella nuova domanda http://stackoverflow.com/q/5788117/168747 – Marek