Immaginate di avere un file di .txt
la seguente struttura:Un algoritmo per il testo di filtraggio dei file
>>> header
>>> header
>>> header
K L M
200 0.1 1
201 0.8 1
202 0.01 3
...
800 0.4 2
>>> end of file
50 0.1 1
75 0.78 5
...
vorrei leggere tutti i dati ad eccezione di linee indicate con >>>
e le linee sotto la linea >>> end of file
. Finora ho risolto questo problema utilizzando read.table(comment.char = ">", skip = x, nrow = y)
(x
e correntemente corretti). Questo legge i dati tra l'intestazione e >>> end of file
.
Tuttavia, mi piacerebbe rendere la mia funzione un po 'più plastica per quanto riguarda il numero di righe. I dati possono avere valori superiori a 800 e di conseguenza più righe.
Io potrei scan
o readLines
il file e vedere quale riga corrisponde allo >>> end of file
e calcolare il numero di righe da leggere. Quale approccio useresti?
Fornire alcuni dati fittizi. =) – aL3xa
@ aL3xa: lo snippet è già mostrato insufficiente? –