Il miglior metodo per leggere i file delimitati di nuova riga in Python e scartare le nuove linee?

Sto cercando di determinare il modo migliore per gestire l'eliminazione di newline durante la lettura di file delimitati di nuova riga in Python.Il miglior metodo per leggere i file delimitati di nuova riga in Python e scartare le nuove linee?

Quello che mi è venuto in mente è il seguente codice, includere il codice throwaway da testare.

import os 

def getfile(filename,results): 
    f = open(filename) 
    filecontents = f.readlines() 
    for line in filecontents: 
    foo = line.strip('\n') 
    results.append(foo) 
    return results 

blahblah = [] 

getfile('/tmp/foo',blahblah) 

for x in blahblah: 
    print x

suggerimenti?

fonte

2009-02-13 solarce

cosa sull'utilizzo di divisione ("/ n")? – jle

Uguale a: http://stackoverflow.com/questions/339537/end-line-characters-from-lines-read-from-text-file-using-python –

Penso che sarebbe meglio chiudere il file anche –

179

lines = open(filename).read().splitlines()

fonte

2009-02-13 06:35:50

Questa risposta fa quello che stavo cercando, sono sicuro che avrò bisogno di aggiungere qualche controllo degli errori e così via, ma per questo specifico bisogno, è grandioso. Grazie a tutti per aver fornito le risposte! – solarce

Mi piace ma come si chiude il file se non si salva l'handle del file? O è automaticamente chiuso? –

Con CPython, il conteggio dei riferimenti per l'oggetto file andrà a zero una volta che non è più in uso e il file verrà automaticamente chiuso. Per implementazioni puramente GC'come Jython e IronPython, il file potrebbe non essere chiuso fino a quando non viene eseguito il GC, quindi questa variazione potrebbe non essere ottimale. –

for line in file('/tmp/foo'): 
    print line.strip('\n')

fonte

2009-02-13 06:36:08

Questo ha funzionato perfettamente. Funziona anche per file più grandi. –

lo farei in questo modo:

f = open('test.txt') 
l = [l for l in f.readlines() if l.strip()] 
f.close() 
print l

fonte

2009-02-13 06:43:59

Mentre la risposta di Curt Hagenlocher è tecnicamente migliore, questa risposta è un buon punto di partenza se è necessario aggiungere altre elaborazioni a ciascuna linea. – TomOnTime

Non sono sicuro se si intendesse filtrare le righe vuote, ma questo è più conciso di '... se l.strip() non è ''', che è ciò di cui ho bisogno nel mio caso. –

Ecco un generatore che fa quello che avete richiesto. In questo caso, utilizzare rstrip è sufficiente e leggermente più veloce della striscia.

lines = (line.rstrip('\n') for line in open(filename))

Tuttavia, molto probabilmente vorrai usare questo per eliminare anche gli spazi vuoti finali.

lines = (line.rstrip() for line in open(filename))

fonte

2009-02-13 08:35:46 TimoLinna

Non dovrebbe essere [] intorno al RHS, non()? – andrewb

@andrewb Using() dà un'espressione di generatore, che non usa tanto memoria quanto usando [] (una comprensione di lista). –

Io uso questo

def cleaned(aFile): 
    for line in aFile: 
     yield line.strip()

Allora posso fare cose come questa.

lines = list(cleaned(open("file","r")))

Oppure, posso estendere puliti con funzioni extra, per esempio, goccia righe vuote o saltare le linee di commento o qualsiasi altra cosa.

fonte

2009-02-13 11:07:27

soli espressioni generatore uso:

blahblah = (l.rstrip() for l in open(filename)) 
for x in blahblah: 
    print x

anche io voglio consigliarvi contro la lettura di tutto il file in memoria - ciclare su generatori è molto più efficiente su grandi insiemi di dati.

fonte

2009-02-14 07:43:58

Cosa ne pensi di questo approccio?

with open(filename) as data: 
    datalines = (line.rstrip('\r\n') for line in data) 
    for line in datalines: 
     ...do something awesome...

espressione Generator evita caricamento intero file in memoria e with garantisce la chiusura del file

fonte

2011-08-08 07:26:31

Il miglior metodo per leggere i file delimitati di nuova riga in Python e scartare le nuove linee?

risposta

Problemi correlati