Ho 40 file da 2 GB ciascuno, archiviati in un'architettura NFS. Ogni file contiene due colonne: un ID numerico e un campo di testo. Ogni file è già ordinato e gzip.Unisci file gzip ordinati
Come posso unire tutti questi file in modo che anche l'output risultante sia ordinato?
So che sort -m -k 1
dovrebbe fare il trucco per i file non compressi, ma non so come farlo direttamente con quelli compressi.
PS: Non voglio la semplice soluzione di decomprimere i file su disco, unirli e comprimerli di nuovo, perché non ho abbastanza spazio su disco per quello.
e 'possibile sviluppare un programma che aprirà tutti i file, decomprimere un blocco alla volta, unisci, ordina i dati, outp ut i risultati (compressi se lo si desidera) e anticipare ogni input secondo necessità, ma l'ambito di tale sforzo va oltre una semplice risposta qui. –
@AndrewMedico Per la cronaca, questo non è vero - 'sort' è esattamente un tale programma, e' bash' può combinarlo con 'gunzip' abbastanza facilmente. Vedi le risposte per i dettagli. – user4815162342