Ho file di testo con righe di testo ripetute, ma ne voglio solo uno. Immaginate questo file di testo:Estrai tutte le righe univoche
AAAAA
AAAAA
AAAAA
BB
BBBBB
BBBBB
CCC
CCC
CCC
vorrei solo bisogno dei seguenti quattro linee da esso:
AAAAA
BB
BBBBB
CCC
sto usando un editor di testo (EmEditor o Notepad ++), che supporta RegEx, non un linguaggio di programmazione, quindi devo usare un'espressione puramente regolare.
Qualsiasi aiuto?
MODIFICA: Ho controllato l'altro thread menzionato da hsz e vorrei chiarire che questo non è lo stesso. Sebbene entrambi debbano rimuovere linee duplicate, il modo per ottenerlo è diverso. Ho bisogno di puro RegEx, ma la migliore risposta dell'altro thread si basa su uno specifico plug-in Notepad ++ (che non viene nemmeno più con esso), quindi non è nemmeno una soluzione regex. Il secondo caso è una regex e funziona su Notepad ++, ma non su EmEditor, che anch'io ho bisogno. Quindi non penso che la mia domanda sia una ripetizione di quello, sebbene quel collegamento sia utile, e quindi ringrazio hsz per questo.
possibile duplicato del [Rimozione righe duplicate in Notepad ++] (http://stackoverflow.com/questions/3958350/removing-duplicate-rows-in-notepad) – hsz
sono linee ripetute raggruppate? Cioè, il file può essere AAAA BBBB AAAA BBBB in modo da renderlo AAAA BBBB? –
Risposta a Gelbukh: Le linee devono essere nello stesso ordine in cui erano originariamente. –