Diciamo che ho questa struttura su HDFS:fusione di più LZO file compressi su HDFS
/dir1
/dir2
/Name1_2015/
file1.lzo
file2.lzo
file3.lzo
/Name2_2015
file1.lzo
file2.lzo
Name1_2015.lzo
Vorrei unire ogni file di ogni directory 'dir2' e aggiungere il risultato al file in/dir1 /DirName.lzo
ad esempio, per/dir1/dir2/Name1_2015, voglio unire file1.lzo, file2.lzo, file3.lzo e aggiungerlo al /dir1/Name1_2015.lzo
Ogni file sono compressi LZO.
Come posso farlo?
Grazie
Conosco il suo overhead per unire tutti i file, ma ho davvero bisogno di un singolo file unito per elaborarlo successivamente – guillaume