emr

6calore

2risposta

Uso di s3distcp con Amazon EMR per copiare un singolo file

Voglio copiare solo un singolo file su HDFS utilizzando s3distcp. Ho provato a utilizzare l'argomento srcPattern ma non ha aiutato e continua a lanciare l'eccezione java.lang.Runtime. È possibile che

13calore

2risposta

Comprime file su S3

Ho un file 17.7 GB su S3. È stato generato come output di una query Hive e non è compresso. So che comprimendolo, sarà circa 2,2 GB (gzip). Come posso scaricare questo file localmente il più rapidamen

5calore

2risposta

Carica file compressi con snappy in Elastic MapReduce

Ho un sacco di log di server compressi snappy in S3 e devo elaborarli utilizzando lo streaming su Elastic MapReduce. Come faccio a comunicare ad Amazon e Hadoop che i log sono già compressi (prima che

18calore

3risposta

Esportazione Hive tabella a un secchio S3

Ho creato una tabella alveare attraverso una sessione interattiva Elastic MapReduce e popolato da un file CSV come questo: CREATE TABLE csvimport(id BIGINT, time STRING, log STRING) ROW FORMAT DELIMI