Ho un file di dati e un file di schema corrispondente memorizzato in posizioni separate. Vorrei caricare i dati usando lo schema nel file schema. Ho provato a utilizzarePig: caricamento di un file di dati utilizzando un file di schema esterno
A= LOAD '<file path>' USING PigStorage('\u0001') as '<schema-file path>'
ma ottenere un errore.
Qual è la sintassi per caricare correttamente il file? formato di file
Lo schema è qualcosa di simile:
data1 - complex - - - - format - -
data1 event_type - - - - - long - "ends '\001'"
data1 event_id - - - - - varchar(50) - "ends '\001'"
data1 name_format - - - - - varchar(10) - "ends newline"