Sono abbastanza confuso sull'uso di Avro con la mappa ridotta e non riesco a trovare le esercitazioni migliori da seguire.Un lavoro di ridimensionamento della mappa con input di testo normale e output avro
Sembra che le classi come AvroJob e AvroMapper siano orientate a problemi quando sia l'input che l'output sono file di dati Avro. Che dire quando il tuo input è solo testo?
In particolare:
mio mapper prende le chiavi LongWritable ei valori di testo come input. Emette i tasti di testo e i valori di MyAvroRecord.
Il mio riduttore accetta i tasti di testo e un Iterator di MyAvroRecords come input ed emette i valori dei tasti di testo e MyAvroRecord.
Come si ottiene un OutputFormat che dovrebbe scrivere i valori di questi tasti di testo e MyAvroRecord su file?
Acclamazioni, Dave
Ciao Dave, io sto cercando di fare qc nella direzione opposta. Il mio input è testo e l'output è Record generico. Cerco di configurare uno schema di input Avro per AvroJob e quindi di impostare lo schema di output come schema del record generico. Ma non so come riassumere lo schema di input in modo che AvroJob possa capire che è un testo normale. Dovrei semplicemente usare setInputSchema() come niente? –