C'è un modo per controllare i nomi dei file di uscita di un lavoro Hadoop Streaming? In particolare mi piacerebbe che il contenuto del file di output del mio lavoro e il nome fossero organizzati dal ket, le uscite del riduttore - ogni file conterrebbe solo valori per una chiave e il suo nome sarebbe la chiave.Come controllo il nome dei file di output e il contenuto di un lavoro di streaming Hadoop?
Aggiornamento: Appena trovato la risposta - Utilizzo di una classe Java che deriva da MultipleOutputFormat poiché il formato di output dei lavori consente il controllo dei nomi dei file di output. http://hadoop.apache.org/core/docs/current/api/org/apache/hadoop/mapred/lib/MultipleOutputFormat.html
Non ho visto i campioni di questo là fuori ... Chiunque può segnalare a un campione di Hadoop in streaming che fa uso di un formato di output personalizzato classe Java?
Collegamento interrotto a nuovi documenti –