Sto provando a fare una semplice lettura di un file Avro archiviato in HDFS. Ho scoperto come leggerlo quando si trova sul file system locale ....Lettura di un semplice file Avro da HDFS
FileReader reader = DataFileReader.openReader(new File(filename), new GenericDatumReader());
for (GenericRecord datum : fileReader) {
String value = datum.get(1).toString();
System.out.println("value = " value);
}
reader.close();
Il mio file è in HDFS, tuttavia. Non posso dare openReader a Path o FSDataInputStream. Come posso leggere semplicemente un file Avro in HDFS?
EDIT: Ho ottenuto questo lavoro creando una classe personalizzata (SeekableHadoopInput) che implementa SeekableInput. Ho "rubato" questo da "Ganglion" su github. Comunque, sembra che ci sarebbe un percorso di integrazione Hadoop/Avro per questo.
Grazie