Desidero scrivere un test per la mia applicazione di streaming spark che consuma una sorgente flume.Utilizzo di un file di testo come sorgente di streaming Spark a scopo di verifica
http://mkuthan.github.io/blog/2015/03/01/spark-unit-testing/ suggerisce di utilizzare ManualClock ma per il momento leggere un file e verificare le uscite sarebbe sufficiente per me.
Così desidero utilizzare:
JavaStreamingContext streamingContext = ...
JavaDStream<String> stream = streamingContext.textFileStream(dataDirectory);
stream.print();
streamingContext.awaitTermination();
streamingContext.start();
Purtroppo non stampa nulla.
Ho provato:
- DataDirectory = "HDFS: // nodo: porta/assoluto/percorso/a/HDFS /"
- DataDirectory = "file: // C: \\ assoluto \\ percorso \\ su \\ Windows \\"
- aggiungendo il file di testo nella directory prima che il programma inizia
- aggiungendo il file di testo nella directory mentre l'esecuzione del programma
Niente funziona.
Qualche suggerimento da leggere dal file di testo?
Grazie,
Martin
Ciao @Martin, puoi condividere il codice totale, se possibile? Grazie. – user4342532