Abbiamo un requisito in cui dobbiamo appednd i file ORC. Ho provato a google, ma nessun risultato. Anche org.apache.hadoop.hive.ql.io.orc.WriterImpl di ORC non ha l'API di aggiunta. Esiste comunque l'
Nella versione precedente, avevamo un metodo 'saveAsOrcFile()' su RDD. Questo è ora andato! Come posso salvare i dati in DataFrame nel formato di file ORC? def main(args: Array[String]) {
println("Cr
Mi chiedevo se esiste un modo per specificare una funzione di aggregazione personalizzata per i frame di dati spark su più colonne. Ho una tabella come questa del tipo (nome, articolo, prezzo): john |