Esiste un modo per concatenare set di dati di due diversi RDD
s nella scintilla?Concatenazione di serie di dati di diversi RDD nella scintilla di Apache utilizzando scala
Il requisito è: creo due RDD intermedi utilizzando scala con gli stessi nomi di colonna, è necessario combinare questi risultati di entrambi gli RDD e memorizzare nella cache il risultato per l'accesso all'interfaccia utente. Come posso combinare i set di dati qui?
RDDs sono di tipo spark.sql.SchemaRDD
Non puoi usare '++'? – lmm
@lmm No .. Aggiungerà colonne all'RDD. Devo aggiungere righe all'RDD. Ho due RDD con le stesse colonne i cui record devono essere uniti a un singolo RDD. – Atom
No, non lo farò, l'ho appena provato per essere sicuro. '++' crea un RDD unione con i risultati di entrambi. – lmm