Ho un DF con un enorme metadata parseable come una singola colonna di stringa in un Dataframe, consente di chiamarlo DFA, con ColmnA.Ricava più colonne da una singola colonna in Spark DataFrame
Vorrei rompere questa colonna, ColmnA in più colonne attraverso una funzione, ClassXYZ = Func1 (ColmnA). Questa funzione restituisce una classe ClassXYZ, con più variabili, e ognuna di queste variabili deve ora essere mappata alla nuova colonna, come ColmnA1, ColmnA2 ecc.
Come farei una tale trasformazione da 1 Dataframe a un'altra con questi colonne aggiuntive chiamando questo Func1 una sola volta e non doverle ripetere per creare tutte le colonne.
È facile da risolvere se dovessi chiamare questa enorme funzione ogni volta per aggiungere una nuova colonna, ma ciò che desidero evitare.
Si prega gentilmente di avvisare con un codice funzionante o pseudo.
Grazie
Sanjay
Ciao Niemand, apprezzo la tua risposta ... ma non risolve il problema ... in te codice, si sta chiamando la funzione " myDF "più volte, mentre vorrei che quella funzione venisse chiamata una volta, generare una classe con più campi e ogni variabile di campo essere restituita come una nuova colonna – sshroff
Beh, ho paura di aver presentato l'unico modo possibile per sapere, Non penso che esista un altro modo, ma spero di sbagliarmi;). Inoltre, non è che non chiami myFun più volte: puoi chiamare altre funzioni come myFun2, myFun3 ecc. Per creare colonne di cui hai bisogno. – Niemand