Sto creando un nuovo Dataframe da un dataframe esistente, ma è necessario aggiungere una nuova colonna ("campo1" nel codice sottostante) in questo nuovo DF. Come faccio a farlo? L'esempio di codice di esempio funzionante sarà apprezzato.Crea nuovo Dataframe con valori di campo vuoto/nullo
val edwDf = omniDataFrame
.withColumn("field1", callUDF((value: String) => None))
.withColumn("field2",
callUdf("devicetypeUDF", (omniDataFrame.col("some_field_in_old_df"))))
edwDf
.select("field1", "field2")
.save("odsoutdatafldr", "com.databricks.spark.csv");
@ zero323, grazie per aver condiviso questo, molto utile. Vedi le mie modifiche per supportare altri tipi. –
@DmitriySelivanov Grazie per la tua utile modifica. Ho rinunciato all'idea di usare 'Option' dopo alcuni esperimenti falliti con letterali qualche tempo fa :) – zero323
nota:' toDF() 'richiede' import spark.implicits._' – Boern