apache-spark-dataset

8calore

1risposta

Qual è la differenza tra Spark DataSet e RDD

Sto ancora lottando per comprendere tutta la potenza dei set di dati Spark introdotti di recente. Esistono best practice su quando utilizzare gli RDD e quando utilizzare i set di dati? Nei loro announ

13calore

3risposta

Spark Dataset API - join

Sto tentando di utilizzare l'API Spark Dataset ma sto riscontrando alcuni problemi nel fare un semplice join. Diciamo che ho due set di dati con i campi: date | value, quindi nel caso di DataFrame il

12calore

1risposta

Come creare un set di dati Spark da un RDD

Ho un RDD[LabeledPoint] destinato a essere utilizzato all'interno di una pipeline di apprendimento automatico. Come convertire tale RDD in un DataSet? Nota le nuove apis spark.ml richiedono input nel

9calore

2risposta

Perché l'errore "Impossibile trovare l'encoder per il tipo memorizzato in un set di dati" durante la codifica JSON utilizzando le classi di casi? lavoro scintilla

ho scritto: object SimpleApp { def main(args: Array[String]) { val conf = new SparkConf().setAppName("Simple Application").setMaster("local") val sc = new SparkContext(conf) val ct