Sono nel mezzo del refactoring del mio codice per sfruttare il DataFrames, Estimators, and Pipelines. Inizialmente utilizzavo MLlib Multiclass LogisticRegressionWithLBFGS su RDD[LabeledPoint]
. Mi piace imparare e utilizzare la nuova API, ma non sono sicuro di come salvare il mio nuovo modello e applicarlo su nuovi dati.Spark ML - Save OneVsRestModel
Attualmente l'implementazione ML di LogisticRegression
supporta solo la classificazione binaria. Sto, invece usando OneVsRest in questo modo:
val lr = new LogisticRegression().setFitIntercept(true)
val ovr = new OneVsRest()
ovr.setClassifier(lr)
val ovrModel = ovr.fit(training)
Vorrei ora per salvare la mia OneVsRestModel
, ma questo non sembra essere supportato da API. Ho provato:
ovrModel.save("my-ovr") // Cannot resolve symbol save
ovrModel.models.foreach(_.save("model-" + _.uid)) // Cannot resolve symbol save
C'è un modo per salvare questo, in modo da poter caricare in una nuova applicazione per fare nuove previsioni?
Vorrei poter +2 questo. Non solo è esattamente ciò di cui avevo bisogno, ma rende molto più facile il calcolo delle probabilità non elaborate. Pensavo di dover personalizzare la src. Grazie! –
@ zero323 c'è una versione pyspark della tua risposta? Cercando di trovare un modo per salvare i modelli pyspark.ml – ajkl
@AjinkyaKale In 1.6? – zero323