voglio trovare i parametri di ParamGridBuilder
che rendono il miglior modello in CrossValidator in Spark 1.4.x,Come estrarre migliori parametri da un CrossValidatorModel
In Pipeline Example nella documentazione Spark, aggiungono diversi parametri (numFeatures
, regParam
) utilizzando ParamGridBuilder
nella pipeline. Poi dalla seguente riga di codice che fanno il miglior modello:
val cvModel = crossval.fit(training.toDF)
Ora, voglio sapere quali sono i parametri (numFeatures
, regParam
) da ParamGridBuilder
che produce il modello migliore.
ho già usato i seguenti comandi senza successo:
cvModel.bestModel.extractParamMap().toString()
cvModel.params.toList.mkString("(", ",", ")")
cvModel.estimatorParamMaps.toString()
cvModel.explainParams()
cvModel.getEstimatorParamMaps.mkString("(", ",", ")")
cvModel.toString()
Qualsiasi aiuto?
Grazie in anticipo,
I migliori parametri sono [inviati per il log] (https://github.com/apache/spark/blob/a721ee52705100dbd7852f80f92cde4375517e48/mllib/src/main/scala/org/apache/spark/ml/tuning/CrossValidator.scala# L104) ma mi batte come è possibile accedere a queste informazioni da un'istanza di 'CrossValidatorModel'. – zero323
Questo è davvero frustrante. Non lo stanno nemmeno loggando in PySpark. Una cosa così piccola ma importante che manca ... mi chiedo se qualcuno stia effettivamente utilizzando questa funzionalità. –
persone, qualsiasi soluzione per questo problema nelle versioni recenti di Spark? – Rami