Dato un MatrixFactorizationModel quale sarebbe il modo più efficiente per restituire la matrice completa delle previsioni del prodotto utente (in pratica, filtrata da qualche soglia per mantenere la scarsità)?Come valutare tutte le combinazioni prodotto-utente in Spark MatrixFactorizationModel?
Via l'API corrente, una volta potrebbe passare un prodotto cartesiano di facilità d'uso del prodotto alla funzione di prevedere, ma mi sembra che questo farà un sacco di elaborazione aggiuntiva.
Avrebbe accesso all'utente privatoCaratteristiche, le caratteristiche del prodotto sono l'approccio corretto e, in tal caso, c'è un buon modo per sfruttare altri aspetti del framework per distribuire questo calcolo in modo efficiente? In particolare, c'è un modo semplice per fare meglio di moltiplicare tutte le coppie di userFeature, productFeature "a mano"?
Sì, è una grande operazione che è il motivo per cui mi sembrava vale la pena di cercare di ottimizzare ulteriormente. Grazie per i suggerimenti! – cohoz