Ho un array di valori 13.876 (13.876) tra 0 e 1. Vorrei applicare sklearn.cluster.KMeans
solo a questo vettore per trovare i diversi cluster in cui sono raggruppati i valori. Tuttavia, sembra che KMean lavori con un array multidimensionale e non con quelli unidimensionali. Immagino che ci sia un trucco per farlo funzionare ma non so come. Ho visto che KMeans.fit() accetta "X: array simile o matrici sparse, di forma = (N_SAMPLES, n_features)", ma vuole la n_samples
di essere più grande di unScikit-learn: come eseguire KMeans su un array monodimensionale?
Ho provato a mettere il mio allineamento su un np.zeros() matrix ed eseguire KMeans, ma quindi sta mettendo tutti i valori non nulli sulla classe 1 e il resto sulla classe 0.
Qualcuno può aiutare a eseguire questo algoritmo su una matrice monodimensionale? Grazie mille!
Ha funzionato come un fascino, questo dettaglio mi ha bloccato per un'ora! – iamgin
Se si utilizza MiniBatchKmeans su questo tipo di dati di forma, si ottengono risultati molto diversi. È questo comportamento previsto ?? – marscher
questo è correlato allo stato casuale. Se lo si risolve, si ottengono gli stessi risultati. – marscher