sto facendo Kmeans clustering in R con due esigenze:Come specificare la metrica della distanza per kmea in R?
ho bisogno di specificare la mia funzione di distanza, ora è il Pearson coefficiente.
Desidero eseguire il clustering che utilizza la media dei membri del gruppo come centroidi, piuttosto un membro effettivo. La ragione di questo requisito è che penso che usare la media come centroide abbia più senso dell'uso di un membro effettivo poiché i membri non sono sempre vicini al centroide reale. Per favore correggimi se ho torto su questo.
Per prima cosa ho provato la funzione kmeans
in stat
pacchetto, ma questa funzione non permette metodo distanza personalizzata.
Quindi ho trovato la funzione pam
nel pacchetto cluster
. La funzione pam
consente metrica di distanza personalizzata prendendo un oggetto dist
come parametro, ma mi sembra che in questo modo ci vogliono membri effettivi come centroidi, che non è quello che mi aspetto. Dal momento che non penso che possa fare tutto il calcolo della distanza con solo una matrice di distanza.
Quindi c'è un modo semplice in R per fare il clustering dei chilometri che soddisfa entrambe le mie esigenze?
È possibile utilizzare 'vegan :: designdist' per creare il proprio indice (vedere anche' vegan :: vegdist' se è già lì). Dopo aver ottenuto l'oggetto 'dist', puoi usare' hclust' nel pacchetto stats per usare il tuo metodo di aggregazione appropriato. –
@ RomanLuštrik, grazie per il commento. So come specificare la metrica di distanza con hclust, ma ora ho bisogno di sapere come farlo con i kmea. –