Sto ora leggendo il libro Data mining: strumenti e tecniche di apprendimento pratico della macchina terza edizione. Nella sezione 4.8 clustering, viene illustrato come utilizzare k-d trees
o ball trees
per migliorare le prestazioni per k-means algorithm
.Come riconoscere un nodo interno che ha tutti i suoi punti di contenimento in un cluster in un albero a sfere quando si esegue l'algoritmo k-means?
Dopo aver costruito l'albero della palla con tutti i punti dati, cerca tutti i nodi foglia per vedere quale centro di raggruppamento preselezionato centrale i punti in esso sono vicini. A volte, la regione rappresentata dal nodo interno superiore rientra interamente nel dominio di un singolo centro di cluster. Quindi non è necessario attraversare i nodi figlio e tutti i punti data possono essere elaborati in un colpo solo.
La domanda è, quando si implementa la struttura dati e l'algoritmo, come possiamo decidere se la regione che fa riferimento a un nodo interno cade in un singolo centro di cluster?
In uno spazio bidimensionale o tridimensionale, questo non è difficile. Possiamo vedere se tutte le midperpendicolari di ogni coppia nei centri del cluster attraversano la regione facendo riferimento al nodo interno.
Ma negli spazi dimensionali superiori, come riconoscerlo? Esiste una metodologia generale per questo?
thx molto ... Il tuo è meglio. – keepItSimple