Ho il seguente problema - fatto astratto per far emergere i problemi chiave.Trovare il centro di un cluster
Ho 10 punti ciascuno che è una certa distanza dall'altro. Voglio
- essere in grado di trovare il centro del cluster vale a dire il punto per il quale è ridotto al minimo la distanza a coppie l'uno all'altro punto,
Sia P (j) ~ p (k) rappresentano la distanza a coppie beteen punti je k
p (i) è il punto centrale del cluster iff p (i) st min [sum (p (j) ~ p (k))] per tutti 0 < j, k < = n dove abbiamo n punti del cluster - determinare come dividere il cluster in due cluster dopo che il numero di i punti dati nel cluster superano una certa soglia t.
Questo non è spazio euclideo. Ma le distanze possono essere riassunti come segue - p (i) è il punto I:
p(1) p(2) p(3) p(4) p(5) p(6) p(7) p(8) p(9) p(10)
p(1) 0 2 1 3 2 3 3 2 3 4
p(2) 2 0 1 3 2 3 3 2 3 4
p(3) 1 1 0 2 0 1 2 1 2 3
p(4) 3 3 2 0 1 2 3 2 3 4
p(5) 2 2 1 1 0 1 2 1 2 3
p(6) 3 3 2 2 1 0 3 2 3 4
p(7) 3 3 2 3 2 3 0 1 2 3
p(8) 2 2 1 2 1 2 1 0 1 2
p(9) 3 3 2 3 2 3 2 1 0 1
p(10) 4 4 3 4 3 4 3 2 1 0
Come faccio a calcolare quale è il punto centrale di questo cluster?
Si prega di definire "centro del cluster" – Nifle
@ Nifle - done ...avete qualche idea – Ankur
L'applicazione ha a che fare con i concetti di clustering - la mia applicazione è un archivio di dati semantico - i punti rappresentano oggetti astratti. Voglio raggruppare gli oggetti per poter determinare "concetti" – Ankur