Raggruppa i dati unidimensionali in modo ottimale?

Qualcuno ha un foglio che spiega come funziona l'algoritmo Ckmeans.1d.dp?Raggruppa i dati unidimensionali in modo ottimale?

Oppure: qual è il modo più ottimale per fare k-significa il clustering in una dimensione?

fonte

2011-10-23 Laciel

Google rivela la tecnologia. report Knops, Maintz, Pluim & Viergever (2004), Optimal unidimensionale k-means clustering utilizzando la programmazione dinamica dell'Università di Utrecht, che non è disponibile online. Sfortunatamente, il codice C++ di questo modulo è molto illeggibile. +1 per una domanda interessante. –

penso che questo sia il documento che state cercando:

Ckmeans.1d.dp: Optimal k-means Clustering in One Dimension by Dynamic Programming by Haizhou Wang and Mingzhou Song.

fonte

2012-07-09 15:22:31

Esistono wrapper Python scritti per l'algoritmo Wang e Song? Indicano nel documento che la loro "implementazione" R è solo un wrapper su un'implementazione C++. –

È molto vecchia tecnica Bellman: Una nota sulla analisi dei cluster e programmazione dinamica http://www.sciencedirect.com/science/article/pii/0025556473900072

www.informationgeometry.org

fonte

2014-02-23 07:18:03 user108429

Salve e benvenuti allo Stack Overflow. Si prega di notare che mentre la risposta rimane qui, il link e il suo contenuto potrebbero cambiare o essere rimosso. Si prega di modificare il codice per includere le informazioni rilevanti da quel collegamento. – Noich

Univariata k-means può essere risolto in O (kn) Tempo (su input già ordinati) in base ai risultati teorici sulle matrici Monge, ma l'approccio non era molto popolare molto probabilmente a causa dell'instabilità numerica e forse anche delle sfide di codifica.

Un'opzione migliore è un metodo O (knlgn) che è ora implementato in Ckmeans.1d.dp versione 3.4.6. Questa implementazione è veloce quanto l'euristica k-significa, ma offre l'ottimalità garantita, ordini di grandezza migliori di euristici k-significati specialmente per k di grandi dimensioni.

La soluzione di programmazione dinamica generica di Richard Bellman (1973) non tocca le specifiche del problema di k-means e il runtime implicito è O (kn^3).

fonte

2016-06-03 01:03:57 user6417312

Raggruppa i dati unidimensionali in modo ottimale?

risposta

Problemi correlati