2012-04-20 8 views
5

Questa domanda è specifica per opencv: L'esempio di kmea fornito nella documentazione di opencv ha una matrice a 2 canali - un canale per ogni dimensione del vettore di funzionalità. Ma, alcuni degli altri esempi sembrano dire che dovrebbe essere una matrice a un canale con caratteristiche lungo le colonne con una riga per ogni campione. Quale di questi è giusto?Matrice di ingresso per cluster di kmev opencv

se ho un 5 caratteristica dimensionale vettore, quale dovrebbe essere la matrice di ingresso che uso: Questa:

cv::Mat inputSamples(numSamples, 1, CV32FC(numFeatures)) 

o questa:

cv::Mat inputSamples(numSamples, numFeatures, CV_32F) 

risposta

28

La risposta corretta è cv::Mat inputSamples(numSamples, numFeatures, CV_32F) . L'OpenCV Documentation circa kmeanssays:

campioni - matrice virgola mobile di campioni di ingresso, una riga per campione

Quindi non è una virgola mobile vettore di carri n-dimensionali come in l'altra opzione. Quali esempi hanno suggerito un simile comportamento?

Qui c'è anche un piccolo esempio di me che mostra come possono essere utilizzati gli kmea. Esso raggruppa i pixel di un'immagine e visualizza il risultato:

#include "opencv2/imgproc/imgproc.hpp" 
#include "opencv2/highgui/highgui.hpp" 

using namespace cv; 

int main(int argc, char** argv) 
{ 
    Mat src = imread(argv[1], 1); 
    Mat samples(src.rows * src.cols, 3, CV_32F); 
    for(int y = 0; y < src.rows; y++) 
    for(int x = 0; x < src.cols; x++) 
     for(int z = 0; z < 3; z++) 
     samples.at<float>(y + x*src.rows, z) = src.at<Vec3b>(y,x)[z]; 


    int clusterCount = 15; 
    Mat labels; 
    int attempts = 5; 
    Mat centers; 
    kmeans(samples, clusterCount, labels, TermCriteria(CV_TERMCRIT_ITER|CV_TERMCRIT_EPS, 10000, 0.0001), attempts, KMEANS_PP_CENTERS, centers); 


    Mat new_image(src.size(), src.type()); 
    for(int y = 0; y < src.rows; y++) 
    for(int x = 0; x < src.cols; x++) 
    { 
     int cluster_idx = labels.at<int>(y + x*src.rows,0); 
     new_image.at<Vec3b>(y,x)[0] = centers.at<float>(cluster_idx, 0); 
     new_image.at<Vec3b>(y,x)[1] = centers.at<float>(cluster_idx, 1); 
     new_image.at<Vec3b>(y,x)[2] = centers.at<float>(cluster_idx, 2); 
    } 
    imshow("clustered image", new_image); 
    waitKey(0); 
} 
+0

Mi piacerebbe sapere cosa si sta facendo nel ciclo prima della dichiarazione della variabile clusterCount e anche cosa si sta facendo alla fine nel dopo per i kmea. Pensi che sia possibile aggiornare la risposta con queste informazioni? Grazie! –

+0

Il primo ciclo riordina i dati dall'immagine da una matrice (righe, colonne, 3) a una matrice (righe * colonne, 3) (una riga per pixel). Il loop all'estremità sostituisce ogni pixel dell'immagine con il centro del cluster corrispondente per la visualizzazione. – sietschie

+0

È possibile utilizzare 'Mat :: reshape()' invece di cicli nidificati? – Jayesh

1

In alternativa al rimodellare la matrice di ingresso manualmente, è possibile utilizzare la funzione OpenCV reshape realizzare risultato simile con meno codice. Qui è la mia implementazione di lavoro di ridurre il numero di colori con il metodo K-Means (in Java):

private final static int MAX_ITER = 10; 
private final static int CLUSTERS = 16; 

public static Mat colorMapKMeans(Mat img, int K, int maxIterations) { 

    Mat m = img.reshape(1, img.rows() * img.cols()); 
    m.convertTo(m, CvType.CV_32F); 

    Mat bestLabels = new Mat(m.rows(), 1, CvType.CV_8U); 
    Mat centroids = new Mat(K, 1, CvType.CV_32F); 
    Core.kmeans(m, K, bestLabels, 
       new TermCriteria(TermCriteria.COUNT | TermCriteria.EPS, maxIterations, 1E-5), 
       1, Core.KMEANS_RANDOM_CENTERS, centroids); 
    List<Integer> idx = new ArrayList<>(m.rows()); 
    Converters.Mat_to_vector_int(bestLabels, idx); 

    Mat imgMapped = new Mat(m.size(), m.type()); 
    for(int i = 0; i < idx.size(); i++) { 
     Mat row = imgMapped.row(i); 
     centroids.row(idx.get(i)).copyTo(row); 
    } 

    return imgMapped.reshape(3, img.rows()); 
} 

public static void main(String[] args) { 
    System.loadLibrary(Core.NATIVE_LIBRARY_NAME); 
    Highgui.imwrite("result.png", 
     colorMapKMeans(Highgui.imread(args[0], Highgui.CV_LOAD_IMAGE_COLOR), 
      CLUSTERS, MAX_ITER)); 
} 

OpenCV legge immagine in 2 bidimensionale a matrice, 3 canali. Prima chiamata a reshape - img.reshape(1, img.rows() * img.cols()); - essenzialmente srotola 3 canali in colonne. Nella matrice risultante una riga corrisponde a un pixel dell'immagine di input e 3 colonne corrisponde a componenti RGB.

Dopo che l'algoritmo K-Means ha terminato il suo lavoro e la mappatura dei colori è stata applicata, chiamiamo nuovamente reshape - imgMapped.reshape(3, img.rows()), ma ora riportiamo le colonne ai canali e riduciamo i numeri di riga al numero di riga dell'immagine originale, tornando indietro formato matrice originale, ma solo con colori ridotti.

+0

I pensate di aver bisogno di fare attenzione che l'immagine sia continua prima di prendere questo approccio http://docs.opencv.org/2.4/modules/core/doc/basic_structures.html#mat-iscontinuous – ejectamenta

+0

se usate clone ie. usando clone come in img.clone(). reshape (1, img.rows() * img.cols()) quindi l'immagine sarà continua (e l'immagine originale sarà invariata) – ejectamenta