2016-05-10 30 views
5

Recentemente ho scoperto la correlazione di fase in OpenCV, che con il Log Polar Transform (LPT) può eseguire la rotazione e scalare la corrispondenza del modello invariante. Mi chiedo quale sia la differenza tra questo metodo e tutti i metodi di corrispondenza dei modelli descritti qui http://docs.opencv.org/2.4/doc/tutorials/imgproc/histograms/template_matching/template_matching.html che sembrano molto meno robusti a qualsiasi rotazione o ridimensionamento.Qual è la differenza tra la correlazione di fase e la corrispondenza dei modelli in OpenCV?

Credo che la mia domanda è: quali sono i vantaggi e gli svantaggi di:

  1. correlazione di fase + Log polare Transform.
  2. Corrispondenza modello.
  3. Funzioni di volo complete corrispondenti a qualcosa come SIFT.

risposta

1

correlazione di fase e di log-polare trasformano le sono implementati nel dominio della frequenza, entrambi questi algoritmi sono derivati ​​da Fourier teorema spostamento che due immagini tradotte mostrerà simile differenza di fase nel dominio della frequenza. La correlazione di fase è in grado di registrare solo il movimento di traslazione, mentre la trasformata log-polare funziona nel dominio log-polare che essenzialmente converte le variazioni di rotazione e scala in una traslazione lineare. Pertanto, utilizzando la corrispondenza log-polare è possibile registrare due immagini che vengono ridotte in scala e copie tradotte l'una dell'altra. Entrambi questi algoritmi non possono registrare la trasformazione deformabile. Per un'analisi dettagliata sull'ambiguità e sull'ampiezza di rotazione e variazione di scala che questi algoritmi possono determinare, è possibile fare riferimento a questo documento "http://ieeexplore.ieee.org/document/901003/".

L'abbinamento di modelli è essenzialmente la ricerca della presenza di un modello noto in un'immagine di base utilizzando varie metriche di somiglianza (somma delle differenze quadratiche, correlazione incrociata normalizzata, distanza Hausdorff ecc.). Quindi la partita può essere applicata sia su attributo spaziale (immagine intensità, mappa bordo, HOG) o attributo di frequenza (fase). La correlazione di fase e la corrispondenza log-polare possono essere implementate su immagini della stessa dimensione, quindi la corrispondenza del modello basato sulla fase corrisponderà essenzialmente alla ricerca della stessa patch nello spazio di ricerca con il valore più alto della correlazione.

SIFT, SURF ecc genera un set di icone di grandi dimensioni che dipende da vari parametri in modo tale da non essere influenzato da variazioni di scala, disturbi e variazioni di illuminazione. Questo è un argomento molto ampio e molti documenti sono disponibili online confrontando il loro funzionamento.

Secondo la mia esperienza SIFT, SURF è un classificatore molto più robusto nella localizzazione dell'oggetto in un singolo frame ma se si sta pianificando di individuare un oggetto in un video in cui il tempo di calcolo è un fattore limitante, la corrispondenza dei modelli serve meglio.