2014-07-07 18 views
7

Ciao, sono nuovo di Computer Vision. Sto studiando Denso SIFT e HOG. Per SIFT denso, l'algoritmo considera ogni punto come punto interessato e calcola il suo vettore di gradiente. HOG è un altro modo per descrivere un'immagine con un vettore gradiente.SIFT denso VS HOG

Penso che Dense SIFT sia il caso speciale per HOG. In HOG, se impostiamo la dimensione del contenitore su 8, per ogni finestra ci sono 4 blocchi, per ogni blocco ci sono 4 celle e il passo del blocco è uguale alla dimensione del blocco, possiamo ancora ottenere un vettore dim. 128 per questa finestra . E possiamo impostare qualsiasi passo della finestra per far scorrere la finestra per rilevare l'intera immagine. Se il passo della finestra di entrambi questi due algoritmi è lo stesso, possono ottenere risultati identici.

Non sono sicuro se sono corretto. Qualcuno può aiutarmi?

+1

Ciao, il diavolo è nei dettagli di basso livello temo, come gli schemi di interpolazione e le strategie di normalizzazione. In realtà è abbastanza difficile confrontarli nei dettagli, anche se è così per chiedere. (presumo che tu sia a conoscenza di VLFEAT, buoni documenti su setaccia e hog denso: http://www.vlfeat.org/) – QED

risposta

7

Il descrittore SIFT sceglie un 16x16 e quindi lo divide in 4x4. Su ognuna di queste 4 finestre calcola un istogramma di gradienti orientati. Mentre calcola questo istogramma, esegue anche un'interpolazione tra gli angoli vicini. Una volta che hai tutte le finestre 4x4, usa un gaussiano di metà della dimensione della finestra, centrato al centro del blocco 16x16 per pesare i valori nell'intero descrittore 16x16.

HoG d'altra parte calcola solo un semplice istogramma di gradienti orientati come dice il nome.

Ritengo che SIFT sia più adatto a descrivere l'importanza di un punto, a causa della ponderazione gaussiana coinvolta, mentre HoG non ha un tale pregiudizio. Per questo motivo, (idealmente) HoG dovrebbe essere più adatto alla classificazione delle immagini rispetto a SIFT denso, se tutti i vettori di caratteristiche sono concatenati in un vettore enorme (questa è la mia opinione, potrebbe non essere vero)

+1

HOG utilizza anche l'interpolazione tri-lineare nel binning e ha uno schema di normalizzazione intelligente che è collegato a la nozione di blocchi e consente di sovrapporre blocchi, quindi l'istogramma non è così semplice. – QED

+0

sì, anche HoG interpola (probabilmente è fatto in modo diverso da vagliare), la differenza principale è la ponderazione gaussiana. La normalizzazione è fatta da ogni descrittore. – Bharat

+0

In tal caso, Significa che Dense Sift è un caso speciale di HOG con Ponderazione Gaussiana per ogni cella (o punto di interesse)? – user3783676