Rilevatore di Harris

Da testwiki.
Vai alla navigazione Vai alla ricerca

Il rilevatore di Harris è un rilevatore di angoli introdotto da Chris Harris e Mike Stephens nel 1988, estensione del rilevatore di Moravec[1] che ne migliora l'accuratezza nel distinguere gli angoli dai bordi.[2]

Benché sia stato sopravanzato da altri rilevatori come SIFT, SURF e ORB, il rilevatore di Harris rimane un algoritmo importante in visione artificiale, del quale esistono diverse estensioni,[3][4][5][6][7] e ha applicazioni in registratura,[8] mosaicizzazione,[9] ricostruzione tridimensionale,[10] rilevamento del movimento,[11] riconoscimento di oggetti,[12] image retrieval[13] e video tracking.[14]

Descrizione

In un'immagine digitale, un angolo è un punto P che si trova all'intersezione di due bordi, ovvero il gradiente dell'intensità in un intorno di P presenta due direzioni dominanti distinte.[15] Gli angoli sono caratteristiche importanti in un'immagine e contengono informazioni per rappresentarne il contenuto in molti problemi di visione artificiale.

Il rilevatore di Harris determina l'angolarità di un punto analizzando il cambiamento di intensità in un intorno del punto in funzione di una traslazione dell'intorno. Data un'immagine digitale I in scala di grigi e un intorno W centrato in (x,y), se W è soggetto a una traslazione (Δx,Δy) la somma dei quadrati residui SSD(Δx,Δy) dell'intensità tra W e la sua traslazione assumerà un valore elevato se la direzione (Δx,Δy) è ortogonale a un bordo, o un valore piccolo se l'intorno del punto è una regione piatta o se (Δx,Δy) è parallela a un bordo.

Se si considerano tutte le possibili direzioni di traslazione, il punto in analisi è probabilmente parte di una regione piatta se la SSD ha un valore limitato in ogni direzione, è probabilmente situato in prossimità di un bordo se la SSD ha un valore dominante in una direzione (ortogonale al bordo), oppure è probabilmente situato in prossimità di un angolo se la SSD assume valori elevati in ogni direzione.

La somma dei quadrati residui può essere espressa come

SSD(Δx,Δy)=(xk,yk)W(I(xk,yk)I(xk+Δx,yk+Δy))2.

Approssimando I(x+Δx,y+Δy) con un'espansione in serie di Taylor, dove Ix e Iy sono le derivate parziali dell'intensità I

I(x+Δx,y+Δy)I(x,y)+Ix(x,y)Δx+Iy(x,y)Δy

si ottiene che

SSD(Δx,Δy)(x,y)W(Ix(x,y)Δx+Iy(x,y)Δy)2,

che può essere riscritta in forma matriciale come

SSD(Δx,Δy)(ΔxΔy)M(ΔxΔy),

dove M è noto come tensore di struttura[1]

M=(x,y)W[Ix2IxIyIxIyIy2]=[(x,y)WIx2(x,y)WIxIy(x,y)WIxIy(x,y)WIy2].

Gli autovettori del tensore di struttura determinano le direzioni di massima e minima variazione della somma dei quadrati residui, e i corrispondenti autovalori λ1 e λ2 quantificano la variazione lungo le rispettive direzioni. Se entrambi gli autovalori sono piccoli, la SSD ha valori piccoli in ogni direzione e il punto in analisi è probabilmente parte di una regione piatta, se un autovalore è significativamente maggiore dell'altro, la SSD ha una direzione dominante e il punto è probabilmente locato in prossimità di un bordo, mentre se entrambi gli autovalori sono elevati la SSD ha valori elevati in ogni direzione e il punto è probabilmente locato in prossimità di un angolo.

Per quantificare l'angolarità di un punto viene definita una funzione di risposta R

R=det(M)k(tr(M))2=λ1λ2k(λ1+λ2)2

dove k è una costante, empiricamente determinata come k[0.04,0.06].

L'algoritmo di Harris può essere riassunto come:[16][17][18]

  1. conversione dell'immagine in scala di grigi;
  2. riduzione del rumore tramite un filtro Gaussiano;
  3. approssimazione del gradiente tramite l'operatore di Sobel;
  4. per ogni pixel dell'immagine, calcolo della funzione di risposta R in un intorno di dimensione 3×3;
  5. determinazione dei punti di massimo locale di R, che rappresentano gli angoli rilevati nell'immagine.

Note

Voci correlate

Collegamenti esterni

Template:Portale