Teoremi di Gershgorin

Da testwiki.
Vai alla navigazione Vai alla ricerca

In matematica, e più precisamente in algebra lineare, i teoremi di Gershgorin sono tre teoremi riguardanti la localizzazione degli autovalori di una matrice a termini nel campo complesso. Il nome di questi teoremi è dovuto a quello del matematico bielorusso Semyon Aranovich Gershgorin, che per primo li ha enunciati nel 1931.

Cerchi di Gershgorin

Rappresentazione nel piano complesso dei cerchi di Gershgorin della matrice A = [-2 1 0; -1 2 -1; 1 -2 4].
Rappresentazione nel piano complesso dei cerchi di Gershgorin della matrice A=(210121124). Le croci indicano la posizione effettiva degli autovalori[1].

Una definizione di basilare importanza nella comprensione di questi teoremi è quella del cerchio di Gershgorin.

Sia A=(aij) una matrice in n×n. Si consideri l'elemento i-esimo aii della diagonale principale di A e la somma dei moduli degli elementi della riga i-esima fuori della diagonale:

Ri=j=1,jin|aij|.

Queste due quantità individuano il seguente sottoinsieme del piano complesso:

Ki:=B¯Ri(aii)={z:|zaii|Ri},

corrispondente ad un disco di raggio Ri centrato in aii, che viene detto i-esimo cerchio di Gershgorin della matrice A.

Primo teorema di Gershgorin

Teorema. Sia An×n e sia λsp(A)[2] un suo autovalore. Se xh è una coordinata di modulo massimo di un autovettore 𝐱 relativo a λ, allora λKh. In particolare esiste h tale per cui λKh, ovverosia λ appartiene almeno ad un cerchio di Gershgorin di A.

Dimostrazione. Sia λ un autovalore di A e sia 𝐱=(xj) un autovettore relativo a λ. Sia h l'indice di una coordinata di 𝐱 con modulo massimo tra tutte le coordinate. Dal momento che 𝐱 è autovettore, 𝐱 non è nullo, e dunque |xh|0. Sempre perché 𝐱 è un autovettore, vale l'identità A𝐱=λ𝐱, che, applicata all'h-esima coordinata, implica che:

j=1nahjxj=λxh.

Allora, manipolando la somma, otteniamo che:

λxhahhxh=j=1,jhnahjxj.

Dividendo entrambi i membri per xh (che ricordiamo essere non nullo), passando ai moduli e applicando la disuguaglianza triangolare otteniamo che:

|λahh|=|j=1,jhnahjxjxh|j=1,jhn|ahj||xj||xh|(*)j=1,jhn|ahj|=Rh,

dove la disuguaglianza (*) vale poiché |xj||xh| j data la scelta iniziale di h. Pertanto λKh, da cui la tesi.

Estensione del teorema e generalizzazione agli ovali di Cassini

Dal momento che gli autovalori di A=(aij) sono invarianti per similitudine, se D è una matrice diagonale invertibile, allora D1AD=(di1aijdj) ha gli stessi autovalori di A, mantenendone invariati i centri dei cerchi di Gershgorin e riscalandone soltanto il raggio. In particolare, il nuovo raggio, indicato con Ri, è calcolato mediante la seguente formula:

Ri=1|di|j=1,ji|aij||dj|.

Pertanto, il primo teorema di Gershgorin può essere esteso al seguente risultato:

Teorema. Sia An×n. Allora sp(A)dDi=1n{z:|zaii|1dij=1,jinaijdj}[3], dove Dn è un insieme di vettori con coordinate positive.
Confronto tra i cerchi di Gershgorin (in blu, verde e giallo) e gli ovali di Cassini (in rosso) relativi alla matrice A=(210121124). Le croci indicano la posizione effettiva degli autovalori[1].

Il teorema può essere esteso anche abbandonando la struttura dei cerchi di Gershgorin e riducendosi a degli ovali di Cassini della forma C(a,b,r):={z:|(za)(zb)|r}, secondo il seguente enunciato:

Teorema (degli ovali di Brauer)[4]. Sia An×n e sia λsp(A) un suo autovalore. Allora λ è contenuto nell'unione i>jC(aii,ajj,rirj) di ovali di Cassini, dove ri è il raggio dell'i-esimo cerchio di Gershgorin di A.

Secondo teorema di Gershgorin

Teorema. Sia An×n. Siano I1 e I2 due famiglie di indici con I1I2={1,,n} e I1I2=.
Si definiscano M1:=iI1Ki e M2:=iI2Ki. Se M1M2=, allora esattamente |I1| autovalori appartengono a M1 (contati con molteplicità algebrica) e i restanti |I2|=n|I1| appartengono a M2.

Questo teorema porta con sé delle importanti implicazioni. Ad esempio, per An×n, si ricava immediatamente che un cerchio disgiunto da tutti gli altri deve per forza contenere un solo autovalore, che, in quanto unico, dovrà per forza essere reale (se fosse complesso non reale, allora nello stesso cerchio dovrebbe trovarsi anche il suo autovalore complesso coniugato, e dunque il cerchio conterrebbe due autovalori invece che uno solo).

Idea di dimostrazione[5]: La dimostrazione fa uso di un argomento di continuità. Sia D=diag(A) la matrice diagonale ottenuta prendendo la diagonale di A e ponendo 0 tutti gli altri termini. Si consideri la funzione B:[0,1]n×n tale per cui B(t)=D+t(AD) (ovverosia B parametrizza il cammino fatto sul segmento [D,A] che congiunge D ad A). Chiaramente B è una funzione continua dallo spazio topologico [0,1] con l'usuale topologia euclidea allo spazio n×n avente la topologia indotta dall'analoga euclidea di n2. Sia Ki(t) l'i-esimo cerchio di Gershgorin di B(t). Si osserva che Ki(t) ha centro aii indipendentemente da t, mentre il suo raggio è tRi, dove Ri è il raggio di Ki(1), il cerchio riferito ad A. Pertanto Ki(t1)Ki(t2) per t1t2. Si ricorda che gli zeri di un polinomio dipendono continuamente dai coefficienti, e che gli autovalori di B(t) sono gli zeri del polinomio caratteristico di B(t), i cui coefficienti dipendono continuamente dai termini di B(t), e dunque da t. Pertanto, poiché anche B(t) è continua, gli autovalori di B(t) dipendono continuamente da t. Sia λ(t) il cammino continuo di uno degli autovalori. Allora, se λ(0)M1, λ(t)M1 per ogni t[0,1]; altrimenti esisterebbe uno t0 per cui λ(t)Ki(1)Ki(t0) per ogni i (il che violerebbe il primo teorema di Gershgorin) o varrebbe t0M1M2=, assurdo. Analogamente vale lo stesso per M2. Pertanto M1 contiene lo stesso numero di autovalori di iI1Ki(0)=iI1{aii}, e quindi |I1| autovalori. Analogamente M2 ne contiene |I2|, da cui la tesi.

Terzo teorema di Gershgorin

Teorema. Sia λ un autovalore di una matrice An×n irriducibile per permutazioni. Se per ogni indice j vale l'implicazione λKjλKj, allora λKi i, e dunque λi=1nKi.

Dimostrazione. Sia h tale per cui λKh. Ripercorrendo la stessa dimostrazione del primo teorema di Gershgorin si ottiene che:

|λahh|j=1,jhn|ahj||xj||xh|j=1,jhn|ahj|=Rh.

Dal momento che λ appartiene alla frontiera Kh, allora il primo e l'ultimo membro devono essere uguali, e così tutte le disuguaglianze si rivelano essere uguaglianze. Affinché ciò accada, è necessario che valga |xj|=|xh| per tutti gli indici j per cui ahj0; ciò implica che per tutti questi indici j anche xj è una coordinata di modulo massimo per 𝐱: per il primo teorema di Gershgorin, allora λKj per tali j.

Poiché A è irriducibile per permutazioni, il grafo associato ad A è fortemente connesso, e dunque deve esistere una sequenza di cammini di indici (eventualmente ripetuti) h1=h, h2, ..., hm con mn tale per cui appaiano in essa tutti i numeri da 1 a n. Dacché esiste dunque un arco da h1=h a t:=h2, aht0, e dunque, per il ragionamento di prima, λKt. Reiterando la stessa dimostrazione fino alla fine della sequenza sostituendo ad h e t gli indici successivi nella sequenza, si è mostrato dunque che λKi per ogni i, da cui la tesi.

Note

  1. 1,0 1,1 È possibile ottenere una rappresentazione grafica analoga per ogni matrice 3×3 con l'ausilio di questo sito.
  2. sp(A) indica lo spettro di A, ossia l'insieme dei suoi autovalori.
  3. Se si sceglie D come l'insieme di tutti i vettori in n con coordinate positive, si può dimostrare che l'inclusione è stretta (cfr. R. S. Varga, Geršgorin and His Circles, Springer Verlag, 2004).
  4. Template:Cita libro
  5. Template:Cita libro

Bibliografia

  • D. Bini, M. Capovani, O. Menchi, Metodi numerici per l'algebra lineare, Zanichelli, Bologna, 1988.
  • R. S. Varga, Geršgorin and His Circles, Springer, 2004.

Template:Portale