Metodo del gradiente coniugato

In analisi numerica, il metodo del gradiente coniugato (spesso abbreviato in CG, dall'inglese conjugate gradient) è un algoritmo per la risoluzione numerica di un sistema lineare la cui matrice sia simmetrica e definita positiva.

Il metodo è stato inizialmente proposto nel 1952 dai matematici Magnus Hestenes e Eduard Stiefel^[1] e costituisce una variante del metodo del gradiente in cui la direzione di discesa a ogni passo è scelta in modo tale da garantire la convergenza del metodo in un numero di iterazioni pari al più alla dimensione del sistema da risolvere.

Il metodo del gradiente biconiugato ne fornisce una generalizzazione al caso di matrici non simmetriche.

Descrizione del metodo

Si voglia calcolare la soluzione $𝐱 \in ℝ^{n}$ del sistema lineare

A 𝐱 = 𝐛

dove $A \in ℝ^{n \times n}$ è una matrice simmetrica e definita positiva a coefficienti reali e $𝐛 \in ℝ^{n}$ è il termine noto.

La matrice $A$ , grazie alle sue proprietà, induce un prodotto scalare $⟨ \cdot, \cdot ⟩_{A} : ℝ^{n} \times ℝ^{n} \to ℝ$ definito da

⟨ 𝐮, 𝐯 ⟩_{𝐀} : = 𝐮^{T} 𝐀 𝐯, \forall 𝐮, 𝐯 \in ℝ^{n} .

Una coppia di vettori $𝐮, 𝐯$ che soddisfa $⟨ 𝐮, 𝐯 ⟩_{A} = 0$ , cioè ortogonale rispetto a questo prodotto scalare, si dice $A$ -coniugata.

Inoltre la soluzione $𝐱$ del sistema lineare precedente corrisponde al punto di minimo della forma quadratica

Q (𝐱) = \frac{1}{2} 𝐱^{T} A 𝐱 - 𝐱^{T} 𝐛 .

Infatti:

\nabla Q (𝐱) = A 𝐱 - 𝐛

da cui

\nabla Q (𝐱) = 0 \Leftrightarrow A 𝐱 = 𝐛 .

Questo suggerisce di procedere iterativamente, partendo da una data soluzione iniziale $𝐱_{0}$ e muovendosi lungo direzioni ${𝐩_{k}}_{k = 0}^{n}$ che minimizzano la forma quadratica $Q (𝐱) .$ A differenza del metodo del gradiente, in cui la direzione di discesa $𝐩_{k}$ al $k$ -esimo passo è scelta pari a $𝐩_{k} = - \nabla Q (𝐱_{k})$ , nel caso del gradiente coniugato essa viene scelta in modo che risulti $A$ -ortogonale alle direzioni precedenti, cioè $⟨ 𝐩_{j}, 𝐩_{k} ⟩_{A} = 0, \forall j = 0, \dots, k - 1 .$ Il significato geometrico di tale scelta è mostrato nella figura a lato, da cui emerge in particolare il vantaggio di scegliere direzioni $A$ -ortogonali e non semplicemente ortogonali alle linee di livello della funzione $Q (𝐱)$ .

Alla $k$ -esima iterazione la soluzione viene dunque aggiornata nel modo seguente:

𝐱_{k + 1} = 𝐱_{k} + α_{k} 𝐩_{k},

dove $α_{k} \in ℝ^{+}$ corrisponde alla lunghezza del passo di discesa. È possibile dimostrare (si veda ad esempio Soluzione di sistemi lineari) che la scelta ottimale per $α_{k}$ , che porta cioè al minimo di $Q (𝐱_{k + 1})$ , è

α_{k} = \frac{𝐩_{k}^{𝖳} 𝐫_{k}}{𝐩_{k}^{𝖳} A 𝐩_{k}},

dove

𝐫_{k} = 𝐛 - A 𝐱_{k}

è il residuo del sistema.

Un metodo per calcolare direzioni di discesa $A$ -ortogonali alle precedenti è il seguente^[2]:

𝐩_{k + 1} = 𝐫_{k + 1} - β_{k} 𝐩_{k},

con $𝐩_{0} = 𝐫_{0}$ ; la scelta ottimale per $β_{k}$ è

β_{k} = \frac{𝐩_{k}^{T} A 𝐫_{k + 1}}{𝐩_{k}^{T} A 𝐩_{k}} .

Algoritmo risolutivo

Lo schema generale per la soluzione mediante metodo del gradiente coniugato è il seguente:

\begin{matrix} 𝐱_{0} = v e t t o r e i n i z i a l e a r b i t r a r i o \\ 𝐫_{0} = 𝐛 - A 𝐱_{0} \\ 𝐩_{0} = 𝐫_{0} \\ for k = 0, \dots, n \\ α_{k} = \frac{𝐩_{k}^{𝖳} 𝐫_{k}}{𝐩_{k}^{𝖳} A 𝐩_{k}} \\ 𝐱_{k + 1} = 𝐱_{k} + α_{k} 𝐩_{k} \\ 𝐫_{k + 1} = 𝐛 - A 𝐱_{k + 1} \\ β_{k} = \frac{𝐩_{k}^{T} A 𝐫_{k + 1}}{𝐩_{k}^{T} A 𝐩_{k}} \\ 𝐩_{k + 1} = 𝐫_{k + 1} - β_{k} 𝐩_{k} \\ k = k + 1 \\ end . \end{matrix}

L'eventuale implementazione dell'algoritmo in aritmetica floating point, in cui la convergenza in al più $n$ passi non è garantita, il ciclo for può essere sostituito da un ciclo while che verrà eseguito finché la norma del residuo $‖ 𝐫_{k} ‖$ non sia più piccola di una tolleranza impostata dall'utente.

Metodo del gradiente coniugato precondizionato

In molti casi è possibile accelerare ulteriormente la velocità di convergenza dell'algoritmo migliorando le proprietà di condizionamento della matrice $A$ . Si introduca a tal fine una matrice di precondizionamento $P$ simmetrica e definita positiva. L'algoritmo corrispondente al metodo del gradiente coniugato precondizionato (spesso abbreviato in PCG, dall'inglese preconditioned conjugate gradient) si ottiene applicando la versione senza precondizionamento per trovare la soluzione $\hat{𝐱}$ del seguente sistema:

R^{- 1} A R^{- 1} \hat{𝐱} = R^{- 1} 𝐛

,

dove $R$ è la radice quadrata di $P$ e $\hat{𝐱} = R 𝐱$ .

Lo schema risolutivo in questo caso diventa^[2]:

\begin{matrix} for k = 0, \dots, n \\ α_{k} = \frac{𝐩_{k}^{𝖳} 𝐫_{k}}{𝐩_{k}^{𝖳} A 𝐩_{k}} \\ 𝐱_{k + 1} = 𝐱_{k} + α_{k} 𝐩_{k} \\ 𝐫_{k + 1} = 𝐛 - A 𝐱_{k + 1} \\ trovare la soluzione 𝐳_{k + 1} del sistema P 𝐳_{k + 1} = 𝐫_{k + 1} \\ β_{k} = \frac{𝐩_{k}^{T} A 𝐳_{k + 1}}{𝐩_{k}^{T} A 𝐩_{k}} \\ 𝐩_{k + 1} = 𝐳_{k + 1} - β_{k} 𝐩_{k} \\ k = k + 1 \\ end . \end{matrix}

Analisi dell'errore

È possibile dimostrare che l'errore commesso alla $k$ -esima iterazione del metodo del gradiente coniugato soddisfa la seguente stima^[2]:

‖ 𝐞_{k} ‖_{A} \leq \frac{2 c^{k}}{1 + c^{2 k}} ‖ 𝐞_{0} ‖_{A},

dove

c = \frac{\sqrt{κ (A)} - 1}{\sqrt{κ (A)} + 1},

$κ (A)$ il numero di condizionamento in norma $2$ di $A$ e $‖ 𝐱 ‖_{A} : = ⟨ 𝐱, 𝐱 ⟩_{A}$ è la norma indotta da $A$ .

Nel caso precondizionato vale la stessa stima con

c = \frac{\sqrt{κ (P^{- 1} A)} - 1}{\sqrt{κ (P^{- 1} A)} + 1} .

Esempio di implementazione

Si riporta un esempio di possibile implementazione del metodo del gradiente coniugato non precondizionato compatibile con i linguaggi di programmazione Octave e MATLAB.

function [xk, iter] = gradiente_coniugato(A, b, x0, toll, nmax)
    xk = x0;        
    rk = b - A * xk;
    pk = rk;
    iter = 0;
    while (norm(rk) >= toll*norm(b))
        alphak = (pk' * rk) / (pk' * A * pk);
        xk = xk + alphak * pk;
        rk = b - A * xk;
        betak = (pk' * A * rk) / (pk' * A * pk);
        pk = rk - betak * pk;
        iter = iter+1;
      if (iter == nmax && norm(rk) > toll*norm(b)) 
        disp(['warning: Convergenza non raggiunta in ' num2str(iter) ' iterazioni!']);
        break
      end
    end
end

La funzione che implementa il metodo del gradiente coniugato precondizionato è già salvata in MATLAB nel comando pcg().
Esempio:

x=pcg(A,b) 
%determina la soluzione x del sistema lineare Ax=b di una matrice simmetrica e definita positiva mediante il metodo del gradiente coniugato a partire dal vettore iniziale x0 nullo.

x=pcg(A,b,tol,nmax)
%determina la soluzione x imponendo come criterio d'arresto la tolleranza e il numero di iterazioni.

Note

↑ Template:Cita pubblicazione
↑ ^2,0 ^2,1 ^2,2 Template:Cita.

Bibliografia

Template:Cita libro

Voci correlate

Collegamenti esterni

Template:Controllo di autorità Template:Portale

[1] Template:Cita pubblicazione

[Quarteroni-2] 2,0 ^2,1 ^2,2 Template:Cita.

[1]

[2]

Metodo del gradiente coniugato

Indice

Descrizione del metodo

Algoritmo risolutivo

Metodo del gradiente coniugato precondizionato

Analisi dell'errore

Esempio di implementazione

Note

Bibliografia

Voci correlate

Collegamenti esterni

Menu di navigazione

Metodo del gradiente coniugato

Descrizione del metodo

Algoritmo risolutivo

Metodo del gradiente coniugato precondizionato

Analisi dell'errore

Esempio di implementazione

Note

Bibliografia

Voci correlate

Collegamenti esterni

Menu di navigazione

Ricerca