Regolarizzazione di Tichonov

Da testwiki.
Versione del 12 mar 2025 alle 06:39 di imported>InternetArchiveBot (Aggiungi 1 libro per la Wikipedia:Verificabilità (20250310)) #IABot (v2.0.9.5) (GreenC bot)
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)
Vai alla navigazione Vai alla ricerca

In matematica, la regolarizzazione di Tichonov, che prende nome da Andrej Tichonov, è il metodo più comunemente usato di regolarizzazione di problemi mal posti (ill-posed problems). In statistica il metodo è conosciuto come regressione ridge e, ripetutamente ed indipendentemente riscoperto, è anche variamente noto come il metodo di Tichonov-Miller, metodo di Phillips-Twomey, metodo dell'inversione lineare vincolata o anche metodo di regolarizzazione lineare.

Il risultato è collegato all'algoritmo di Levenberg-Marquardt per problemi di minimi quadrati non lineari.

Quando il problema seguente non è ben posto (sia a causa della non esistenza, sia per la non unicità di x):

A𝐱=𝐛

allora l'approccio usuale è noto come metodo dei minimi quadrati lineari e consiste nel minimizzare lo scarto:

A𝐱𝐛2

dove è la norma euclidea. Tuttavia, in generale, il sistema può essere sottodeterminato o sovradeterminato (A può essere mal condizionata o singolare) e la soluzione, sempre che esista, può non essere univoca. Allo scopo di preferire una particolare soluzione con proprietà desiderate, il termine di regolarizzazione viene incluso nella minimizzazione:

A𝐱𝐛2+Γ𝐱2

per qualche opportuna scelta della matrice di Tichonov, Γ. In molti casi, la scelta cade sulla matrice identità Γ=I, preferendo soluzioni con norma più piccola. In altri casi, operatori passa alto (es. un operatore differenza oppure un operatore discreto di Fourier opportunamente pesato) possono essere impiegati per rafforzare il carattere liscio dell'operatore soggiacente quando è creduto essere principalmente continuo.

Questa regolarizzazione migliora il condizionamento del problema, rendendo possibile una soluzione di tipo numerico. Una soluzione esplicita, denotata come x^, è data da:

x^=(ATA+ΓTΓ)1AT𝐛

L'effetto di regolarizzazione può essere variato scalando la matrice Γ. Per cui se Γ=αI, quando α = 0 si ottiene una soluzione che coincide con quella de-regolarizzata fornita dai minimi quadrati, sempre che (ATA)−1 esista.

Interpretazione bayesiana

Nonostante all'inizio la scelta della soluzione al problema di regolarizzazione possa sembrare artificiosa, e infatti la matrice Γ sembra piuttosto arbitraria, il procedimento può essere giustificato da un punto di vista bayesiano. Si noti che per un problema mal condizionato si devono necessariamente introdurre varie assunzioni aggiuntive allo scopo di ottenere una soluzione stabile.

Statisticamente noi possiamo assumere a priori di sapere che x è una variabile casuale con una distribuzione normale multivariata. Per semplicità supponiamo che la media sia nulla e che ogni componente sia indipendente con deviazione standard σx. I nostri dati sono soggetti anche ad errori, e noi supponiamo gli errori in b essere statisticamente indipendenti con media nulla e deviazione standard σb. Sotto queste assunzioni la soluzione regolarizzata di Tichonov è la soluzione più probabile in termini di stima di probabilità a posteriori massima (maximum a posteriori probability (MAP) estimate) a partire dai dati e dalla distribuzione a priori di x, secondo il teorema di Bayes. La matrice di Tikhonov è allora Γ=αI con il coefficiente di Tichonov α=σb/σx.

Se l'assunzione di normalità è sostituita mediante le assunzioni di omoschedasticità e non correlazione degli errori, e se assumiamo ancora nulla la media, allora il teorema di Gauss-Markov assicura che la soluzione è la minima stima non distorta

Regolarizzazione generalizzata di Tikhonov

Nel caso di distribuzioni normali multivariate generiche per x e per errore sui dati, è possibile applicare una trasformazione alle variabili per ricondursi al caso esposto sopra. Equivalentemente, si può cercare una x in modo da minimizzare

AxbP2+xx0Q2

dove xQ2 sta per norma pesata xTQx (confronta con la distanza di Mahalanobis). Nell'interpretazione bayesiana P è la matrice di covarianza inversa di b, x0 è il valore di aspettazione di x, e Q la matrice di covarianza inversa di x. La matrice di Tichonov è allora data come una fattorizzazione della matrice Q=ΓTΓ (es. la fattorizzazione di Cholesky), ed è considerata un filtro di casualizzazione bianco.

Questo problema generalizzato può essere risolto esplicitamente usando la formula

x0+(ATPA+Q)1ATP(bAx0).

Regolarizzazione nello spazio di Hilbert

Tipicamente i problemi discreti lineari mal condizionati risultano dalla discretizzazione di equazioni integrali, ed è possibile formulare una regolarizzazione di Tichonov nel contesto infinito-dimensionale originale. In quanto visto più sopra, possiamo interpretare A come un operatore compatto su spazi di Hilbert, e x e b come elementi rispettivamente nel dominio e nel range di A. L'operatore A*A+ΓTΓ è allora un operatore hermitiano autoaggiunto limitato invertibile.

Collegamenti con la decomposizione ai valori singolari e il filtro di Wiener

Con Γ=αI, questa soluzione basata sui minimi quadrati può essere analizzata in maniera particolare tramite la decomposizione ai valori singolari. Data la decomposizione ai valori singolari di A

A=UΣVT

con valori singolari σi, la soluzione regolarizzata di Tichonov può essere espressa come

x^=VDUTb

dove D ha valori diagonali

Dii=σiσi2+α2

mentre tutti gli altri valori sono nulli. Questo dimostra l'effetto del parametro di Tichonov sul numero di condizionamento del problema regolarizzato. Per il caso generalizzato una rappresentazione simile può essere derivata usando una decomposizione ai valori singolari generalizzata.

Infine, la soluzione regolarizzata di Tichonov può essere collegata al filtro di Wiener:

x^=i=1qfiuiTbσivi

dove i pesi di Wiener sono fi=σi2σi2+α2 e q è il rango di A.

Determinazione del fattore di Tichonov

Il valore ottimale del parametro di regolarizzazione α è solitamente incognito e spesso nei problemi pratici è determinato ad hoc. Un possibile approccio si basa sull'interpretazione bayesiana descritta sopra. Altri approcci includono il principio di discrepanza, la cross-validazione, il metodo della curva L, la verosimiglianza massima ristretta e lo stimatore di rischio predittivo non distorto (unbiased predictive risk estimator). Grace Wahba dimostrarono che il parametro ottimale, nel senso di validazione incrociata dei dati del tipo uno-escluso (leave-one-out cross-validation) minimizza:

G=RSSτ2=Xβ^y2[Tr(IX(XTX+α2I)1XT)]2

dove RSS è la somma dei quadrati residui e τ è l'effettivo numero di gradi di libertà.

Usando la precedente decomposizione a valori singolari, possiamo semplificare l'espressione sopra:

RSS=yi=1q(uib)ui2+i=1qα2σi2+α2(uib)ui2
RSS=RSS0+i=1qα2σi2+α2(uib)ui2

e

τ=mi=1qσi2σi2+α2=mq+i=1qα2σi2+α2

Relazione con la formulazione probabilistica

La formulazione probabilistica di un problema inverso introduce (quando tutte le incertezze sono gaussiane) una matrice di covarianza CM rappresentante le incertezze a priori sui parametri del modello, e una matrice di covarianza CD rappresentate le incertezze sui parametri osservati (vedi, per esempio, Tarantola, 2004 [1]). Nel caso particolare quando queste due matrici sono diagonali e isotrope, CM=σM2I e CD=σD2I, e, in questo caso, le equazioni della teoria inversa si riducono alle equazioni sopra, con α=σD/σM.

Storia

La regolarizzazione di Tichonov è stata inventata indipendentemente in vari differenti contesti. Divenne largamente famosa grazie alla sua applicazione alle equazioni integrali a partire dal lavoro di Andrej Tichonov e David L. Phillips. Alcuni autori usano il termine regolarizzazione di Tichonov-Phillips. Il caso a dimensione finita fu esposto da Arthur E. Hoerl, il quale intraprese un approccio statistico, e da Manus Foster, il quale interpretò questo metodo come un filtro di Wiener-Kolmogorov. Conseguentemente a Hoerl, esso è noto nella letteratura statistica come ridge-regressione.

Bibliografia

Voci correlate

Template:Controllo di autorità Template:Portale