Distribuzione normale multivariata

Da testwiki.
Vai alla navigazione Vai alla ricerca

Template:F

Funzione di densità di una normale multivariata

In teoria della probabilità e statistica, la distribuzione normale multivariata o distribuzione gaussiana multivariata o vettore gaussiano è una generalizzazione della distribuzione normale (univariata) a dimensioni più elevate. Una definizione è che un vettore di variabili aleatorie ha una distribuzione normale k-variata se ogni combinazione lineare delle sue k componenti ha distribuzione normale univariata. La sua importanza deriva principalmente dal teorema del limite centrale multivariato. La distribuzione normale multivariata è spesso utilizzata per descrivere, almeno approssimativamente, un qualunque insieme di variabili aleatorie a valori reali (possibilmente) correlate, ognuna delle quali è clusterizzata attorno ad un valore medio.

Definizioni

Notazione e parametrizzazione

La distribuzione normale multivariata di un vettore aleatorio k-dimensionale 𝐗=(X1,,Xk)T può essere scritta secondo la notazione:

𝐗  𝒩(μ,Σ),

o, per rendere esplicito il fatto che 𝐗 sia k-dimensionale,

𝐗  𝒩k(μ,Σ),

con un vettore della media di dimensione k

μ=E[𝐗]=(E[X1],E[X2],,E[Xk])T,

e matrice di covarianza di dimensione k×k

Σi,j:=E[(Xiμi)(Xjμj)]=Cov[Xi,Xj]

per cui 1i,jk. La matrice inversa della matrice di covarianza è chiamata matrice di precisione, e si indica come 𝑸=Σ1.

Vettore aleatorio normale standard

Un vettore aleatorio a valori reali 𝐗=(X1,,Xk)T è detto vettore aleatorio normale standard se tutte le sue componenti Xn sono indipendenti e ognuna è una variabile aleatoria normale di valore medio nullo e varianza unitaria, cioè se Xn 𝒩(0,1) per tutti i valori di n.[1]Template:Rp

Vettore aleatorio normale centrato

Un vettore aleatorio a valori reali 𝐗=(X1,,Xk)T è chiamato vettore aleatorio normale centrato se esiste una matrice deterministica 𝑨 di dimensione k× tale per cui 𝑨𝐙 ha la stessa distribuzione di 𝐗 dove 𝐙 è un vettore aleatorio normale standard con componenti.[1]Template:Rp

Vettore aleatorio normale

Un vettore aleatorio a valori reali 𝐗=(X1,,Xk)T è detto vettore aleatorio normale se esistono un vettore aleatorio -dimensionale 𝐙, che è un vettore aleatorio normale standard, un vettore k-dimensionale μ, e una matrice 𝑨 di dimensione k×, tale per cui 𝐗=𝑨𝐙+μ.[1]Template:Rp[2]Template:Rp

Formalmente:

𝐗  𝒩(μ,Σ)esiste μk,𝑨k× tale per cui 𝐗=𝑨𝐙+μ per Zn 𝒩(0,1),i.i.d.

Da qui la matrice delle covarianze è Σ=𝑨𝑨T.

Nel caso degenere in cui la matrice delle covarianze fosse singolare, la distribuzione corrispondente non ha densità; vedi la sezione seguente per dettagli. Questa situazione capita frequentemente in statistica; per esempio, nella distribuzione dei vettori dei residui nel metodo di regressione dei minimi quadrati ordinario. Le Xi in genere non sono indipendenti; possono essere visti come il risultato dell'applicazione della matrice 𝑨 all'insieme delle variabili gaussiane indipendenti 𝐙.

Definizioni equivalenti

Le seguenti definizioni sono equivalenti alla definizione data in precedenza. Un vettore aleatorio 𝐗=(X1,,Xk)T ha una distribuzione normale multivariata se soddisfa una delle seguenti condizioni equivalenti.

  • Ogni combinazione lineare Y=a1X1++akXk delle proprie componenti è normalmente distribuita. Cioè, per un qualunque vettore costante 𝐚k, il valore aleatorio Y=𝐚T𝐗 ha una distribuzione normale univariata, dove una distribuzione normale univariata con varianza nulla è un punto materiale sulla sua media.
  • Esistono un vettore k-dimensionale μ e una matrice di dimensione k×k simmetrica e positiva semidefinita Σ, tali per cui la funzione caratteristica di 𝐗 è
φ𝐗(𝐮)=exp(i𝐮Tμ12𝐮TΣ𝐮).

La distribuzione normale sferica può essere caratterizzata come l'unica distribuzione in cui le componenti siano indipendenti in un qualunque sistema di coordinate cartesiano.[3][4]

Note

Voci correlate

Collegamenti esterni

Template:Probabilità Template:Controllo di autorità Template:Portale