Covarianza (probabilità)

Da testwiki.
Versione del 18 ott 2023 alle 09:38 di 150.217.8.137 (discussione) (Definizione: è presente un solo prodotto nella formula)
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)
Vai alla navigazione Vai alla ricerca

Template:NN In statistica e in teoria della probabilità, la covarianza di due variabili statistiche o variabili aleatorie è un valore numerico che fornisce una misura di quanto le due varino assieme.

Probabilità

Definizione

La covarianza di due variabili aleatorie X e Y è il valore atteso del prodotto delle loro distanze dalla media:

Cov(X,Y)=𝔼[(X𝔼[X])(Y𝔼[Y])].

La covarianza di X e Y può anche essere espressa come la differenza tra il valore atteso del loro prodotto e il prodotto dei loro valori attesi:

Cov(X,Y)=𝔼[XY]𝔼[X]𝔼[Y].

Infatti per la linearità del valore atteso risulta

𝔼[XYX𝔼[Y]𝔼[X]Y+𝔼[X]𝔼[Y]]=𝔼[XY]𝔼[X]𝔼[Y]𝔼[X]𝔼[Y]+𝔼[X]𝔼[Y]=𝔼[XY]𝔼[X]𝔼[Y].

Proprietà

La covarianza rispetta le seguenti proprietà, per variabili aleatorie X, Y e Z, e costanti a e b:

  • Cov(X,Y)=Cov(Y,X) 
  • Cov(aX+b,Y)=aCov(X,Y) 
  • Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z) 

Due variabili aleatorie indipendenti hanno covarianza nulla, poiché dalla loro indipendenza segue

𝔼[XY]=𝔼[X]𝔼[Y].

Due variabili aleatorie che hanno covarianza nulla sono incorrelate.

Due variabili aleatorie dipendenti possono essere incorrelate. Ad esempio, se X è una variabile aleatoria di legge uniforme sull'intervallo [1,1] e Y=X2, allora

Cov(X,Y)=Cov(X,X2)=𝔼[X3]𝔼[X]𝔼[X2]=00𝔼[X2]=0.

Varianza

La covarianza può essere considerata una generalizzazione della varianza

Var(X)=Cov(X,X) 

e compare come termine di correzione nella relazione

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y).

Più in generale, per variabili aleatorie X1,,Xn e Y1,,Ym vale

Var(iXi)=Cov(iXi,jXj)=i,jCov(Xi,Xj)=iVar(Xi)+2i>jCov(Xi,Xj),

come caso particolare di

Cov(iXi,jYj)=i,jCov(Xi,Yj).

Statistica

In statistica la covarianza di due variabili statistiche X e Y, indicata come σX,Y=Cov(X,Y), è un indice di variabilità congiunta.

Su una popolazione di N osservazioni congiunte (xi,yi), di rispettive medie x¯ e y¯, la covarianza osservata è

σX,Y=1Ni=1N(xix¯)(yiy¯)=1Ni=1Nxiyi(1Ni=1Nxi)(1Ni=1Nyi).

Uno stimatore della covarianza di n osservazioni congiunte (xi,yi) può essere ottenuto correggendo la formula della covarianza, dividendo per il numero di gradi di libertà. In questo caso il numero di gradi di libertà è dato dal numero delle osservazioni, n, a cui va sottratto il numero di stimatori utilizzati nel computo della covarianza. Nella covarianza entrano le medie campionarie delle xi,yi, e si può dimostrare che il computo di queste medie corrisponde alla sottrazione di 1 solo grado di libertà (non due, come ci si potrebbe aspettare). Perciò lo stimatore della covarianza è dato da

sX,Y=i=1nxiyin1i=1nxin1i=1nyin.

Lo stimatore della covarianza è anche detto covarianza campionaria.

La varianza e la covarianza intervengono per definire l'indice di correlazione di Bravais-Pearson

ρX,Y=i(xix¯)(yiy¯)j(xjx¯)2k(yky¯)2=Cov(X,Y)Var(X)Var(Y).

La covarianza è limitata dalla disuguaglianza di Cauchy-Schwarz, infatti siano U=(x1x¯,,xnx¯) e V=(y1y¯,,yny¯) i vettori degli scarti degli xi e yi rispetto alle relative medie, si può applicare la diseguaglianza ottenendo

|U,V|U,UV,V

che equivale a scrivere

|i=1n(xix¯)(yiy¯)|i=1n(xix¯)2i=1n(yiy¯)2.

Moltiplicando per Un fattore 1/n entrambi i lati si ottiene la relazione

|σX,Y|σXσY,

dove σX e σY sono le deviazioni standard per le due variabili.

Nel caso in cui z=f(x,y) possiamo dire che la covarianza è limitata nell'intervallo

|σZ||xf(x,y)|σX+|yf(x,y)|σY.

Infatti, l'espressione generale per la deviazione standard di z è

σZ=|xf(x,y)|2σX2+|yf(x,y)|2σY2+2|xf(x,y)||yf(x,y)|σX,Y.

Il valore massimo (minimo), per monotonia delle funzioni, sarà ottenuto in corrispondenza di σX,Y=σXσY (σX,Y=σXσY), quindi il valore corrispondente di σZ massimo sarà

σZ=|xf(x,y)|2σX2+|yf(x,y)|2σY2+2|xf(x,y)||yf(x,y)|σXσY=|xf(x,y)|σX+|yf(x,y)|σY.

Osserviamo che il valore massimo è dato dalla somma diretta dei contributi delle incertezze tipo moltiplicate per i relativi coefficienti ottenuti linearizzando la relazione. Si dimostra anche che tale formula è generalizzabile al caso di una funzione dipendente da n variabili.

Voci correlate

Collegamenti esterni

Template:Statistica Template:Concetti base di metrologia, statistica e metodologia della ricerca Template:Controllo di autorità Template:Portale