Distribuzione Gamma: differenze tra le versioni

Da testwiki.
Vai alla navigazione Vai alla ricerca
imported>Mat4free
m Annullata la modifica 143495923 di 51.179.109.72 (discussione)
 
(Nessuna differenza)

Versione attuale delle 10:10, 9 feb 2025

Template:Variabile casuale In teoria delle probabilità la distribuzione Gamma è una distribuzione di probabilità continua, che comprende, come casi particolari, anche le distribuzioni esponenziale e chi quadrato.

Viene utilizzata come modello generale dei tempi di attesa nella teoria delle code, soprattutto qualora siano importanti effetti che rimuovano "l'assenza di memoria" della distribuzione esponenziale. Nella statistica bayesiana è comune sia come distribuzione a priori che come distribuzione a posteriori.

Definizione

La distribuzione Gamma è la distribuzione di probabilità della variabile aleatoria definita come la somma di variabili aleatorie indipendenti e con distribuzione esponenziale; la distribuzione Gamma è una distribuzione di probabilità definita sui numeri reali positivi, +. A seconda degli autori, viene parametrizzata in due modi diversi: sia tramite la coppia di numeri positivi (k,θ), sia tramite la coppia di numeri positivi (α,β). Le due parametrizzazioni sono legate dalle relazioni α=k e β=1/θ. Nel seguito si farà riferimento alla parametrizzazione Gamma(k,θ).

La sua funzione di densità di probabilità è

f(x)=1θkΓ(k)xk1exθ=βαΓ(α)xα1eβx,

dove Γ(k)=0tk1etdt è la funzione Gamma di Eulero.

Possiamo osservare che se k vale che Γ(k)=(k1)!

La sua funzione di ripartizione è la funzione gamma incompleta inferiore regolarizzata

F(x)=P(k,x)=γ(k,x/θ)Γ(k)=γ(α,βx)Γ(α),

dove γ(k,x)=0xtk1etdt è la funzione Gamma incompleta inferiore.

Caratteristiche

I momenti semplici della distribuzione Gamma di parametri (k,θ) sono

μn=𝔼[Xn]=1θkΓ(k)0xk+n1exθdx
μn=θk+n1θk1Γ(k)0uk+n1eudu=θnΓ(k+n)Γ(k)=θni=0n1(k+i),

dove si effettua la solita sostituzione xθ=u per ottenere la rappresentazione integrale della funzione Gamma di Eulero.

In particolare la distribuzione ha:

Funzione generatrice di momenti:

𝕄X(t)=𝔼[etX]=1θkΓ(k)0xk1ex(1θt)dx=1θkΓ(k)(1θt)k0uk1eudu
𝕄X(t)=(1θt)k che esiste per ogni valore di t tale che 1θt>0t<θ1.

Proprietà (Teorema del cambiamento di scala)

Se X segue la distribuzione Gamma(k,θ) allora aX segue la distribuzione Gamma(k,aθ).

Se X1,,Xn sono variabili aleatorie indipendenti, ognuna con distribuzione Gamma(ki,θ), allora la loro somma X1++Xn segue la distribuzione Gamma(k1++kn,θ).

Altre distribuzioni

La distribuzione Gamma generalizza diverse distribuzioni (è conveniente ora utilizzare la seconda delle due parametrizzazioni presentate):

Nell'inferenza bayesiana la distribuzione Gamma può descrivere sia a priori che a posteriori di un'osservazione il parametro X di diverse distribuzioni di probabilità, ad esempio della distribuzione esponenziale e della distribuzione di Poisson.

La distribuzione Gamma inversa è la distribuzione dell'inversa X1 di una variabile aleatoria X che segue la distribuzione Gamma.

Se X e Y sono variabili aleatorie indipendenti con distribuzioni Gamma(k1,θ) e Gamma(k2,θ), allora Z=XX+Y segue la distribuzione Beta Beta(k1,k2), mentre XY=Z1Z segue una distribuzione Beta del secondo tipo.

Più in generale il vettore 1X1++Xn(X1,,Xn), descritto da n variabili aleatorie indipendenti Xi di distribuzioni Gamma(ki,θ), segue una distribuzione di Dirichlet di parametri (k1,,kn).

Una generalizzazione della distribuzione Gamma è la distribuzione di Wishart, che generalizza anche la distribuzione χ2.

Stimatori

Calcoliamo ora degli stimatori che possano, dato un campione presumibilmente Gamma distribuito, restituirci una stima dei suoi parametri θ e k.

Uno stimatore corretto per θ è

θ^=1nki=1nxi.

Stimatore asintoticamente corretto per k è:

k^=ψ01[ln(i=1nxiθn)]=ψ01[1ni=1nln(xiθ)].


dove ψ01 è la funzione inversa della funzione digamma ψ0(k) così definita:

ψ0(x):=Γ(x)Γ(x)=ddxlnΓ(x).

Le dimostrazioni adottano il metodo della massima verosimiglianza, dove la funzione di verosimiglianza dato il campione è

{Xi}i=1n+
({Xi}|θ,k)=1θnkΓn(k)(i=1nxi)k1e1θi=1nxi.

Dimostrazione stimatore di θ

Il parametro θ è il più semplice da stimare.

Notiamo che la funzione di verosimiglianza è ovunque positiva e nel limite degli estremi di θ, si annulla.

limθ0+=0
limθ+=0

Pertanto se imponiamo la sua derivata uguale a zero, nel caso la soluzione sia unica, questa deve per forza essere un punto di massimo.

(θ)θ=θ^=e1θ^i=1nxiΓn(k)(i=1nxi)k1(θ^nk2i=1nxinkθ^nk1)

Occorre adesso eguagliare a zero tale espressione

(θ)θ=θ^=0θ^nk2i=1nxinkθ^nk1=0θ^=1nki=1nxi

Ed ecco il nostro stimatore di θ, che ricorda molto una media aritmetica, riscalata sul parametro k (che ricordiamo essere uguale a 1 nel caso particolare della distribuzione esponenziale). Si può notare facilmente che il valor atteso di questo stimatore è proprio θ, data la linearità dell'operatore.

𝔼[θ^]=𝔼[1kni=1nxi]=1kni=1n𝔼[xi].

Ricordiamo 𝔼[xi]=kθ

𝔼[θ^]=nkθkn=θ.

Dimostrazione stimatore di k

Prendiamo ora in esame il calcolo dello stimatore per k.

Anche qui la funzione di verosimiglianza si annulla per il limite di k0+ e k+, pertanto procediamo con il calcolo della derivata.

(k)k=k^=e1θxi(xi)k^1[ln(xi)θnk^Γn(k^)nln(θ)+ψ0(k^)θnk^Γn(k^)]=e1θxi(xi)k^1θnk^Γn(k^)[ln(xiθ)nψ0(k^)].

Con ψ0(k) indichiamo la funzione digamma così definita:

ψ0(x):=Γ(x)Γ(x)=ddxlnΓ(x),

che può essere espressa mediante una relazione integrale

ψ0(x)=0et(1+t)xtdt.

Eguagliando a zero la nostra funzione di verosimiglianza otteniamo il nostro punto di massimo

(k)k=k^=0ln(xiθ)nψ0(k^)=0ψ0(k^)=ln(xiθn)

La funzione digamma, nei reali positivi è strettamente crescente, per cui esiste la funzione inversa

k^=ψ01[ln(i=1nxiθn)]=ψ01[1ni=1nln(xiθ)].

Questo stimatore ottenuto è asintoticamente corretto, ma per valori finiti andrebbe verificato il suo valore atteso che, se risultasse essere k, allora sarebbe un corretto stimatore.

Calcoliamo quindi

𝔼[ψ0(k^)]=𝔼[1ni=1nln(xiθ)]=1ni=1n𝔼[ln(xiθ)]=1ni=1n0ln(xiθ)xik1θkΓ(k)exiθdxi,

dove abbiamo usato la linearità del valore atteso e scritto la sua definizione su variabile aleatoria continua.

𝔼[ψ0(k^)]=1nθkΓ(k)i=1n0ln(xiθ)xik1exiθdxi=1θkΓ(k)0ln(tθ)tk1etθdt

Tutti gli integrali nella i-esima variabile sono uguali tra di loro, quindi la loro somma dà n volte il singolo integrale nella generica variabile di integrazione t.

𝔼[ψ0(k^)]=1θkΓ(k)0ln(tθ)tk1etθdt=θk1θk1Γ(k)0ln(u)uk1eudu=1Γ(k)0uk1ln(u)eudu

e il risultato di quest'ultimo integrale è proprio Γ(k)ψ0(k) per qualunque k con parte reale positiva. Abbiamo quindi ottenuto l'identità

𝔼[ψ0(k^)]=ψ0(k),

che non è sufficiente a dire che lo stimatore sia corretto (non solo asintoticamente), ma è tuttavia necessario.

In effetti dalla disuguaglianza di Jensen (secondo cui φ(𝔼[X])𝔼[φ(X)] per una qualunque variabile aleatoria X e una funzione convessa φ) si ottiene un risultato più forte grazie al fatto che la funzione ψ01:+ è convessa su tutto il suo dominio.

Infatti usando la disuguaglianza di Jensen per X=ψ0(k^) e φ=ψ01 risulterà

ψ01(𝔼[ψ0(k^)])𝔼[ψ01(ψ0(k^))]=𝔼[k^].

Dall'uguaglianza ottenuta in precedenza il membro di sinistra si semplifica così da avere:

k𝔼[k^].

Voci correlate

Altri progetti

Template:Interprogetto

Collegamenti esterni

Template:Probabilità Template:Controllo di autorità Template:Portale