Distribuzione di Pascal

Da testwiki.
Vai alla navigazione Vai alla ricerca

Template:F Template:Variabile casuale In teoria delle probabilità la distribuzione di Pascal è una distribuzione di probabilità discreta con due parametri, p ed n, che descrive il numero di fallimenti precedenti il successo n-esimo in un processo di Bernoulli di parametro p.

A volte si considera la distribuzione di Pascal come quella distribuzione che descrive il numero di prove necessarie per ottenere n successi. Questa distribuzione è equivalente alla precedente ma riscalata, ovvero descrive una variabile aleatoria Tn+n anziché Tn.

Ad esempio, lanciando una moneta fino ad ottenere 3 volte testa, la distribuzione di Pascal descrive le probabilità per il numero di risultati croce visti nel frattempo.

La distribuzione prende il nome dal matematico francese Blaise Pascal.

Questa distribuzione di probabilità può essere generalizzata sostituendo il numero naturale n con un numero reale positivo r. In questo caso viene detta anche distribuzione binomiale negativa (per la sua particolare formula) o di Polya (dal matematico ungherese George Polya).

Definizione

Dato un processo di Bernoulli, ovvero una serie di variabili aleatorie indipendenti X1,X2,... di uguale distribuzione di Bernoulli (p), la distribuzione di Pascal 𝒩(p,n)descrive la variabile aleatoria Tn che conta il numero di fallimenti precedenti il successo numero n (ovvero il numero di prove necessarie ad ottenerlo, meno n):

Tn=min{t:X1+...+Xt+n=n},
Tn+n=min{t:X1+...+Xt=n}.

La probabilità di fallimento di una singola prova è q=1p. La probabilità che si verifichino esattamente k fallimenti prima di ottenere un totale di n successi è data dalla probabilità di ottenere un successo nella prova numero k+n (Xk+n=1) e di ottenere esattamente k fallimenti e n-1 successi nelle prove precedenti, ovvero

P(k)=(k+n1k)pnqk

dove il coefficiente binomiale conta il numero di possibili combinazioni di successi e fallimenti. Questa probabilità può anche essere scritta nella forma binomiale negativa

P(k)=(nk)pn(q)k

dove si considera la generalizzazione del coefficiente binomiale

(nk)=(n)(n1)(nk+1)k!=(1)k(n+k1k).

Definizioni alternative

Sostituendo il numero naturale n con il numero reale positivo r la formula mantiene un significato, anche se il coefficiente binomiale può essere espresso tramite la funzione Gamma, che estende il concetto di fattoriale (Γ(n+1)=n!):

(k+r1k)prqk=r(r+1)(k+r1)k!prqk=Γ(k+r)k!Γ(r)prqk.

Alcuni testi definiscono la distribuzione di Pascal come quella che descrive il numero di prove fino al successo n-esimo, ed altri scambiano i termini successo ed insuccesso nella definizione. Per collegare queste definizioni basta rispettivamente considerare la variabile aleatoria Tn+n al posto di Tn nel primo caso e scambiare i valori di p e q nell'altro.

Distribuzione geometrica

Una variabile aleatoria Tn con distribuzione di Pascal 𝒩(p,n) è pari alla somma Y1+...+Yn di n variabili aleatorie indipendenti con uguale distribuzione geometrica 𝒢(p)1, poiché a differenza della distribuzione geometrica che rappresenta il numero totale di tentativi necessari per ottenere un successo, una variabile binomiale negativa descrive i fallimenti, quindi il numero di tentativi - 1, ovvero il successo. Questo si può vedere considerando come Yi la variabile aleatoria che conta il numero di fallimenti intercorsi tra il successo numero i1 e il successo numero i: le Y1,...,Yn sono allora indipendenti ed hanno distribuzione geometrica di parametro p sottratto di uno perché la distribuzione geometrica conta il numero di prove per ottenere un successo che corrispondono al numero di fallimenti e la prova finale del successo. In particolare, la distribuzione di Pascal 𝒩(p,1) coincide con la distribuzione geometrica 𝒢(p)1, e la somma di m variabili aleatorie indipendenti con distribuzioni di Pascal aventi lo stesso parametro p segue ancora la distribuzione di Pascal con parametro p (è sempre somma di variabili aleatorie indipendenti con uguale distribuzione geometrica).

Caratteristiche

Alcune caratteristiche di una variabile aleatoria Tn che segue la distribuzione di Pascal 𝒩(p,n) si possono ricavare dalle caratteristiche di una variabile aleatoria T con distribuzione geometrica 𝒢(p)1:

E[Tn]=nE[T]=np,

Var(Tn)=nVar(T)=nqp2,
gTn(t)=gT(t)n=(p1qet)n,
γ1=1n1+qq,γ2=1n(6+p2q).

La funzione di ripartizione può essere definita tramite la funzione Beta incompleta regolarizzata:

P(Tnk)=Ip(n,k+1)

Tutte le formule valgono ancora anche sostituendo il numero naturale n con il numero reale positivo r.

Altre distribuzioni

La distribuzione di Pascal è una mistura della distribuzione Gamma e della distribuzione di Poisson: una variabile aleatoria con distribuzione di Poisson 𝒫(L), il cui parametro L segua una distribuzione Gamma, segue la distribuzione di Pascal.

La distribuzione di Pascal 𝒩(rλr,r) di speranza λ, per r+ converge alla distribuzione di Poisson 𝒫(λ).

La distribuzione di Pascal si trova anche come mistura della distribuzione di Poisson e della distribuzione logaritmica, ovvero descrive la somma X1+...+XN di un numero N, che segue la distribuzione di Poisson, di variabili aleatorie indipendenti che seguono una stessa distribuzione logaritmica.

Considerando le variabili aleatorie Sn=X1+...+Xn di distribuzione binomiale (p,n) e le variabili aleatorie Tn=min{k:X1+...+Xk+n=n}=min{k:Sk+n=n} di distribuzione di Pascal 𝒩(p,n) si trova la formula

P(Tnk)=P(Tn+nn+k)=P(Sn+kn),

che esprime per un processo di Bernoulli l'equivalenza degli eventi "ottenere meno di k insuccessi prima del successo n-esimo" e "ottenere almeno n successi nelle prime n+k prove".

La distribuzione di Panjer, che definisce i valori per ricorsione, generalizza la distribuzione di Pascal:

P(k)=(q+q(n1)k)P(k1)

Statistica

La distribuzione di Pascal viene talvolta utilizzata in alternativa alla distribuzione di Poisson, a cui converge in legge sotto la condizione λ=rqp, nei casi in cui il modello empirico presenti una varianza maggiore del valore medio: la distribuzione di Poisson ha sempre speranza pari al valore medio, mentre la distribuzione di Pascal è più dispersa (ha una varianza maggiore).

Come spesso avviene nell'inferenza bayesiana, se il parametro p di una distribuzione di Pascal segue a priori la distribuzione Beta, allora la segue anche a posteriori.

Voci correlate

Altri progetti

Template:Interprogetto

Collegamenti esterni

Template:Probabilità Template:Portale