Distribuzione geometrica

Da testwiki.
Versione del 24 gen 2024 alle 12:17 di imported>Mat4free (Annullata la modifica 137504431 di 151.33.15.158 (discussione) era corretto prima)
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)
Vai alla navigazione Vai alla ricerca

Template:F Template:Variabile casuale In teoria della probabilità la distribuzione geometrica è una distribuzione di probabilità discreta sui numeri naturali senza l'elemento "0", che segue una progressione geometrica:

P(X=k)=p(1p)k1.

È la probabilità che il primo successo (o evento in generale) richieda l'esecuzione di k prove indipendenti, ognuna con probabilità di successo p. Se la probabilità di successo in ogni prova è p, allora la probabilità che alla k-esima prova si ottenga il primo successo è

P(X=k)=p(1p)k1,

con k = 1, 2, 3, …

La formula qui sopra è usata, dunque, per calcolare la probabilità di fare un certo numero k di tentativi fino ad ottenere il primo successo (al k-esimo tentativo). Qui sotto invece, la seguente distribuzione esprime la probabilità di avere k fallimenti prima di ottenere il primo successo:

P(Y=k)=p(1p)k,

per k = 0, 1, 2, 3, …

In entrambi i casi, la successione di probabilità è una serie geometrica.

Definizione

La distribuzione geometrica 𝒢(p) è la distribuzione di probabilità sui numeri naturali della forma

P(k)=pqk1, con q=1p,

dove q indica la probabilità di insuccesso. Il parametro q=1p si ricava da

1=P(+)=k0pqk=p11q.

E ricordando la definizione di q si ottiene 1. Questo risultato è di fondamentale importanza: significa che per quanto sia piccola la probabilità che un evento accada, in un processo di Bernoulli questo prima o poi accadrà (questo si ricollega al teorema della scimmia instancabile).

Se la variabile casuale X ha la distribuzione geometrica sopra descritta riguardante il numero di estrazioni necessarie per ottenere il primo successo, cioè X è distribuita secondo P(k)=pqk1 , allora la distribuzione della variabile casuale Y=X1 sarà P(k)=pqk . Nell'esempio citato sopra, X è il numero di estrazioni da fare perché esca un numero fissato (alla X-esima estrazione), mentre Y è il numero di fallimenti prima di avere il primo successo.

Processo di Bernoulli

La distribuzione geometrica di parametro q descrive anche il numero Y di fallimenti che precedono il primo successo in un processo di Bernoulli {Xi}i di parametro p=1q:

P(T=k)=P(X1=0)P(Xk=0)P(Xk+1=1)=qkp.

Caratteristiche

Una variabile aleatoria T con distribuzione geometrica di parametro q e avente come supporto i numeri naturali escluso il numero 0 ha

P(T=k)=pqk1
P(Tk)=1P(Tk+1)=1qk
E[T]=kkpqk1=1p
Var(T) = E[T2]E[T]2 = qp2

I quantili si ricavano dalla funzione di ripartizione:

  • se n=logq(1α) è un numero intero (q=1αn) allora F(n1)=α e qα[n1,n];
  • se invece logq(1α) non è intero, allora qα=[logq(1α)] (parte intera).

In particolare la mediana è

q1/2[n1,n] se q=12n con n intero,
q1/2=[logq12] altrimenti.

Assenza di memoria

La distribuzione geometrica è priva di memoria, ossia

P(T=m+n|T>m)=P(T=n),

ed è l'unica distribuzione di probabilità discreta con questa proprietà.

L'indipendenza delle prove in un processo di Bernoulli implica l'assenza di memoria della distribuzione geometrica. D'altro canto, ogni variabile aleatoria T a supporto sui numeri naturali e priva di memoria rispetta

P(T=n)=P(T=n+1|T>1)=P(T=n+1)P(T>1),

pertanto ha una distribuzione di probabilità geometrica di parametro P(T=1).

Generalizzazioni

Una generalizzazione della distribuzione geometrica è la distribuzione di Pascal (o distribuzione binomiale negativa), che descrive il numero di fallimenti precedenti il successo r-esimo in un processo di Bernoulli.

Un'ulteriore generalizzazione della distribuzione di Pascal è la distribuzione di Panjer che, come la distribuzione geometrica, definisce le probabilità per ricorsione.

Esempi

La probabilità che un dado (equilibrato, a 6 facce) debba venire lanciato esattamente 10 volte prima di fornire un "4" è data dalla distribuzione geometrica. Il lancio del dado può essere considerato un processo di Bernoulli, in cui ogni prova Xi ha probabilità p=1/6 di fornire "4" (successo) e q=5/6 di fornire un altro numero (fallimento). La probabilità cercata è quindi

P(T=10)=16(56)9=0,032

La probabilità che dopo 10 lanci sia uscito almeno un "4" è invece

P(T10)=1(56)10=0,838

La probabilità che al decimo lancio si ottenga un "4" dopo che per 9 lanci questo numero non è mai stato ottenuto è facilmente calcolabile grazie alla mancanza di memoria

P(T=10|T>9)=P(T=1)=16=0,166

Voci correlate

Altri progetti

Template:Interprogetto

Collegamenti esterni

Template:Probabilità Template:Portale