Legge dei grandi numeri

Da testwiki.
Vai alla navigazione Vai alla ricerca

Template:F

Legge dei grandi numeri
Legge dei grandi numeri

La legge dei grandi numeri, detta anche teorema di Bernoulli (in quanto la sua prima formulazione è dovuta a Jakob Bernoulli), descrive il comportamento della media di una sequenza di n prove di una variabile casuale, indipendenti e caratterizzate dalla stessa distribuzione di probabilità (n misure della stessa grandezza, n lanci della stessa moneta, ecc.), al tendere a infinito della numerosità n della sequenza stessa.

Secondo la legge dei grandi numeri è ragionevolmente sicuro che la media, che determiniamo a partire da un numero sufficiente di campioni, sia sufficientemente vicina alla media vera, ovvero quella calcolabile teoricamente. Che cosa significhi "ragionevolmente sicuri" dipende da quanto vogliamo essere precisi nel nostro test: con dieci prove, avremmo una stima grossolana, con cento, ne otterremmo una molto più precisa, con mille, ancora di più, e così via: il valore di n che siamo disposti ad accettare come sufficiente dipende dal grado di casualità che riteniamo necessario per il dato in questione.

In termini generici, per la legge dei grandi numeri si può dire:

  • che la media della sequenza è un'approssimazione, che migliora al crescere di n, della media della distribuzione, e
  • che, viceversa, si può prevedere che sequenze siffatte mostreranno una media tanto più spesso e tanto più precisamente prossima alla media della distribuzione quanto più grande sarà n.

Un caso particolare di applicazione della legge dei grandi numeri è la previsione probabilistica della proporzione di successi in una successione di n realizzazioni indipendenti di un evento E, ossia la frequenza di E nelle n misurazioni: per n che tende a infinito, la proporzione di successi converge alla probabilità di E.

Unita a questa si ha un'altra nozione interessante, ossia la legge dei piccoli numeri, che va al di là del concetto di equiprobabilità e considera la dimensione del campione rispetto ai possibili eventi e conseguenti esiti. In particolare, a seguito di esperimenti ripetuti considerando un campione più piccolo, è molto più semplice allontanarsi dal valore atteso, banalmente perché avendo meno valori da considerare vi è più probabilità che essa si approssimi a un certo valore, sottostimando il numero di campioni per stime accurate. Essa fu teorizzata da Kahneman.[1]

Legge forte dei grandi numeri

Se, data una successione di variabili casuali X1,X2,,Xn, indipendenti e identicamente distribuite con media (finita) μ, si considera la media campionaria

X¯n=X1+X2++Xnn

la legge (forte) dei grandi numeri afferma che

P(limnX¯n=μ)=1,

ossia lo stimatore media campionaria converge quasi certamente al valore atteso comune delle Xi.

Legge debole dei grandi numeri

Se, data una successione di variabili casuali X1,X2,,Xn, aventi la stessa media μ, la stessa varianza finita e indipendenti, si considera la media campionaria

X¯n=X1+X2++Xnn

la legge (debole) dei grandi numeri afferma che per ogni  ε>0:

limnP(|X¯nμ|<ε)=1.

ossia la media campionaria converge in probabilità al valore atteso comune alle Xi.

Con maggior rigore

Sia {(Ωi,𝒜i,Pi)}i una successione di spazi di probabilità. Si consideri lo spazio prodotto (Ω,𝒜,P) e in esso una successione bernoulliana di eventi (stocasticamente indipendenti e con probabilità costante p) {Ek}k𝒜. Assegnato un elemento ωΩ si definisce la frequenza di successo in n prove ϕn(ω)=Nnn, dove ϕn:Ω e Nn=#{i:ωEi}i=1n indica il numero di successi ottenuti in n prove.

Dimostrazione della legge debole dei grandi numeri

Nelle condizioni sopra enunciate, si vuole dimostrare che:

ε0+,limnP{ωΩ:|ϕn(ω)p|>ε}=0.

Fissato ε, si consideri la disuguaglianza di Bienaymé-Čebyšëv:

P{ωΩ:|ϕn(ω)E(ϕn)|>ε}var(ϕn)ε2 ;

poiché Nn è distribuito in modo binomiale, il suo valore atteso è

E(Nn)=np,

e la sua varianza è

var(Nn)=np(1p);

abbiamo allora che il valore atteso e la varianza di ϕn sono, rispettivamente:

E(ϕn)=E(Nnn)=E(Nn)n=p,
var(ϕn)=var(Nnn)=var(Nn)n2=p(1p)n.

Sostituendo nella disuguaglianza, si ottiene:

P{ωΩ:|ϕn(ω)p|>ε}p(1p)nε2,

e, passando al limite per n+,

limnP{ωΩ:|ϕn(ω)p|>ε}0.

Ma la probabilità non può essere negativa:

P:𝒜[0,1],

da cui la tesi.

Osservazioni

La legge debole dei grandi numeri non assicura che, comunque scelto ε>0, quasi certamente a partire da un certo nε il valore |ϕnp| si mantenga minore o uguale a ε, ossia che l'insieme

{ωΩ:nε:n>nε,|ϕn(ω)p|>ε}

sia P-trascurabile. Infatti, esplicitando la definizione di limite, si trova:

ε>0,η>0,nε,η:nnε,η,P{ωΩ:|ϕn(ω)p|>ε}η,

ma niente sembra assicurare che nε,η non diverga per η0.

Dimostrazione della legge forte dei grandi numeri

Ciò è invece assicurato, nelle medesime condizioni, dalla proposizione:

P{ωΩ:limnϕn(ω)=p}=1,

che, in effetti, implica sia

ε0+,P{ωΩ:nε:n>nε,|ϕn(ω)p|>ε}=0

sia la legge debole dei grandi numeri.

Dimostrazione delle due implicazioni

La legge forte può essere formulata, esplicitando la definizione di limite e passando al complementare, come:

P{ωΩ:ε0+:nε,n>nε:|ϕn(ω)p|>ε}=0

che a sua volta è equivalente, trasformando il quantificatore esistenziale in un'unione, a:

P(ε0+{ωΩ:nε,n>nε:|ϕn(ω)p|>ε})=0

e per monotonia di P

ε0+,P{ωΩ:nε:n>nε,|ϕn(ω)p|>ε}
P(ε0+{ωΩ:nε,n>nε:|ϕn(ω)p|>ε})

da cui, per confronto, la prima implicazione. Trasformando anche gli altri due quantificatori in operazioni insiemistiche, si ha:

0=P{ωΩ:nε:n>nε,|ϕn(ω)p|>ε}=
=P(nεn>nε{ωΩ:|ϕn(ω)p|>ε})=

ma, si è in presenza dell'intersezione di una successione non crescente di insiemi, dunque per monotonia di P, si ha:

=limnεP(n>nε{ωΩ:|ϕn(ω)p|>ε})

e ancora:

limn{ωΩ:|ϕn(ω)p|>ε}

da cui anche la seconda implicazione, ricordando che questo è valido per ogni ε.

Dimostrazione della legge forte

Si è già visto che l'asserto è equivalente a:

P(ε0+{ωΩ:nε,n>nε:|ϕn(ω)p|>ε})=0

Discretizzando, come consueto nel caso dei limiti, si ha:

P(k0{ωΩ:nk,n>nk:|ϕn(ω)p|>1k})=0

Per subadditività

P(k0{ωΩ:nk,n>nk:|ϕn(ω)p|>1k})
k0P{ωΩ:nk,n>nε:|ϕn(ω)p|>1k}

Dunque, se quest'ultima espressione sarà nulla, si sarà dimostrata la legge forte. Essendo P non negativa, si dovrà avere:

k0,P(lim supn{ωΩ:|ϕn(ω)p|>1k})=0

si vuole mostrare che questo è vero considerando la sottosuccessione ϕn2. Si vuole applicare il lemma di Borel-Cantelli, pertanto si verifica che converga l'espressione

n=1P{ωΩ:|ϕn2(ω)p|>1k}

Per la disuguaglianza di Bienaymé-Čebyšëv si trova:

k,n,P{ωΩ:|ϕn2(ω)p|>1k}var(ϕn2)k2=k2p(1p)n2

da cui:

n=1P{ωΩ:|ϕn2(ω)p|>1k}p(1p)k2n=11n2

Ma questa serie è notoriamente convergente. Pertanto,

k0,P(lim supn{ωΩ:|ϕn2(ω)p|>1k})=0

Si noti ora che ogni numero naturale n è compreso tra due quadrati consecutivi:

n,q:q2n<(q+1)2

da cui

Nn(q+1)2ϕnNnq2

si noti ora che nq2 è la massima differenza possibile tra Nq2 e Nn, da cui:

Nq2NnNq2+(nq2)

pertanto:

Nq2(q+1)2Nn(q+1)2ϕnNnq2Nq2+(nq2)q2

ora però si ha nq2(q+1)2q2, dunque:

Nq2q2q2(q+1)2ϕnNq2q2+(q+1)2q2q2

passando al limite (nq) e applicando il risultato ottenuto per ϕn2, si ottiene che, quasi certamente:

p1=plimqq2(q+1)2limnϕnp+limqq2+2q+1q2q2=p+0

il che conclude la dimostrazione.

Note

Voci correlate

Altri progetti

Template:Interprogetto

Collegamenti esterni

Template:Controllo di autorità Template:Portale