Bootstrap (statistica)

Da testwiki.
Vai alla navigazione Vai alla ricerca

Template:F Il bootstrap è una tecnica statistica di ricampionamento con reimmissione per approssimare la distribuzione campionaria di una statistica. Permette di approssimare media e varianza di uno stimatore, costruire intervalli di confidenza e calcolare p-value di test quando, in particolare, non si conosce la distribuzione della statistica di interesse.

Nel caso di campionamento casuale semplice, il funzionamento è il seguente: consideriamo un campione effettivamente osservato di numerosità n, diciamo 𝐱=(x1,,xn). Da 𝐱 si ricampionano B altri campioni di numerosità costante n, diciamo 𝐱1*,,𝐱B*. Se F è la funzione di ripartizione del fenomeno aleatorio dal quale è stato campionato x, allora la funzione di ripartizione empirica F^ è un'approssimazione di F; per cui un ricampionamento da essa approssima un ricampionamento dal modello originale. Per costruzione F^ è la funzione di ripartizione di una variabile aleatoria uniforme su x, dunque di fatto ogni ricampionamento xk*, con k=1,,B, è ottenuto scegliendo in modo uniforme con ripetizione n valori da x.

Sia T lo stimatore di θ che ci interessa studiare, diciamo T(𝐱)=θ^. Si calcola tale quantità per ogni campione bootstrap, T(𝐱1*),,T(𝐱B*). In questo modo si hanno a disposizione B stime di θ, dalle quali è possibile calcolare la media bootstrap, la varianza bootstrap, i percentili bootstrap, ecc. che sono approssimazioni dei corrispondenti valori ignoti e portano informazioni sulla distribuzione di T(𝐱).

Algoritmo bootstrap (per campione semplice)

Dato il campione x=(x1,,xn):

  • Si simulano B campioni x1*,,xB*, di numerosità n da F^.
  • Si calcolano le B replicazioni corrispondenti ai campioni simulati: θ^(x1*),,θ^(xB*), dove θ^(xk*)=T(xk*).
  • Si stima la varianza campionaria come:
VarB(θ^)=1B1k=1B(θ^(xk*)θ*)2,dove θ*=1Bk=1Bθ^(xk*).
  • Si stima la distorsione come:
β=θ*θ=1Bk=1Bθ^(xk*)θ.

Partendo quindi da queste quantità stimate è possibile, anche lavorando in ambito non parametrico, calcolare intervalli di confidenza, saggiare ipotesi, ecc.

Bibliografia

  • Efron,Bradley e Tibshirani, Robert, An Introduction to the Bootstrap, New York, Chapman & Hall, 1994, ISBN 9781489945419

Voci correlate

Collegamenti esterni

Template:Controllo di autorità Template:Portale