Efficienza (statistica)

Da testwiki.
Versione del 24 ago 2020 alle 18:47 di imported>Botcrux (Bot: rimuovo {{controllo di autorità}} vuoto (ref))
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)
Vai alla navigazione Vai alla ricerca

In statistica, l'efficienza è una misura di desiderabilità di uno stimatore. L'efficienza di una statistica corretta  T per un parametro  ϑ è definita come:

 e(T)=1/(ϑ)var(T)

dove  (ϑ) è l'informazione di Fisher del campione;  e(T) è uguale al rapporto tra la minima varianza possibile per uno stimatore di  ϑ e la sua varianza effettiva. La disuguaglianza di Cramér-Rao implica che  e(T)1.

Stimatore efficiente

Se uno stimatore di un parametro ϑΘ è tale che  e(T)=1 per tutti i possibili valori del parametro, lo stimatore si dice efficiente (in senso assoluto). In termini equivalenti, uno stimatore è detto efficiente (in senso assoluto) se la sua varianza raggiunge il limite inferiore di Cramér-Rao   ϑΘ.

Se uno stimatore efficiente (in senso assoluto) è anche corretto, esso è uno stimatore MVUE, o stimatore corretto di varianza minima (dall'inglese Minimum Variance Unbiased Estimator). Questo perché, chiaramente, nessuno stimatore corretto alternativo potrà essere caratterizzato da una varianza minore. È interessante osservare che, per contro, uno stimatore corretto di varianza minima (MVUE) non è necessariamente efficiente in senso assoluto: potrebbe infatti esistere uno stimatore distorto la cui varianza raggiunge il limite inferiore di Cramér-Rao.

Efficienza asintotica

Alcuni stimatori conseguono l'efficienza in senso assoluto soltanto asintoticamente, ossia se la dimensione del campione di cui sono funzione tende all'infinito. Si parla in tal caso di stimatori asintoticamente efficienti. Questo è il caso, ad esempio, degli stimatori di massima verosimiglianza.

Esempi

Si consideri un campione di dimensione  n estratto da una popolazione normale con valore atteso  μ e varianza unitaria (ossia, xi𝒩(μ,1), i=1,,n).

La media campionaria x del campione x1,x2,,xi, definita come:

x=1ni=1nxi

ha varianza pari a  1n. Questo valore è uguale al reciproco dell'informazione di Fisher del campione, e dunque, per la disuguaglianza di Cramér-Rao, la media campionaria è uno stimatore efficiente in senso assoluto.

Si consideri ora la mediana campionaria; essa è uno stimatore distorto, ma consistente per  μ. In particolare, per  n la mediana campionaria ha distribuzione approssimativamente normale, con valore atteso  μ e varianza  π2n. La sua efficienza è dunque all'incirca 0.64. Si osservi inoltre che questa è una misura dell'efficienza asintotica; in campioni ridotti (valori finiti di  n) l'efficienza è in effetti maggiore (ad esempio, per  n=3 si ha un'efficienza di circa 0.74). Si osservi inoltre che in certe applicazioni la mediana è preferita alla media, sulla base che la sua maggiore robustezza (minore sensibilità alla presenza di valori anomali nel campione) compenserebbe la minore efficienza.

Efficienza relativa

Si considerino due statistiche campionarie,  T1 e  T2, stimatori per il parametro  ϑ; il senso comune suggerisce che  T1 è «più efficiente» di  T2 se:

  1. il suo errore quadratico medio (o MSE, dall'inglese Mean Squared Error) non eccede quello di  T2 per ogni possibile valore assunto da  ϑΘ;
  2. lo MSE è minore per almeno un valore di  ϑΘ.

Formalmente,

E[(T1ϑ)2]E[(T2ϑ)2]

  ϑΘ, ed   ϑ0Θ tale che valga la disuguaglianza stretta.

L'efficienza relativa di  T1 rispetto a  T2 è allora definita da:

e(T1,T2,ϑ)=E[(T1ϑ)2]E[(T2ϑ)2]

Sebbene e() sia in generale una funzione di ϑ, spesso ciò non è verificato; in tal caso, un valore di e() minore di 1 indicherebbe che lo stimatore  T1 è preferibile (più efficiente), a prescindere dal vero valore di  ϑ.

Voci correlate

Template:Portale