Disuguaglianza di Čebyšëv

Da testwiki.
Vai alla navigazione Vai alla ricerca

Template:Nota disambigua La disuguaglianza di Čebyšëv è usata soprattutto nell'ambito della teoria probabilistica e più raramente nell'ambito di serie di dati reali. Spesso la disuguaglianza di Čebyšëv viene indicata come disuguaglianza di Markov, di cui è un corollario.

La disuguaglianza venne pubblicata la prima volta nel 1853 da Irénée-Jules Bienaymé e riscoperta indipendentemente da Pafnutij L'vovič Čebyšëv alcuni anni dopo (pertanto viene anche citata come disuguaglianza di Bienaymé-Čebyšëv).

Descrizione

Nell'ambito delle variabili casuali (v.c.) essa afferma che se la v.c. X ha valore atteso μ e la varianza σ2 e λ è un numero reale positivo, allora la probabilità che X assuma un valore compreso tra μλσ e μ+λσ è maggiore di 11/λ2.

In altre parole afferma che, dato un carattere di cui sono noti solamente media aritmetica μ e deviazione standard σ, possiamo conoscere la probabilità che una variabile casuale possa avere valori esterni a un intervallo simmetrico rispetto alla media aritmetica. In altri termini questo teorema ci assicura che, indipendentemente dalla distribuzione della variabile casuale, la probabilità che questa assuma valori distanti dalla media più di λ volte la deviazione standard è al massimo 1/λ2

Otteniamo quindi il limite inferiore della probabilità di Pr(|Xμ|λσ) espresso con la formula:

Pr(|Xμ|λσ) 11λ2

cioè:

Pr(μλσXμ+λσ) 11λ2

da cui si può ottenere anche il limite superiore della probabilità di Pr(|Xμ|λσ) espresso come:[1]

1Pr(|Xμ|λσ) 1λ2

che equivale a scrivere:

Pr(|Xμ|λσ) 1λ2

cioè:

Pr(Xμλσ  Xμ+λσ)1λ2

Nell'ambito della statistica descrittiva essa afferma che l'intervallo di valori compreso tra μλσ e μ+λσ ha un livello di confidenza di almeno (11/λ2). Fisz dimostrò che per le variabili dotate di media e varianza non è possibile trovare una disuguaglianza migliore di quella di Čebyšëv, a meno che non si impongano dei vincoli alla distribuzione della variabile.

Da questa disuguaglianza si deduce che

  • almeno il 75% dei valori sono compresi tra μ2σ e μ+2σ
  • almeno l'89% dei valori sono compresi tra μ3σ e μ+3σ
  • almeno il 94% dei valori sono compresi tra μ4σ e μ+4σ
  • almeno il 96% dei valori sono compresi tra μ5σ e μ+5σ
  • almeno il 99% dei valori sono compresi tra μ10σ e μ+10σ

indipendentemente da come sono distribuiti i valori.

Dimostrazione probabilistica

Per ogni evento A, sia IA la variabile casuale indicatore di A, cioè IA è uguale a 1 se l'evento A accade e 0 altrimenti. Allora si ha:

Pr(|Xμ|λσ)=E(I|Xμ|λσ)=E(I(Xμ)2(λσ)2)=Pr((Xμ)2(λσ)2)

Dalla disuguaglianza di Markov segue poi:

Pr((Xμ)2(λσ)2)E((Xμ)2)(λσ)2

Si ha quindi:

Pr(|Xμ|λσ)1λ2E((Xμ)2)σ2=1λ2

Note

  1. Si ha infatti:
    Pr(μλσXμ+λσ)=Pr(λσXμ+λσ)=Pr(|Xμ|λσ)
    e:
    Pr(|Xμ|λσ) 11λ2
    da cui:
    1Pr(|Xμ|λσ) 1λ2

Bibliografia

  • A. Papoulis (1991), Probability, Random Variables, and Stochastic Processes, 3rd ed. McGraw-Hill. ISBN 0-07-100870-5. pp. 113–114.
  • G. Grimmett and D. Stirzaker (2001), Probability and Random Processes, 3rd ed. Oxford. ISBN 0-19-857222-0. Section 7.3.

Voci correlate

Altri progetti

Template:Interprogetto

Collegamenti esterni

Template:Probabilità Template:Portale