Variabili strumentali

Da testwiki.
Versione del 18 giu 2024 alle 16:14 di 193.50.54.1 (discussione) (Illustrazione del metodo)
(diff) ← Versione meno recente | Versione attuale (diff) | Versione più recente → (diff)
Vai alla navigazione Vai alla ricerca

In statistica, la stima con il metodo delle variabili strumentali è utilizzata nell'analisi di regressione lineare. Un'ipotesi standard del modello classico di regressione lineare è che le variabili esplicative non siano correlate con la componente non spiegata, o disturbo; laddove tale ipotesi viene meno, la regressione con il consueto metodo dei minimi quadrati non consentirà di ottenere stime consistenti (cioè asintoticamente corrette e con varianza asintoticamente nulla). Se tuttavia è disponibile una variabile strumentale, è ancora possibile ottenere stime consistenti.

Il metodo di stima di un modello lineare tramite variabili strumentali è anche noto come metodo dei minimi quadrati a due stadi (o 2SLS, dall'inglese Two-Stages Least Squares).

Definizione

Illustrazione del modello generale di regressione con variabili strumentali e la sua terminologia:[1]

Yi=β0+β1X1i+β2X2i++βkXki+βk+rWri+Z1i,Z2i+ui

dove:

i varia tra le osservazioni, i = 1, ...., n;
Yi è variabile dipendente;
X1i,X2i++Xki sono k regressori endogeni potenzialmente correlati con ui;
W1i,W2i++Wri sono r regressori esogeni inclusi incorrelati con ui;
β0+β1x1i+β2x2i+βkxki è la retta di regressione;
β0,β1βk+1 sono coefficienti di regressione ignoti;
Z1i,Z2iZmi sono m variabili strumentali;
ui è l'errore statistico.

Vengono stimati col Metodo dei minimi quadrati a due stadi.

Validità degli strumenti

Un insieme di strumenti Z1i,Z2iZmi deve soddisfare due condizioni per essere valido:

  • Rilevanza: lo strumento è correlato con la X. Cor[Zi,Xi]0
  • Esogeneità: la parte della variazione di Xi, catturata dalla variabile strumentale è esogena. E[ui|Zi]=0

Illustrazione del metodo

Si consideri il modello di regressione lineare:

 yi=xiβ+εi, i=1,,N

Nel modello classico di regressione si ipotizza che le variabili esplicative  xi non presentino correlazione con i disturbi  εi,  E[xiεi]=0. Il metodo dei minimi quadrati ottiene lo stimatore per il parametro  β come soluzione all'equazione:

 ixi(yixiβ)=0

Ciò conduce allo stimatore (dei minimi quadrati ordinari, in inglese Ordinary Least Squares, o OLS):

 β^OLS=ixiyiixi2=ixi(xiβ+εi)ixi2=β+ixiεiixi2

Poiché  xi e  εi sono incorrelati, passando al limite per  N il secondo termine nell'espressione sopra converge a zero in probabilità, così che la stima  β^ è consistente.

Quando l'ipotesi standard viene meno, tuttavia, lo stimatore dei minimi quadrati non è più consistente. Può in tal caso essere utile considerare una variabile strumentale  zi,  i=1,,N, non correlata con il disturbo  εi (e, idealmente, correlata con la variabile esplicativa  xi). Grazie ad essa è possibile impostare uno stimatore tramite il metodo dei momenti, tale da soddisfare la condizione:

 izi(yixiβ)=0

Dalla condizione sopra discende lo stimatore (delle variabili strumentali, in inglese Instrumental Variables, o IV):

 β^IV=iziyiizixi=izi(xiβ+εi)izixi=β+iziεiizixi

Poiché  zi e  εi non presentano correlazione, lo stimatore  β^IV godrà della proprietà di consistenza. Può essere interessante osservare che tale stimatore costituisce un caso più generale di quello ottenuto con il metodo dei minimi quadrati: in altre parole, tale metodo può essere pensato come una stima tramite variabili strumentali, in cui le stesse variabili esplicative ( xi nella notazione sopra adottata) sono utilizzate come variabili strumentali.

Il caso multivariato

La procedura descritta sopra è immediatamente adattabile al caso multivariato. Si consideri una matrice X di N osservazioni di K regressori, e una matrice Z di N osservazioni di P variabili strumentali, tale che:

y=Xβ+ε,E[Xε]0

dove I denota la matrice identità di dimensione N, e:

 X=ZΓ+u,E[u]=0,E[Zε]=0

Si può allora scrivere:

Γ^=(ZZ)1ZX
X^=ZΓ^=Z(ZZ)1ZX
β^IV=(X^X^)1X^y=β+(XZ(ZZ)1ZX)1XZ(ZZ)1Zε

Applicazione del metodo

La correlazione tra regressori e disturbi in un modello di regressione lineare può insorgere in una serie di circostanze. Alcuni casi notevoli, generalmente menzionati in letteratura, sono:

  • Omissione di variabili rilevanti, se il modello di regressione (multivariata) non include tra i regressori una variabile, che pure avrebbe rilevante potere esplicativo nei confronti della variabile dipendente;
  • Errore nelle variabili esplicative, laddove i dati relativi a uno o più regressori sono affetti da un errore di misura, distinto dal disturbo  εi;
  • Equazioni simultanee, nei casi in cui il sistema oggetto di analisi mette insieme diversi modelli statistici che operano simultaneamente.

Il metodo delle variabili strumentali è spesso applicato con una procedura di stima con i minimi quadrati a due stadi (in inglese, Two-Stages Least Squares, o 2SLS). Nell'approccio 2SLS, in un primo stadio di stima i regressori ( xi nella notazione sopra) sono regrediti sulle variabili strumentali ( zi), ottenendo dei valori di previsione di primo stadio  x^i. Nel secondo stadio, la variabile dipendente ( yi) è regredita sui valori di previsione di primo stadio  x^i, ottenendo le stime  β^IV.

Per le sue caratteristiche, il metodo delle variabili strumentali è soggetto a problemi legati alla scelta delle variabili strumentali stesse. Al di là dei requisiti formali per il funzionamento del metodo (assenza di correlazione con i disturbi), queste ultime potranno essere individuate mediante considerazioni strettamente relative al problema oggetto di analisi statistica. Modifiche esogene di una data politica (ad es., cancellazione di un programma di borse di studio), differenze geografiche nell'applicazione di dati standard (ad es., differenze di risultati necessari per il superamento di un dato esame in diversi stati), o mera casualità potranno definire delle opportune variabili strumentali.

Note

Bibliografia

  • Greene, W.H. (2000), Econometric Analysis, Prentice-Hall, ISBN 0-13-013297-7, analizza nel dettaglio il modello classico di regressione lineare nel caso multivariato, con particolare riferimento alle sue applicazioni nell'ambito dell'econometria, disciplina per cui rappresenta il testo di livello universitario/master di riferimento (in inglese); il metodo delle variabili strumentali è trattato nel Capitolo 9.
  • Wooldridge, J.M. (2002), Econometric Analysis of Cross Section and Panel Data, MIT Press, ISBN 0-262-23219-7, tratta in maniera più approfondita la stima tramite variabili strumentali, nel caso di modelli ad una singola equazione (capitolo 5) e di modelli di equazioni simultanee (capitolo 8); si tratta di un testo di riferimento per studi a livello di dottorato (in inglese).

Voci correlate

Template:Statistica Template:Controllo di autorità Template:Portale